Google AI lança DataGemma: uma coleção de modelos abertos usando o Data Commons por meio de Retrieval Interleaved Generation (RIG) e Retrieval Augmented Generation (RAG)
Inteligência artificial

Google AI lança DataGemma: uma coleção de modelos abertos usando o Data Commons por meio de Retrieval Interleaved Generation (RIG) e Retrieval Augmented Generation (RAG)


O Google introduziu um novo método chamado DataGemmaprojetado para resolver um dos problemas mais importantes da inteligência artificial moderna: a detecção de modelos de linguagem em larga escala (LLMs). O engano ocorre quando a IA produz com segurança informações incorretas ou fabricadas. Estas imprecisões podem minar a eficácia da IA, especialmente na investigação, na elaboração de políticas ou noutros processos importantes de tomada de decisão. Em resposta, o DataGemma do Google pretende capacitar os LLMs com dados estatísticos do mundo real através dos extensos recursos disponíveis através do seu Data Commons.

Eles introduziram duas variantes projetadas para melhorar ainda mais o desempenho dos LLMs: DadosGemma-RAG-27B-IT de novo DadosGemma-RIG-27B-IT. Esses modelos representam desenvolvimentos de última geração nos métodos de geração aumentada de recuperação (RAG) e geração intercalada de recuperação (RIG). A variante RAG-27B-IT usa o extenso Data Commons do Google para integrar informações ricas e contextualizadas em seus resultados, tornando-o ideal para tarefas que exigem compreensão profunda e análise detalhada de dados complexos. Por outro lado, o modelo RIG-27B-IT concentra-se em combinar a recuperação em tempo real de fontes confiáveis ​​para verificar a veracidade e verificar informações estatísticas com poder, para garantir a precisão das respostas. Esses modelos são projetados para tarefas que exigem alta precisão e raciocínio, tornando-os adequados para pesquisa, formulação de políticas e domínios de análise de negócios.

A ascensão dos modelos de linguagem em larga escala e os problemas de visualização de suas ideias

Os LLMs, os motores por trás da IA ​​produtiva, estão se tornando cada vez mais sofisticados. Eles podem processar grandes quantidades de texto, criar resumos, sugerir resultados criativos e até mesmo redigir códigos. No entanto, uma das desvantagens mais importantes destes modelos é a sua tendência, por vezes, de apresentar informações incorretas como factos. Este fenómeno, conhecido como alucinação, levantou preocupações sobre a fiabilidade e validade do conteúdo gerado pela IA. Para enfrentar esses desafios, o Google empreendeu esforços de pesquisa significativos para reduzir falsos positivos. Esses desenvolvimentos culminam no lançamento do DataGemma, um modelo de código aberto projetado especificamente para alinhar LLMs ao vasto repositório de dados estatísticos do mundo real disponível no Data Commons do Google.

Data Commons: uma base para dados autênticos

Dados Comuns está no centro da missão da DataGemma, um repositório abrangente de pontos de dados confiáveis ​​e disponíveis publicamente. Este gráfico de informações contém mais de 240 bilhões de pontos de dados sobre todos os aspectos de muitas estatísticas retiradas de fontes confiáveis, como as Nações Unidas, a OMS, os Centros de Controle e Prevenção de Doenças e vários escritórios de censo nacionais. Ao agregar dados dessas organizações autorizadas em uma única plataforma, o Google capacita pesquisadores, formuladores de políticas e desenvolvedores com uma ferramenta poderosa para obter informações precisas.

A escala e a riqueza do Data Commons tornam-no um recurso valioso para qualquer modelo de IA que procure melhorar a precisão e a consistência dos seus resultados. O Data Commons cobre uma variedade de tópicos, desde saúde pública e economia até dados ambientais e tendências demográficas. Os utilizadores podem interagir com este grande conjunto de dados através de uma interface de linguagem natural, fazendo perguntas como a forma como os níveis de rendimento se relacionam com os resultados de saúde em determinadas regiões ou quais os países que fizeram os avanços mais significativos no aumento do acesso às energias renováveis.

Caminho duplo da DataGemma: caminhos RIG e RAG

O inovador modelo DataGemma do Google usa dois métodos diferentes para melhorar a precisão e a validade dos LLMs: Geração Intercalada de Recuperação (RIG) e Geração Aumentada de Recuperação (RAG). Cada método tem pontos fortes diferentes.

A abordagem RIG baseia-se na investigação existente em IA, integrando consultas rápidas de fontes de dados fiáveis ​​no processo de geração de modelos. Especificamente, quando a DataGemma tem a tarefa de gerar uma resposta que inclua dados estatísticos ou factuais, ela se refere a dados relevantes dentro do repositório Data Commons. Esta abordagem garante que os resultados do modelo sejam baseados em dados do mundo real e verificados em relação a fontes confiáveis.

Por exemplo, ao responder a uma pergunta sobre o aumento global da utilização de energias renováveis, o método RIG da DataGemma extrairá dados estatísticos diretamente do Data Commons, garantindo que a resposta se baseia em informações fiáveis ​​e em tempo real.

Por outro lado, o método RAG expande o escopo do que os modelos de linguagem podem fazer, incorporando informações contextuais relevantes além dos seus dados de treinamento. DataGemma usa o poder do modelo Gemini, especialmente a longa janela de contexto, para encontrar dados importantes antes de gerar a saída. Este método garante que as respostas do modelo sejam quantitativas, informativas e não sujeitas a vieses.

Quando uma pergunta é feita, o método RAG começa por obter dados estatísticos relevantes do Data Commons antes de gerar uma resposta, garantindo assim que a resposta seja precisa e enriquecida com um contexto detalhado. Isto é especialmente importante para questões complexas que exigem mais do que uma resposta factual simples, como a compreensão das tendências nas políticas ambientais globais ou a análise dos impactos sociais e económicos de um evento específico.

Resultados iniciais e um futuro promissor

Embora os métodos RIG e RAG ainda estejam em seus estágios iniciais, pesquisas preliminares sugerem melhorias promissoras na precisão dos LLMs ao lidar com fatos numéricos. Ao reduzir o risco de perda de dados, o DataGemma tem um grande potencial para uma variedade de aplicações, desde pesquisas acadêmicas até tomadas de decisões empresariais. O Google espera que a maior precisão alcançada por meio do DataGemma torne as ferramentas baseadas em IA mais confiáveis, confiáveis ​​e valiosas para quem busca decisões informadas e baseadas em dados.

A equipe de pesquisa e desenvolvimento do Google continua a melhorar o RIG e o RAG, com planos de ampliar esses esforços e submetê-los a testes rigorosos. O objetivo final é integrar essas funções avançadas nos modelos Gemma e Gemini usando uma abordagem hierárquica. Atualmente, o Google disponibiliza o DataGemma para pesquisadores e desenvolvedores, fornecendo acesso a modelos e livros de referência rápida para métodos RIG e RAG.

Implicações mais amplas do papel da IA ​​na sociedade

O lançamento do DataGemma marca um passo importante na jornada para tornar os LLMs mais confiáveis ​​e baseados em dados autênticos. À medida que a IA produtiva está cada vez mais integrada numa variedade de domínios, desde a educação e os cuidados de saúde até à governação e à política ambiental, abordar a inovação é essencial para garantir que a IA capacita os utilizadores com informações precisas.

O compromisso do Google em tornar o DataGemma um modelo aberto reflete sua visão mais ampla de promover a colaboração e a inovação na comunidade de IA. Ao disponibilizar esta tecnologia para desenvolvedores, pesquisadores e formuladores de políticas, o Google pretende impulsionar a adoção de técnicas de aprimoramento de dados que melhorem a confiabilidade da IA. Esta iniciativa faz avançar o campo da IA ​​e enfatiza a importância da tomada de decisões baseada em factos no mundo atual, orientado por dados.

Concluindo, DataGemma é uma nova abordagem para manipulação de IA, fundamentando LLMs no grande e confiável conjunto de dados Data Commons do Google. Ao combinar os métodos RIG e RAG, o Google criou uma ferramenta robusta que melhora a precisão e a confiabilidade do conteúdo gerado por IA. Este lançamento é um passo importante para garantir que a IA se torne um parceiro confiável na pesquisa, na tomada de decisões e na aquisição de informações, o que capacita indivíduos e organizações a tomarem decisões mais informadas com base em dados do mundo real.


Confira Detalhes, papel, RAG Gemma e RIG Gemma. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima.

📨 Se você gosta do nosso trabalho, vai gostar do nosso Boletim informativo..

Não se esqueça de participar do nosso Mais de 50k ML SubReddit

⏩ ⏩ WEBINAR GRATUITO DE IA: ‘Vídeo SAM 2: Como sintonizar seus dados’ (quarta-feira, 25 de setembro, 4h00 – 4h45 EST)


Asif Razzaq é o CEO da Marktechpost Media Inc. Como empresário e engenheiro visionário, Asif está empenhado em aproveitar o poder da Inteligência Artificial em benefício da sociedade. Seu mais recente empreendimento é o lançamento da Plataforma de Mídia de Inteligência Artificial, Marktechpost, que se destaca por sua ampla cobertura de histórias de aprendizado de máquina e aprendizado profundo que parecem tecnicamente sólidas e facilmente compreendidas por um amplo público. A plataforma possui mais de 2 milhões de visualizações mensais, o que mostra sua popularidade entre os telespectadores.

👨‍💻 HyperAgent: agentes genéricos de engenharia de software para resolver tarefas de codificação em escala.





Source link

Você também pode gostar...

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *