Google AI apresenta Gemma-APS: uma coleção de modelos Gemma para segmentação de texto para sugestões
Inteligência artificial

Google AI apresenta Gemma-APS: uma coleção de modelos Gemma para segmentação de texto para sugestões


A crescente dependência de modelos de aprendizado de máquina para o processamento da linguagem humana apresenta vários obstáculos, como a compreensão precisa de frases complexas, a segmentação do conteúdo em partes compreensíveis e a captura de nuances contextuais presentes em vários domínios. Neste campo, a necessidade de modelos capazes de classificar trechos de texto gerenciáveis ​​em nível de proposição nunca foi abordada. Essa habilidade é muito importante no desenvolvimento de modelos de linguagem usados ​​para resumo, recuperação de informações e várias outras tarefas de PNL.

Google AI lança Gemma-APS, um conjunto de modelos Gemma para segmentação de texto para proposições. Os modelos refinados dos modelos Gemini Pro ajustados são aplicados a dados sintéticos de vários domínios, incluindo dados de texto gerados para simular diferentes situações e dificuldades de linguagem. Esta abordagem ao uso de dados artificiais é importante porque permite que os modelos treinem em diferentes estruturas e domínios de frases, tornando-os adaptáveis ​​a todas as aplicações. Os modelos Gemma-APS são cuidadosamente projetados para converter texto contínuo em unidades proposicionais menores, tornando-os mais eficazes em tarefas subsequentes de PNL, como análise de sentimento, aplicativos de chatbot ou geração aumentada de recuperação (RAG). Com este lançamento, o Google AI espera tornar a classificação de texto mais acessível, com modelos aprimorados para trabalhar em diversos recursos computacionais.

Tecnicamente, o Gemma-APS se caracteriza pelo uso de modelos refinados da série Gemini Pro, que foram projetados para oferecer alto desempenho em análise de texto multidomínio. O processo de fresagem envolve a compressão desses modelos poderosos em versões menores e mais eficientes, sem comprometer a qualidade de classificação. Esses modelos estão agora disponíveis como Gemma-7B-APS-IT e Gemma-2B-APS-IT em Hugging Face, que atendem a diferentes necessidades em termos de eficiência e precisão computacional. A utilização de dados sintéticos para múltiplos domínios garante que estes modelos sejam expostos a uma variedade de entradas linguísticas, melhorando assim a sua robustez e flexibilidade. Como resultado, os modelos Gemma-APS podem lidar eficazmente com textos complexos, dividindo-os em proposições significativas que incluem informações básicas, um recurso que é muito benéfico para melhorar tarefas básicas como resumir, compreender e classificar.

A importância do Gemma-APS é evidente não apenas na sua versatilidade, mas também no seu alto nível de desempenho em vários conjuntos de dados. A IA do Google usou dados sintéticos de muitos domínios para desenvolver esses modelos, garantindo que sejam eficazes em aplicações do mundo real, como análise de documentos técnicos, interações de atendimento ao cliente e extração de informações de documentos não estruturados. Testes preliminares mostram que o Gemma-APS supera consistentemente os modelos de classes anteriores em termos de precisão e eficiência computacional. Por exemplo, consegue melhorias significativas na captura de parâmetros proposicionais dentro de frases complexas, tornando os modelos de linguagem subsequentes mais eficientes. Essa melhoria também reduz o risco de desvio semântico durante a análise de texto, o que é importante em aplicações onde é importante preservar o significado original de um trecho de texto.

Concluindo, o lançamento do Gemma-APS pelo Google AI marca um marco importante no desenvolvimento da tecnologia de classificação de texto. Ao usar um método de destilação eficiente combinado com treinamento sintético multidomínio, esses modelos fornecem uma combinação de funcionalidade e eficiência que aborda muitas das limitações inerentes aos sistemas de PNL. Eles estão preparados para mudar o jogo na forma como os modelos de linguagem interpretam e analisam documentos complexos, permitindo uma recuperação e resumo de informações mais eficientes em vários domínios.


Confira Modelos aqui. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Se você gosta do nosso trabalho, você vai gostar do nosso jornal.. Não se esqueça de participar do nosso Mais de 50k ML SubReddit.

[Upcoming Live Webinar- Oct 29, 2024] Melhor plataforma para modelos ajustados: mecanismo de inferência Predibase (avançado)


Shobha é um analista de dados com histórico comprovado no desenvolvimento de soluções de aprendizado de máquina que geram valor comercial.





Source link

Você também pode gostar...

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *