A inteligência artificial (IA) fez avanços significativos no desenvolvimento de modelos de linguagem capazes de resolver problemas complexos. No entanto, a aplicação destes modelos aos desafios científicos do mundo real continua difícil. A maioria dos agentes de IA luta com tarefas que exigem múltiplos ciclos de observação, pensamento e ação. Além disso, os modelos existentes muitas vezes não conseguem integrar ferramentas de forma eficaz ou manter a consistência no raciocínio em várias etapas. Estas questões são particularmente urgentes em domínios científicos, onde as tarefas exigem precisão, flexibilidade e eficiência computacional. A abordagem destas questões requer um quadro flexível e eficaz para a formação e implantação de agentes linguísticos.
Apresentando Aviary: uma academia extensível de código aberto
Uma equipe de pesquisadores da FutureHouse Inc., da Universidade de Rochester e do Instituto Francis Crick lançou o Aviary, um ginásio aberto para agentes linguísticos. O Aviary aborda as limitações das estruturas existentes introduzindo processos de decisão linguística (LDPs), que modelam tarefas como processos de decisão de Markov semi-reflexivos baseados em linguagem natural. Esta abordagem permite que os agentes linguísticos gerenciem com eficácia tarefas de consulta em várias etapas.
O Aviário inclui cinco áreas, três das quais destinadas a atividades científicas avançadas:
- Clonagem Molecular: Manipulação de construções de DNA usando ferramentas de anotação de sequência e planejamento de protocolo.
- Controle de qualidade da literatura científica: Recuperar e analisar a literatura científica para responder a questões de pesquisa detalhadas.
- Engenharia de Estabilidade de Proteínas: Propondo modificações em proteínas para melhorar a estabilidade com a ajuda de ferramentas computacionais e bioquímicas.
Essas funções fazem do Aviary uma plataforma importante para treinar e testar agentes linguísticos em situações do mundo real que exigem raciocínio, integração de ferramentas e aprendizagem iterativa.
Detalhes Técnicos e Vantagens dos Aviões
Aviary usa uma estrutura gráfica de computação estocástica para modelar agentes de linguagem, o que permite flexibilidade e eficiência. Os principais recursos incluem:
- Iteração Especialista (EI): Um método de treinamento que refina os agentes usando trajetórias de alta qualidade.
- Maioria votante: Um método para melhorar a precisão combinando vários resultados das suposições sem sobrecarga computacional excessiva.
- Montagem da ferramenta: Suporte integrado para ferramentas como anotação de sequência e sistemas de recuperação de literatura, melhorando o desempenho no mundo real.
Os pesquisadores mostram que modelos de código aberto sem limites, como o Llama-3.1-8B-Instruct, podem alcançar desempenho comparável ou melhor do que modelos de limite (por exemplo, Claude 3.5 Sonnet) nessas áreas. Além disso, esses modelos operam a um custo muito baixo, tornando-os acessíveis para aplicações científicas em larga escala.
Resultados e detalhes
Agentes treinados em aviação mostram desempenho impressionante:
- Em tarefas de agrupamento molecular, o agente Llama-3.1-8B-Instruct mostrou melhorias significativas na precisão com EI e comportamento de agrupamento, superando especialistas humanos em benchmarks SeqQA.
- Na literatura científica de tarefas de QA, o mesmo modelo alcançou níveis de desempenho iguais ou melhores que os humanos, mantendo a eficiência.
- As pesquisas múltiplas melhoraram ainda mais a precisão, com os resultados do SeqQA atingindo 89% após a amostragem de múltiplas trajetórias, superando os benchmarks e parâmetros do modelo populacional.
A conclusão
Aviary representa um avanço conceitual no desenvolvimento de agentes linguísticos de IA. Ao demonstrar que modelos de código aberto e sem fronteiras podem ter sucesso em empreendimentos científicos, o Aviary abre novas oportunidades para pesquisas de IA acessíveis e econômicas. Seu design de código aberto incentiva a colaboração, permitindo que pesquisadores e desenvolvedores refinem e ampliem continuamente suas aplicações.
Com ferramentas e métodos de treinamento projetados para desafios do mundo real, a Aviary estabelece a referência de como os agentes linguísticos podem lidar com tarefas complexas. Ele fornece uma estrutura atraente para o desenvolvimento de experimentos científicos baseados em IA e solução prática de problemas.
Confira Papel, Detalhes técnicosde novo GitHub Página. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Não se esqueça de participar do nosso SubReddit de 60k + ML.
🚨 PRÓXIMO WEBINAR GRATUITO DE IA (15 DE JANEIRO DE 2025): Aumente a precisão do LLM com dados artificiais e inteligência experimental–Participe deste webinar para obter insights práticos sobre como melhorar o desempenho e a precisão do modelo LLM e, ao mesmo tempo, proteger a privacidade dos dados.
Asif Razzaq é o CEO da Marktechpost Media Inc. Como empresário e engenheiro visionário, Asif está empenhado em aproveitar o poder da Inteligência Artificial em benefício da sociedade. Seu mais recente empreendimento é o lançamento da Plataforma de Mídia de Inteligência Artificial, Marktechpost, que se destaca por sua ampla cobertura de histórias de aprendizado de máquina e aprendizado profundo que parecem tecnicamente sólidas e facilmente compreendidas por um amplo público. A plataforma possui mais de 2 milhões de visualizações mensais, o que mostra sua popularidade entre o público.
🧵🧵 Siga-nos no X (Twitter) para pesquisas gerais sobre IA e atualizações de desenvolvimento aqui…