O desafio está na geração de fluxos de trabalho eficientes para grandes modelos de linguagem (LLMs). Apesar de suas incríveis habilidades em uma ampla gama de atividades, criar um fluxo de trabalho que integre vários LLMs em paralelo é uma tarefa difícil, limitando a escalabilidade e a flexibilidade em novos projetos. Os esforços para automatizar a produção de fluxos de trabalho não eliminaram totalmente a necessidade de intervenção humana, o que torna difícil conseguir uma transferência ampla e eficaz de competências dos LLMs.
Uma equipe de pesquisadores da DeepWisdom, Universidade de Ciência e Tecnologia de Hong Kong (Guangzhou), Universidade Renmin da China, Universidade de Nanjing, Universidade Fudan, Universidade King Abdullah de Ciência e Tecnologia, Université de Montréal & Mila, Universidade de Ciência de Hong Kong e a tecnologia apresenta AFlow, uma nova estrutura destinada a automatizar fluxos de trabalho de agentes. AFlow foi projetado para resolver os desafios existentes, enquadrando o problema de otimização do fluxo de trabalho como uma pesquisa sobre a representação do fluxo de trabalho no código. Esses fluxos de trabalho são modelados como gráficos onde os nós representam as ações envolventes do LLM e as arestas representam as dependências entre essas ações. Usando o Monte Carlo Tree Search (MCTS), o AFlow otimiza o fluxo de trabalho de forma iterativa, fazendo alterações, executando e refinando a estrutura com base no feedback da execução.
A arquitetura AFlow foi projetada para testar e otimizar fluxos de trabalho de maneira eficaz com o mínimo de envolvimento humano. A chave para a eficiência do AFlow está no uso de nós e arestas para representar fluxos de trabalho, permitindo modelar relacionamentos complexos entre ações LLM. Os nós são conectados em uma estrutura semelhante a uma árvore, o que permite diversas configurações para atender a uma variedade de tarefas complexas. AFlow usa operadores predefinidos, como “Ensemble” ou “Update & Update”, que atuam como blocos de construção modulares. A otimização do fluxo de trabalho passa por uma série de fases, incluindo exploração de nós, expansão usando feedback baseado em LLM e experimentos de retropropagação, garantindo que o AFlow possa melhorar o fluxo de trabalho a cada iteração.
Os resultados deste estudo, com base em seis conjuntos de dados de referência – HumanEval, MBPP, MATH, GSM8K, HotPotQA e DROP – mostram que o AFlow supera os fluxos de trabalho de alto nível projetados manualmente e os métodos de automação existentes. Especificamente, o AFlow alcança uma melhoria média de desempenho de 5,7% em relação aos métodos projetados manualmente e uma melhoria de 19,5% em relação aos sistemas automatizados existentes, como o ADAS. Os pesquisadores também observaram que o AFlow pode gerar fluxos de trabalho que permitem que pequenos LLMs superem modelos maiores, como o GPT-4o, tudo isso com apenas 4,55% dos custos de indexação, tornando-o uma alternativa econômica para uma variedade de tarefas.
Concluindo, AFlow faz avanços significativos na redução da necessidade de esforço manual na concepção de fluxos de trabalho de agentes, aumentando assim a capacidade dos LLMs de resolver com sucesso uma ampla gama de tarefas. Ao usar o MCTS na pesquisa e no desenvolvimento de fluxo de trabalho, o AFlow não apenas automatiza o processo, mas também alcança melhor desempenho e eficiência de custos em comparação com os métodos existentes. Este desenvolvimento fornece uma base sólida para pesquisas futuras na geração de fluxos de trabalho automatizados, tornando os LLMs mais acessíveis e eficientes em aplicações do mundo real.
Confira Papel. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Se você gosta do nosso trabalho, você vai gostar do nosso jornal.. Não se esqueça de participar do nosso Mais de 50k ML SubReddit.
[Upcoming Live Webinar- Oct 29, 2024] A melhor plataforma para modelos ajustados: mecanismo de inferência Predibase (atualizado)
Asif Razzaq é o CEO da Marktechpost Media Inc. Como empresário e engenheiro visionário, Asif está empenhado em aproveitar o poder da Inteligência Artificial em benefício da sociedade. Seu mais recente empreendimento é o lançamento da Plataforma de Mídia de Inteligência Artificial, Marktechpost, que se destaca por sua ampla cobertura de histórias de aprendizado de máquina e aprendizado profundo que parecem tecnicamente sólidas e facilmente compreendidas por um amplo público. A plataforma possui mais de 2 milhões de visualizações mensais, o que mostra sua popularidade entre o público.