Agent Prune: uma estrutura de mídia social robusta e econômica para LLMs que economiza custos e remove conteúdo indesejado e malicioso

“Se você quer ir rápido, vá sozinho. Se quiser ir longe, vá junto”: Este provérbio africano descreve bem como os programas multiagentes superam os LLMs padrão em várias funções de pensamento, criatividade e validade. Os sistemas multiagentes (MA) utilizam a inteligência coletiva de vários cenários LLM por meio de tópicos de comunicação cuidadosamente projetados. Seus resultados são interessantes e uma comunicação muito simples aumenta a precisão em todas as tarefas. No entanto, esta maior precisão e flexibilidade têm um preço, desta vez com o aumento do uso de tokens. Estudos mostram que esses métodos de comunicação podem aumentar de duas a quase 12 vezes o custo do uso de tokens comuns, prejudicando significativamente a Economia de Tokens de multiagentes. Este artigo discute a pesquisa que capta a ressalva da topologia de comunicação atual e propõe uma solução para que os agentes possam ir longe juntos, ao mesmo tempo em que reduzem o combustível.

Pesquisadores da Universidade de Tongji e do Laboratório de IA de Xangai integram o conceito de Densidade de Comunicação no tópico de comunicação multiagente. Eles observam que a maior parte da mensagem que passa entre os agentes não interrompe o processo. Essa realização inspirou AgentPrune, uma estrutura de poda de comunicação para LLM-MA que trata toda a estrutura multiagente como um gráfico de comunicação espaço-tempo e usa uma máscara gráfica de comunicação objetiva de baixo nível para resolver o problema de redundância de comunicação. A remoção ocorre de duas maneiras: (a) remoção local para remover mensagens locais redundantes da conversa e (b) remoção temporal para remover o histórico de conversa irrelevante.

Seria bom compreender os dois principais métodos de comunicação antes de mergulhar na tecnologia AgentPrune. Existem dois tipos de estratégias de comunicação entre agentes. A primeira é a comunicação intradiálogo, onde os agentes interagem, ensinam ou competem durante uma única sessão. A comunicação interconversacional, por outro lado, ocorre entre múltiplas rodadas de conversa onde as informações ou informações dessa comunicação são repassadas ao próximo agente. Agora, na representação gráfica temporal e temporal do AgentPrune, os nós são agentes e suas propriedades, como ferramentas API externas, base de conhecimento, etc. Além disso, a comunicação intra-diálogo cria fronteiras espaciais e a comunicação inter-diálogo cria fronteiras temporais. bordas. As máscaras direcionadas de baixo nível do AgentPrune identificam as entidades mais importantes e as eliminam de uma só vez, revelando um gráfico de comunicação esparso que vê todas as informações.

O algoritmo é eficiente e fácil de instalar em um LLM MA existente. É como um módulo plug-and-play para que os agentes otimizem o uso de tokens e tenham o melhor dos dois mundos. Porém, o número de agentes deve ultrapassar três e a comunicação deve ser moderada para ser utilizada. O Agente Prune também é treinado em Multi-Query para aumentar o número de consultas e solucionar o problema, fornecendo o mínimo necessário.

Este novo pipeline foi testado em tarefas de raciocínio geral, raciocínio estatístico e geração de código em conjuntos de dados significativos. AgentPrune foi adicionado ao sistema MA para 5 modelos GPT-4. A seguir foram as ideias principais:

A) Nem todas as topologias multiagências oferecem o melhor desempenho.

B) Desempenho de alta qualidade alcançado com economia de custos, alcançando assim utilidade e economia.

Além disso, o AgentPrune removeu mensagens maliciosas para garantir sua robustez sob ataques adversários. Isso foi confirmado quando os autores realizaram ataque imediato ao agente e substituição do agente, porém o sistema não experimentou uma queda significativa no caso de conflito sem o AgentPrune.

AgentPrune simplifica a interoperabilidade e as operações de MA, garantindo precisão e economizando tokens. A sua estratégia CUT THE CRAP sugere uma abordagem frugal à precisão neste mundo de luxo.

Confira Papel e GitHub. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Se você gosta do nosso trabalho, você vai gostar do nosso jornal.. Não se esqueça de participar do nosso Mais de 50k ML SubReddit

[Upcoming Event- Oct 17 202] RetrieveX – Conferência de recuperação de dados GenAI (promovida)

Adeeba Alam Ansari está atualmente cursando um diploma duplo no Instituto Indiano de Tecnologia (IIT) Kharagpur, cursando B.Tech em Engenharia Industrial e M.Tech em Engenharia Financeira. Com profundo interesse em aprendizado de máquina e inteligência artificial, ele é um leitor ávido e uma pessoa curiosa. Adeeba acredita firmemente no poder da tecnologia para capacitar a sociedade e promover o bem-estar através de soluções inovadoras impulsionadas pela empatia e uma compreensão profunda dos desafios do mundo real.

[Upcoming Event- Oct 17 202] RetrieveX – Conferência de recuperação de dados GenAI: Junte-se a mais de 300 executivos GenAI da Bayer, Microsoft, Flagship Pioneering para aprender como construir pesquisa de IA rápida e precisa em armazenamento de objetos. (Promovido)

Source link

Você também pode gostar...

Mirage: um superotimizador de álgebra tensorial multinível para geração de kernel de GPU para aplicativos PyTorch

O guia completo para desidentificar dados não estruturados de saúde

Repensando o treinamento LLM: a promessa dos métodos de aprendizagem por reforço cruzado

Deixe um comentário Cancelar resposta