Os LLMs fizeram avanços significativos na escrita automatizada, especialmente para tarefas como desenvolvimento de sites longos e relatórios específicos de assuntos. Muitos métodos dependem da Geração Aumentada de Recuperação (RAG) para incorporar informações externas no processo de escrita. No entanto, estes métodos muitas vezes falham devido a técnicas de recuperação estática, que limitam a profundidade do conteúdo gerado, a diversidade e a usabilidade – esta falta de testes flexíveis e abrangentes resulta em resultados repetitivos, superficiais e irrealistas. Embora novos métodos como STORM e Co-STORM expandam a recolha de conhecimento através de role-playing e recuperação multi-conceito, permanecem confinados aos limites do conhecimento estático e não conseguem utilizar todo o potencial do LLM para obter capacidades dinâmicas e conscientes do contexto.
A digitação não possui tais processos iterativos, ao contrário dos humanos, que reorganizam e refinam naturalmente suas estruturas cognitivas por meio de processos reflexivos. Estruturas baseadas em pensamento, como OmniThink, visam resolver essa deficiência, permitindo que os modelos ajustem estratégias de recuperação e aprofundem dinamicamente a compreensão do assunto. Estudos recentes destacaram a importância de integrar diversas perspectivas e pensar a partir de múltiplas fontes para produzir resultados de alta qualidade. Embora os métodos anteriores, como a regressão multicurvas e as simulações convolucionais, tenham feito progressos na classificação das fontes de dados, muitas vezes não conseguem adaptar-se à medida que a compreensão do modelo aumenta.
Pesquisadores da Universidade de Zhejiang, Tongyi Lab (Grupo Alibaba) e Zhejiang Key Laboratory of Big Data Intelligent Computing lançaram o OmniThink. Esta estrutura de digitação imita os processos mentais humanos de reflexão e expansão iterativas. OmniThink ajusta dinamicamente estratégias de recuperação para reunir informações diversas e relevantes, simulando como os alunos aprofundam continuamente sua compreensão. Essa abordagem melhora a densidade da informação, mantendo a coerência e a profundidade. Testado no conjunto de dados WildSeek usando uma nova métrica de “densidade de informação”, o OmniThink mostrou melhor qualidade do artigo. Testes humanos e feedback de especialistas confirmaram sua capacidade de produzir conteúdo perspicaz, abrangente e extenso, abordando os principais desafios da escrita automatizada.
A produção de código aberto de formato longo envolve a criação de artigos detalhados, encontrando e sintetizando informações de fontes abertas. Os métodos tradicionais incluem duas etapas: recuperar dados relacionados ao tema através de mecanismos de busca e gerar um esboço antes de redigir o artigo. No entanto, persistem problemas como redundância e baixa densidade de informação. OmniThink aborda isso simulando uma expansão iterativa semelhante à humana, construindo uma árvore de conhecimento e um conjunto de conceitos para criar dados relevantes e diversos. Através de um processo de três etapas – aquisição de informações, enquadramento e criação de tópicos – o OmniThink garante coerência lógica e conteúdo rico. Ele combina semelhança semântica para encontrar dados relevantes e filtra rascunhos para produzir artigos curtos e de alta densidade.
OmniThink apresenta excelente desempenho na geração de artigos e frameworks, destacando-se em métricas como relevância, amplitude, profundidade e atualização, principalmente ao utilizar GPT-4o. Seus métodos dinâmicos de expansão e reflexão aumentam a diversidade, a densidade e a criatividade do conhecimento, permitindo uma exploração mais profunda do conhecimento. A construção da moldura deste modelo melhora a compatibilidade estrutural e a harmonia lógica, resultante do seu design único Concept Pool. Os testes humanos confirmam o desempenho superior do OmniThink em comparação com fundações como o Co-STORM, especialmente no escopo. No entanto, novas melhorias sutis são menos óbvias para os testadores humanos, destacando a necessidade de métodos de teste mais refinados para avaliar com precisão as capacidades dos modelos avançados.
Concluindo, OmniThink é uma estrutura de escrita automática que imita a expansão e a reflexão iterativas semelhantes às humanas para produzir artigos longos, bem estruturados e de alta qualidade. Ao contrário dos métodos tradicionais de produção com recuperação aprimorada, que muitas vezes resultam em conteúdo superficial, redundante e irrelevante, o OmniThink melhora a densidade, a relevância e a profundidade da informação, aprofundando continuamente a compreensão de um tópico, semelhante à psicologia humana. Como confirmam os testes automatizados e os testes humanos, esta abordagem independente de modelo pode ser integrada às estruturas existentes. O trabalho futuro visa integrar métodos avançados, incluindo pensamento crítico, role-playing e interação humano-computador, e enfrentar os desafios na produção de conteúdo diversificado e informativo de formato longo.
Confira Artigo, página GitHub e projeto. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Não se esqueça de participar do nosso SubReddit de 65k + ML.
🚨 Recomendar plataforma de código aberto: Parlant é uma estrutura que está mudando a forma como os agentes de IA tomam decisões em situações voltadas para o cliente. (Promovido)
Sana Hassan, estagiária de consultoria na Marktechpost e estudante de pós-graduação dupla no IIT Madras, é apaixonada pelo uso de tecnologia e IA para enfrentar desafios do mundo real. Com um profundo interesse em resolver problemas do mundo real, ele traz uma nova perspectiva para a interseção entre IA e soluções da vida real.
📄 Conheça 'Height': ferramenta independente de gerenciamento de projetos (patrocinado)