A inteligência de negócios (BI) enfrenta grandes desafios para converter com sucesso grandes volumes de dados em insights acionáveis. Os fluxos de trabalho atuais envolvem muitos estágios complexos, incluindo preparação, análise e visualização de dados, que exigem ampla colaboração entre engenheiros de dados, cientistas e analistas usando uma variedade de ferramentas especializadas. Esses processos são demorados e tediosos, exigindo intervenção e comunicação significativas. A complexa interdependência entre especialistas e ferramentas reduz a produção de informações, atrasa a tomada de decisões e reduz o desempenho organizacional. Estas limitações sublinham a necessidade crítica de abordagens integradas e automatizadas para fluxos de trabalho de BI.
As plataformas de BI existentes tentaram enfrentar os desafios do fluxo de trabalho de diversas maneiras. Plataformas como Tableau, Power BI e Databricks melhoraram as interações gráficas para manipulação de dados e suporte para geração de painéis. Essas plataformas possuem interfaces de linguagem natural para reduzir cargas de trabalho manuais. Outros esforços de pesquisa exploraram abordagens baseadas em ontologias para melhorar o conhecimento semântico e as habilidades de tradução de consultas. Pesquisas anteriores se concentraram em cenários específicos de análise de dados, investigando como os analistas de dados interagem com LLMs e identificando desafios como recuperação contextual de dados e refinamento rápido. No entanto, estas soluções existentes visam principalmente tarefas individuais, mas carecem de uma abordagem detalhada e integrada ao fluxo de trabalho de BI.
Pesquisadores do State Key Lab de CAD&CG, da Universidade de Zhejiang, da Tencent Inc., da Southern University of Science and Technology e da Universidade de Pequim propuseram o DataLab, uma plataforma de BI unificada, que integra uma única estrutura de LLM baseado em agente com computação aumentada. interface do notebook. Ele oferece suporte a várias funções de BI em diferentes funções de dados, integrando perfeitamente a assistência LLM e a personalização do usuário em um só lugar. O DataLab supera as limitações inerentes de ferramentas de BI diferentes e específicas para tarefas. A principal inovação reside na sua capacidade de criar uma solução completa que preenche a lacuna entre várias funções, funções e ferramentas de dados, mudando potencialmente a forma como as organizações abordam a análise de dados e os processos de tomada de decisão.
A Arquitetura DataLab é estrategicamente projetada em torno de dois componentes principais: a Estrutura Operacional baseada em LLM e a Interface do Notebook Computacional. O Agent Framework baseado em LLM usa uma abordagem multiagente complexa para lidar com várias tarefas de business intelligence. Cada agente é projetado especificamente para atender às necessidades específicas do processo, usando uma estrutura de gráfico acíclico direcionado (DAG) que garante flexibilidade e escalabilidade. A estrutura usa várias ferramentas de dados, como o sandbox Python para execução de código e o ambiente VegaLite para visualização. O novo design de arquitetura permite que os nós representem componentes reutilizáveis, como APIs e ferramentas LLM, enquanto as arestas definem as conexões entre esses componentes.
O DataLab demonstra um desempenho impressionante em uma ampla gama de tarefas de BI, superando consistentemente os benchmarks baseados em LLM em vários benchmarks, incluindo BIRD, DS-1000, DSEval, InsightBench e VisEval. Suas capacidades superiores são impulsionadas por seu módulo de criação de conhecimento de domínio e estratégia sofisticada de criação de perfil de dados. Com funções de geração de linguagem simbólica, como NL2SQL, NL2DSCode e NL2VIS, o DataLab produz resultados de alta qualidade usando especificações de linguagem específicas do domínio central. O DataLab supera as estruturas existentes, como o AutoGen, em até 19,35% em outros benchmarks em tarefas complexas de raciocínio em várias etapas. Isto demonstra as capacidades avançadas de compreensão de dados da plataforma e um mecanismo de comunicação estruturado entre agentes que facilita a descoberta de informações detalhadas.
Concluindo, os pesquisadores apresentam o DataLab, uma plataforma integrada de BI que combina uma estrutura de agente baseada em LLM com uma interface de notebook computacional. A plataforma introduz novos componentes, incluindo um módulo de entrada de informações de domínio, um mecanismo de comunicação entre agentes e uma estratégia de gerenciamento de conteúdo baseada em células. Esses recursos avançados permitem a integração perfeita da assistência LLM com a personalização do usuário, abordando os principais desafios do fluxo de trabalho de BI atual. Ao fornecer uma solução abrangente que suporta uma variedade de funções e funções de dados, o DataLab representa um grande avanço na análise automatizada de dados. Testes extensivos garantem o desempenho impressionante e a praticidade da plataforma em ambientes de negócios.
Confira eu Papel. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Se você gosta do nosso trabalho, você vai gostar do nosso jornal.. Não se esqueça de participar do nosso SubReddit de 60k + ML.
🚨 [Must Attend Webinar]: 'Transforme provas de conceito em aplicativos e agentes de IA prontos para produção' (Promovido)
Sajjad Ansari se formou no último ano do IIT Kharagpur. Como entusiasta da tecnologia, ele examina as aplicações da IA com foco na compreensão do impacto das tecnologias de IA e suas implicações no mundo real. Seu objetivo é transmitir conceitos complexos de IA de maneira clara e acessível.
🚨🚨 WEBINAR DE IA GRATUITO: 'Acelere suas aplicações LLM com deepset e Haystack' (promovido)