Conheça o DataLab: uma plataforma integrada de Business Intelligence usando agentes baseados em LLM e notebooks
Inteligência artificial

Conheça o DataLab: uma plataforma integrada de Business Intelligence usando agentes baseados em LLM e notebooks


A inteligência de negócios (BI) enfrenta grandes desafios para converter com sucesso grandes volumes de dados em insights acionáveis. Os fluxos de trabalho atuais envolvem muitos estágios complexos, incluindo preparação, análise e visualização de dados, que exigem ampla colaboração entre engenheiros de dados, cientistas e analistas usando uma variedade de ferramentas especializadas. Esses processos são demorados e tediosos, exigindo intervenção e comunicação significativas. A complexa interdependência entre especialistas e ferramentas reduz a produção de informações, atrasa a tomada de decisões e reduz o desempenho organizacional. Estas limitações sublinham a necessidade crítica de abordagens integradas e automatizadas para fluxos de trabalho de BI.

As plataformas de BI existentes tentaram enfrentar os desafios do fluxo de trabalho de diversas maneiras. Plataformas como Tableau, Power BI e Databricks melhoraram as interações gráficas para manipulação de dados e suporte para geração de painéis. Essas plataformas possuem interfaces de linguagem natural para reduzir cargas de trabalho manuais. Outros esforços de pesquisa exploraram abordagens baseadas em ontologias para melhorar o conhecimento semântico e as habilidades de tradução de consultas. Pesquisas anteriores se concentraram em cenários específicos de análise de dados, investigando como os analistas de dados interagem com LLMs e identificando desafios como recuperação contextual de dados e refinamento rápido. No entanto, estas soluções existentes visam principalmente tarefas individuais, mas carecem de uma abordagem detalhada e integrada ao fluxo de trabalho de BI.

Pesquisadores do State Key Lab de CAD&CG, da Universidade de Zhejiang, da Tencent Inc., da Southern University of Science and Technology e da Universidade de Pequim propuseram o DataLab, uma plataforma de BI unificada, que integra uma única estrutura de LLM baseado em agente com computação aumentada. interface do notebook. Ele oferece suporte a várias funções de BI em diferentes funções de dados, integrando perfeitamente a assistência LLM e a personalização do usuário em um só lugar. O DataLab supera as limitações inerentes de ferramentas de BI diferentes e específicas para tarefas. A principal inovação reside na sua capacidade de criar uma solução completa que preenche a lacuna entre várias funções, funções e ferramentas de dados, mudando potencialmente a forma como as organizações abordam a análise de dados e os processos de tomada de decisão.

A Arquitetura DataLab é estrategicamente projetada em torno de dois componentes principais: a Estrutura Operacional baseada em LLM e a Interface do Notebook Computacional. O Agent Framework baseado em LLM usa uma abordagem multiagente complexa para lidar com várias tarefas de business intelligence. Cada agente é projetado especificamente para atender às necessidades específicas do processo, usando uma estrutura de gráfico acíclico direcionado (DAG) que garante flexibilidade e escalabilidade. A estrutura usa várias ferramentas de dados, como o sandbox Python para execução de código e o ambiente VegaLite para visualização. O novo design de arquitetura permite que os nós representem componentes reutilizáveis, como APIs e ferramentas LLM, enquanto as arestas definem as conexões entre esses componentes.

O DataLab demonstra um desempenho impressionante em uma ampla gama de tarefas de BI, superando consistentemente os benchmarks baseados em LLM em vários benchmarks, incluindo BIRD, DS-1000, DSEval, InsightBench e VisEval. Suas capacidades superiores são impulsionadas por seu módulo de criação de conhecimento de domínio e estratégia sofisticada de criação de perfil de dados. Com funções de geração de linguagem simbólica, como NL2SQL, NL2DSCode e NL2VIS, o DataLab produz resultados de alta qualidade usando especificações de linguagem específicas do domínio central. O DataLab supera as estruturas existentes, como o AutoGen, em até 19,35% em outros benchmarks em tarefas complexas de raciocínio em várias etapas. Isto demonstra as capacidades avançadas de compreensão de dados da plataforma e um mecanismo de comunicação estruturado entre agentes que facilita a descoberta de informações detalhadas.

Concluindo, os pesquisadores apresentam o DataLab, uma plataforma integrada de BI que combina uma estrutura de agente baseada em LLM com uma interface de notebook computacional. A plataforma introduz novos componentes, incluindo um módulo de entrada de informações de domínio, um mecanismo de comunicação entre agentes e uma estratégia de gerenciamento de conteúdo baseada em células. Esses recursos avançados permitem a integração perfeita da assistência LLM com a personalização do usuário, abordando os principais desafios do fluxo de trabalho de BI atual. Ao fornecer uma solução abrangente que suporta uma variedade de funções e funções de dados, o DataLab representa um grande avanço na análise automatizada de dados. Testes extensivos garantem o desempenho impressionante e a praticidade da plataforma em ambientes de negócios.


Confira eu Papel. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Se você gosta do nosso trabalho, você vai gostar do nosso jornal.. Não se esqueça de participar do nosso SubReddit de 60k + ML.

🚨 [Must Attend Webinar]: 'Transforme provas de conceito em aplicativos e agentes de IA prontos para produção' (Promovido)


Sajjad Ansari se formou no último ano do IIT Kharagpur. Como entusiasta da tecnologia, ele examina as aplicações da IA ​​com foco na compreensão do impacto das tecnologias de IA e suas implicações no mundo real. Seu objetivo é transmitir conceitos complexos de IA de maneira clara e acessível.

🚨🚨 WEBINAR DE IA GRATUITO: 'Acelere suas aplicações LLM com deepset e Haystack' (promovido)





Source link

Você também pode gostar...

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *