Diagrama de pensamento (DoT): uma estrutura de IA para modelagem de pensamento recursivo com modelos de linguagem em larga escala (LLMs) como construção de gráfico acíclico direcionado (DAG) dentro de um único modelo

Diagrama de pensamento (DoT): uma estrutura de IA para modelagem de pensamento recursivo com modelos de linguagem em larga escala (LLMs) como construção de gráfico acíclico direcionado (DAG) dentro de um único modelo

Pesquisas anteriores sobre estruturas de pensamento nos principais modelos linguísticos (LLMs) exploraram várias maneiras de melhorar as habilidades de resolução de problemas. A Cadeia de Pensamento (CoT) introduziu processos de pensamento específicos, enquanto a Árvore do Pensamento (ToT) e o Gráfico do Pensamento (GoT) expandiram esse conceito incorporando possibilidades de ramificação e relações complexas entre …

Desvendando a memória de Schrödinger: abordagens de memória dinâmica para modelos de linguagem baseados em transformadores

Desvendando a memória de Schrödinger: abordagens de memória dinâmica para modelos de linguagem baseados em transformadores

Os LLMs demonstram habilidades linguísticas notáveis, o que levanta questões sobre seus processos de memória. Ao contrário dos humanos, que usam a memória para realizar tarefas diárias, a “memória” dos LLMs é baseada em entradas e não em armazenamento externo. Os esforços de pesquisa visam melhorar a retenção de LLMs, aumentando o comprimento do contexto …

Lançado Embedić: um conjunto de modelos de incorporação de texto sérvio aprimorados para recuperação de informações e RAG

Lançado Embedić: um conjunto de modelos de incorporação de texto sérvio aprimorados para recuperação de informações e RAG

Novak Zivanic deu uma grande contribuição ao campo do Processamento de Linguagem Natural com o lançamento de Embedićuma coleção de modelos de incorporação de texto sérvio. Esses modelos são projetados especificamente para tarefas de recuperação de informações e geração avançada de recuperação (RAG). Especificamente, o menor modelo do conjunto alcançou um desempenho impressionante, superando o …

Pixtral 12B lançado pela Mistral AI: modelo revolucionário de IA multimodal que transforma indústrias com linguagem avançada e recursos de processamento visual

Pixtral 12B lançado pela Mistral AI: modelo revolucionário de IA multimodal que transforma indústrias com linguagem avançada e recursos de processamento visual

A liberação de Pixel 12B O Mistral AI representa um salto significativo em relação a um grande modelo de linguagem multimodal alimentado por impressionantes 12 bilhões de parâmetros. Este modelo avançado de IA foi projetado para gerenciar e gerar conteúdo textual e visual, tornando-o uma ferramenta versátil para diversos setores. Capaz de processar grandes conjuntos …

O novo AI JetPack acelera o processo de negócios | Notícias do MIT

O novo AI JetPack acelera o processo de negócios | Notícias do MIT

O fundador da Apple, Steve Jobs, descreveu o computador como uma bicicleta mental. O recentemente lançado Martin Trust Center for MIT Entrepreneurship adicionou potencial. “Talvez ainda não seja uma Ferrari, mas temos um carro”, disse Bill Aulet, gerente do centro. Veículo: MIT Entrepreneurship JetPack, uma ferramenta generativa de inteligência artificial treinada na Estrutura Disciplinar de …

Lançado Jina-Embeddings-v3: um modelo de incorporação de texto multilíngue projetado para uma variedade de aplicações de PNL

Lançado Jina-Embeddings-v3: um modelo de incorporação de texto multilíngue projetado para uma variedade de aplicações de PNL

Modelos de incorporação de texto têm sido fundamentais para o processamento de linguagem natural (PNL). Esses modelos transformam texto em vetores de alta dimensão que capturam relacionamentos semânticos, permitindo operações como recuperação de documentos, classificação, agrupamento e muito mais. A incorporação é particularmente importante em sistemas avançados, como os modelos Retrieval-Augmented Generation (RAG), onde a …

Este artigo sobre IA apresenta um esboço abrangente de carreiras de engenharia de software orientadas por LLM

Este artigo sobre IA apresenta um esboço abrangente de carreiras de engenharia de software orientadas por LLM

A engenharia de software combina princípios da ciência da computação para projetar, desenvolver e manter aplicativos de software. À medida que a tecnologia avança, a complexidade dos sistemas de software aumenta, criando desafios para garantir eficiência, precisão e desempenho geral. A inteligência artificial, especialmente usando Large Language Models (LLMs), teve um grande impacto neste campo. …

WordLlama revelado: um kit de ferramentas de PNL de código aberto, rápido e leve (16 MB) para tarefas como desduplicação difusa, paralelismo e padrão otimizado para CPU

WordLlama revelado: um kit de ferramentas de PNL de código aberto, rápido e leve (16 MB) para tarefas como desduplicação difusa, paralelismo e padrão otimizado para CPU

A liberação de ZwiLlama em Hugging Face marca um momento importante no processamento de linguagem natural (PNL). Este modelo de linguagem avançado foi projetado para fornecer aos desenvolvedores, pesquisadores e empresas uma ferramenta altamente eficiente e acessível para diversas aplicações de PNL. Seu lançamento é particularmente oportuno, dada a crescente demanda por soluções baseadas em …

Seed Music: uma estrutura de IA completa para geração e edição musical avançada com expressão artística controlada e entrada multimodo

Seed Music: uma estrutura de IA completa para geração e edição musical avançada com expressão artística controlada e entrada multimodo

A produção musical avançou muito, combinando canções vocais e instrumentais em composições unificadas. Trabalhos pioneiros como Jukebox mostraram a geração de música vocal de ponta a ponta, combinando letras de entrada, estilos de artistas e gêneros. Os aplicativos baseados em IA agora permitem a criação sob demanda usando entrada de linguagem natural, tornando a geração …

SynSUM: uma referência prática para sintetizar notas clínicas e dados estruturados

SynSUM: uma referência prática para sintetizar notas clínicas e dados estruturados

Os Registros Eletrônicos de Saúde (EHRs) apresentam uma riqueza de informações, incluindo dados tabulares estruturados e notas clínicas não estruturadas. Este valioso recurso constitui a base para o treinamento de sistemas de apoio à decisão clínica e processos automatizados de diagnóstico e planejamento de tratamento. Embora os modelos linguísticos de grande escala (LLMs) sejam capazes …