Desenvolvendo modelos de macrolinguagem com dados multicomuns: uma abordagem integrativa e iterativa

Desenvolvendo modelos de macrolinguagem com dados multicomuns: uma abordagem integrativa e iterativa

Os modelos linguísticos de grande escala (LLMs) tornaram-se uma parte importante da inteligência artificial, permitindo que os sistemas compreendam, ajam e respondam à linguagem humana. Esses modelos são usados ​​em diversos domínios, incluindo raciocínio em linguagem natural, geração de código e resolução de problemas. Os LLMs são frequentemente treinados com grandes quantidades de dados não …

Difusão de reutilização de movimento (Dr. Mo): um modelo de difusão para produção eficaz de vídeo por meio da reutilização de movimento

Difusão de reutilização de movimento (Dr. Mo): um modelo de difusão para produção eficaz de vídeo por meio da reutilização de movimento

Usando modelos avançados de inteligência artificial, a produção de vídeo envolve a criação de imagens em movimento a partir de descrições de texto ou imagens estáticas. Esta área de pesquisa busca produzir vídeos realistas e de alta qualidade, superando grandes desafios computacionais. Os vídeos gerados por IA estão encontrando aplicações em diversos campos, como cinema, …

Vista3D: uma nova estrutura de IA para geração rápida e detalhada de objetos 3D a partir de uma única imagem usando difusão prévia

Vista3D: uma nova estrutura de IA para geração rápida e detalhada de objetos 3D a partir de uma única imagem usando difusão prévia

A geração anterior de modelos 3D a partir de imagens únicas enfrentou desafios. As estruturas de alimentação produziam objetos simples devido aos dados 3D limitados. Os respingos gaussianos forneceram geometria grosseira rapidamente, mas careciam de detalhes finos e consistência de visualização. O limiar de gradiente ingênuo resultou em apinhamento excessivo e inchaço da geometria. Os …

MAGICORE: Uma estrutura de IA para iteração multiagente para refinamento robusto

MAGICORE: Uma estrutura de IA para iteração multiagente para refinamento robusto

Técnicas de agregação em tempo de teste, como gerar e combinar múltiplas respostas, podem melhorar o desempenho do LLM, mas, em última análise, alcançar retornos decrescentes. O refinamento, onde o feedback do modelo é usado para melhorar iterativamente as respostas, apresenta outra abordagem. No entanto, enfrenta três desafios: (1) excesso de refinamento, que pode levar …

DCMAC: Comunicação personalizada baseada na demanda para aprendizado de reforço multiagente eficiente

DCMAC: Comunicação personalizada baseada na demanda para aprendizado de reforço multiagente eficiente

A Aprendizagem Colaborativa por Reforço Multiagente (MARL) emergiu como uma técnica poderosa em vários domínios, incluindo controle de semáforos, robôs de enxame e redes de sensores. No entanto, o MARL enfrenta desafios significativos devido às complexas interações entre os agentes, que introduzem a não estacionariedade no ambiente. Esta descontinuidade complica o processo de aprendizagem e …

Google AI lança conjunto de dados temporais 2.5D de edifícios abertos que rastreia mudanças em edifícios nos países do sul

Google AI lança conjunto de dados temporais 2.5D de edifícios abertos que rastreia mudanças em edifícios nos países do sul

Os governos e as organizações humanitárias precisam de dados fiáveis ​​sobre as mudanças nos edifícios e nas infraestruturas ao longo do tempo para gerir a urbanização, alocar recursos e responder às crises. No entanto, muitas regiões do Sul Global necessitam de mais acesso a dados de infraestruturas oportunos e precisos, o que torna difícil acompanhar …

Microsoft lança GRIN MoE: uma combinação baseada em gradiente de modelos especializados de MoE para aprendizado profundo eficiente e escalável

Microsoft lança GRIN MoE: uma combinação baseada em gradiente de modelos especializados de MoE para aprendizado profundo eficiente e escalável

A pesquisa em inteligência artificial (IA) tem se concentrado cada vez mais em melhorar a eficiência e a robustez dos modelos de aprendizagem profunda. Esses modelos revolucionaram o processamento de linguagem natural, a visão computacional e a análise de dados, mas apresentam desafios computacionais significativos. Especificamente, à medida que os modelos crescem, eles exigem mais …

Conjunto de dados FC-AMF-OCR extraído LightOn: um conjunto de dados de 9,3 milhões de imagens de documentos financeiros com anotações completas de OCR

Conjunto de dados FC-AMF-OCR extraído LightOn: um conjunto de dados de 9,3 milhões de imagens de documentos financeiros com anotações completas de OCR

Lançamento de Conjunto de dados FC-AMF-OCR com LightOn representa um marco significativo no reconhecimento óptico de caracteres (OCR) e no aprendizado de máquina. Este conjunto de dados é um avanço técnico e é a base para futuras pesquisas em Inteligência Artificial (IA) e visão computacional. A introdução de tal conjunto de dados abre novas oportunidades …

LASR: um novo método de aprendizado de máquina para regressão simbólica usando modelos de linguagem em grande escala

LASR: um novo método de aprendizado de máquina para regressão simbólica usando modelos de linguagem em grande escala

A regressão exponencial é um método estatístico avançado para encontrar equações estatísticas que melhor descrevem um conjunto de dados. Ao contrário da regressão convencional, que ajusta os dados a modelos predefinidos, a regressão logística procura propriedades estatísticas subjacentes a partir do zero. Esta abordagem ganhou destaque em campos científicos como física, química e biologia, onde …

Sketch: um kit de ferramentas de IA inovador projetado para reverter o desempenho do LLM em diferentes campos

Sketch: um kit de ferramentas de IA inovador projetado para reverter o desempenho do LLM em diferentes campos

Modelos linguísticos de larga escala (LLMs) revolucionaram o processamento de linguagem natural, mostrando notáveis ​​capacidades de generalização em uma ampla variedade de tarefas. No entanto, devido à fraca adesão às instruções, estes modelos enfrentam um desafio significativo na produção de resultados formatados corretamente, como JSON. Esta limitação representa um obstáculo significativo para aplicações orientadas por …