Os modelos linguísticos de grande escala (LLMs) tornaram-se uma parte importante da inteligência artificial, permitindo que os sistemas compreendam, ajam e respondam à linguagem humana. Esses modelos são usados em diversos domínios, incluindo raciocínio em linguagem natural, geração de código e resolução de problemas. Os LLMs são frequentemente treinados com grandes quantidades de dados não …
Difusão de reutilização de movimento (Dr. Mo): um modelo de difusão para produção eficaz de vídeo por meio da reutilização de movimento
Usando modelos avançados de inteligência artificial, a produção de vídeo envolve a criação de imagens em movimento a partir de descrições de texto ou imagens estáticas. Esta área de pesquisa busca produzir vídeos realistas e de alta qualidade, superando grandes desafios computacionais. Os vídeos gerados por IA estão encontrando aplicações em diversos campos, como cinema, …
Vista3D: uma nova estrutura de IA para geração rápida e detalhada de objetos 3D a partir de uma única imagem usando difusão prévia
A geração anterior de modelos 3D a partir de imagens únicas enfrentou desafios. As estruturas de alimentação produziam objetos simples devido aos dados 3D limitados. Os respingos gaussianos forneceram geometria grosseira rapidamente, mas careciam de detalhes finos e consistência de visualização. O limiar de gradiente ingênuo resultou em apinhamento excessivo e inchaço da geometria. Os …
MAGICORE: Uma estrutura de IA para iteração multiagente para refinamento robusto
Técnicas de agregação em tempo de teste, como gerar e combinar múltiplas respostas, podem melhorar o desempenho do LLM, mas, em última análise, alcançar retornos decrescentes. O refinamento, onde o feedback do modelo é usado para melhorar iterativamente as respostas, apresenta outra abordagem. No entanto, enfrenta três desafios: (1) excesso de refinamento, que pode levar …
DCMAC: Comunicação personalizada baseada na demanda para aprendizado de reforço multiagente eficiente
A Aprendizagem Colaborativa por Reforço Multiagente (MARL) emergiu como uma técnica poderosa em vários domínios, incluindo controle de semáforos, robôs de enxame e redes de sensores. No entanto, o MARL enfrenta desafios significativos devido às complexas interações entre os agentes, que introduzem a não estacionariedade no ambiente. Esta descontinuidade complica o processo de aprendizagem e …
Google AI lança conjunto de dados temporais 2.5D de edifícios abertos que rastreia mudanças em edifícios nos países do sul
Os governos e as organizações humanitárias precisam de dados fiáveis sobre as mudanças nos edifícios e nas infraestruturas ao longo do tempo para gerir a urbanização, alocar recursos e responder às crises. No entanto, muitas regiões do Sul Global necessitam de mais acesso a dados de infraestruturas oportunos e precisos, o que torna difícil acompanhar …
Microsoft lança GRIN MoE: uma combinação baseada em gradiente de modelos especializados de MoE para aprendizado profundo eficiente e escalável
A pesquisa em inteligência artificial (IA) tem se concentrado cada vez mais em melhorar a eficiência e a robustez dos modelos de aprendizagem profunda. Esses modelos revolucionaram o processamento de linguagem natural, a visão computacional e a análise de dados, mas apresentam desafios computacionais significativos. Especificamente, à medida que os modelos crescem, eles exigem mais …
Conjunto de dados FC-AMF-OCR extraído LightOn: um conjunto de dados de 9,3 milhões de imagens de documentos financeiros com anotações completas de OCR
Lançamento de Conjunto de dados FC-AMF-OCR com LightOn representa um marco significativo no reconhecimento óptico de caracteres (OCR) e no aprendizado de máquina. Este conjunto de dados é um avanço técnico e é a base para futuras pesquisas em Inteligência Artificial (IA) e visão computacional. A introdução de tal conjunto de dados abre novas oportunidades …
LASR: um novo método de aprendizado de máquina para regressão simbólica usando modelos de linguagem em grande escala
A regressão exponencial é um método estatístico avançado para encontrar equações estatísticas que melhor descrevem um conjunto de dados. Ao contrário da regressão convencional, que ajusta os dados a modelos predefinidos, a regressão logística procura propriedades estatísticas subjacentes a partir do zero. Esta abordagem ganhou destaque em campos científicos como física, química e biologia, onde …
Sketch: um kit de ferramentas de IA inovador projetado para reverter o desempenho do LLM em diferentes campos
Modelos linguísticos de larga escala (LLMs) revolucionaram o processamento de linguagem natural, mostrando notáveis capacidades de generalização em uma ampla variedade de tarefas. No entanto, devido à fraca adesão às instruções, estes modelos enfrentam um desafio significativo na produção de resultados formatados corretamente, como JSON. Esta limitação representa um obstáculo significativo para aplicações orientadas por …