A demanda por modelos personalizáveis e de código aberto que possam funcionar bem em uma variedade de plataformas de hardware tem crescido, e a Meta está na vanguarda para atender a essa demanda. Meta abriu o código para o lançamento de Lama 3.2com LLMs de visão pequena e média (11B e 90B) e modelos leves …
Uma nova abordagem de IA para redes de simulação múltipla para hipergrafos restritos
A esparsificação de gráficos é uma ferramenta fundamental na ciência da computação teórica que ajuda a reduzir o tamanho de um gráfico sem perder características importantes. Embora muitos métodos de esparsificação tenham sido introduzidos, os problemas de particionamento e corte de hipergrafos tornaram-se mais importantes devido à sua ampla aplicação e aos desafios teóricos. Os …
PromSec: um algoritmo de IA para desenvolvimento rápido de geração de código segura e eficiente usando LLM
O desenvolvimento de software se beneficiou muito do uso de Modelos de Linguagem em Grande Escala (LLMs) para produzir código-fonte de alta qualidade, principalmente porque as tarefas de codificação agora levam menos tempo e dinheiro para serem concluídas. No entanto, apesar destas vantagens, os LLMs produzem frequentemente código que, embora funcional, muitas vezes apresenta falhas …
Minish Lab lança Model2Vec: uma ferramenta de IA para extrair modelos pequenos e super-rápidos de qualquer conversor de frases
Minish Lab acaba de ser lançado Modelo2Vecuma ferramenta de transformação projetada para integrar modelos pequenos e rápidos de qualquer transformador de frases. Com esta inovação, o Minish Lab pretende fornecer aos pesquisadores e desenvolvedores uma maneira mais eficiente de lidar com tarefas de processamento de linguagem natural (PNL). Model2Vec permite o preenchimento rápido de modelos …
Subgrupos: uma biblioteca Python aberta para descoberta de subgrupos funcionais e personalizáveis
Subgroup Discovery (SD) é uma técnica de aprendizado de máquina supervisionada usada para analisar dados experimentais para identificar relacionamentos (subgrupos) dentro de um conjunto de dados relacionados a uma variável alvo. Os principais componentes dos algoritmos SD incluem a estratégia de busca, que avalia o espaço de busca do problema, e a medida de qualidade, …
Replicação de pensamento: uma estrutura de IA para melhorar as respostas de LLM, gerando alertas acionadores de “pensamento”
Os modelos de linguagem em larga escala (LLMs) revolucionaram o processamento de linguagem natural, permitindo que os sistemas de IA executem uma variedade de tarefas com experiência incrível. No entanto, os investigadores enfrentam desafios significativos na melhoria do desempenho do LLM, especialmente na interação humana com o LLM. Uma observação importante revela que a qualidade …
AdvDGMs: Melhorando a robustez de conflitos no Tableau Machine Learning integrando camadas de ajuste de restrições para geração de ataques virtuais e baseados em domínio
O aprendizado de máquina adversário é um campo em crescimento que se concentra em testar e melhorar a robustez dos sistemas de aprendizado de máquina (ML) com exemplos adversários. Esses modelos são criados alterando sutilmente os dados para induzir os modelos a fazerem previsões incorretas. Os modelos generativos profundos (DGMs) têm se mostrado promissores na …
Modelos de difusão simples: ajuste fino para estimativa de profundidade rápida e altamente precisa
A estimativa de profundidade monocular (MDE) desempenha um papel importante em várias aplicações, incluindo edição de imagens e vídeos, reconstrução de cenas, síntese de novas cenas e navegação de robôs. Porém, este trabalho apresenta grandes desafios devido à incerteza da faixa de escala, o que o impossibilita. Os métodos baseados na aprendizagem devem utilizar um …
Classificação adaptativa de imagens: treinando grandes redes neurais convolucionais no conjunto de dados ImageNet
Treinando uma grande CNN para classificação de imagens:Os pesquisadores desenvolveram uma CNN em grande escala para classificar 1,2 milhão de imagens de alta resolução da competição ImageNet LSVRC-2010, que inclui 1.000 categorias. O modelo, que contém 60 milhões de parâmetros e 650.000 neurônios, alcançou resultados surpreendentes, com erros top-1 e top-5 erros de 37,5% e …
Como o cérebro tensor usa incorporação e imagens para integrar sinais sensoriais e determinar?
Nos campos mais avançados da neurociência e da Inteligência Artificial (IA), o objetivo de compreender e modelar a cognição humana levou à criação de modelos complexos que tentam simular funções cerebrais complexas. O cérebro tensor, uma estrutura computacional criada para simular a forma como o cérebro interpreta e armazena informações, é um exemplo desse modelo. …