Subgrupos: uma biblioteca Python aberta para descoberta de subgrupos funcionais e personalizáveis

Subgrupos: uma biblioteca Python aberta para descoberta de subgrupos funcionais e personalizáveis

Subgroup Discovery (SD) é uma técnica de aprendizado de máquina supervisionada usada para analisar dados experimentais para identificar relacionamentos (subgrupos) dentro de um conjunto de dados relacionados a uma variável alvo. Os principais componentes dos algoritmos SD incluem a estratégia de busca, que avalia o espaço de busca do problema, e a medida de qualidade, …

Replicação de pensamento: uma estrutura de IA para melhorar as respostas de LLM, gerando alertas acionadores de “pensamento”

Replicação de pensamento: uma estrutura de IA para melhorar as respostas de LLM, gerando alertas acionadores de “pensamento”

Os modelos de linguagem em larga escala (LLMs) revolucionaram o processamento de linguagem natural, permitindo que os sistemas de IA executem uma variedade de tarefas com experiência incrível. No entanto, os investigadores enfrentam desafios significativos na melhoria do desempenho do LLM, especialmente na interação humana com o LLM. Uma observação importante revela que a qualidade …

AdvDGMs: Melhorando a robustez de conflitos no Tableau Machine Learning integrando camadas de ajuste de restrições para geração de ataques virtuais e baseados em domínio

AdvDGMs: Melhorando a robustez de conflitos no Tableau Machine Learning integrando camadas de ajuste de restrições para geração de ataques virtuais e baseados em domínio

O aprendizado de máquina adversário é um campo em crescimento que se concentra em testar e melhorar a robustez dos sistemas de aprendizado de máquina (ML) com exemplos adversários. Esses modelos são criados alterando sutilmente os dados para induzir os modelos a fazerem previsões incorretas. Os modelos generativos profundos (DGMs) têm se mostrado promissores na …

Modelos de difusão simples: ajuste fino para estimativa de profundidade rápida e altamente precisa

Modelos de difusão simples: ajuste fino para estimativa de profundidade rápida e altamente precisa

A estimativa de profundidade monocular (MDE) desempenha um papel importante em várias aplicações, incluindo edição de imagens e vídeos, reconstrução de cenas, síntese de novas cenas e navegação de robôs. Porém, este trabalho apresenta grandes desafios devido à incerteza da faixa de escala, o que o impossibilita. Os métodos baseados na aprendizagem devem utilizar um …

Classificação adaptativa de imagens: treinando grandes redes neurais convolucionais no conjunto de dados ImageNet

Classificação adaptativa de imagens: treinando grandes redes neurais convolucionais no conjunto de dados ImageNet

Treinando uma grande CNN para classificação de imagens:Os pesquisadores desenvolveram uma CNN em grande escala para classificar 1,2 milhão de imagens de alta resolução da competição ImageNet LSVRC-2010, que inclui 1.000 categorias. O modelo, que contém 60 milhões de parâmetros e 650.000 neurônios, alcançou resultados surpreendentes, com erros top-1 e top-5 erros de 37,5% e …

Como o cérebro tensor usa incorporação e imagens para integrar sinais sensoriais e determinar?

Como o cérebro tensor usa incorporação e imagens para integrar sinais sensoriais e determinar?

Nos campos mais avançados da neurociência e da Inteligência Artificial (IA), o objetivo de compreender e modelar a cognição humana levou à criação de modelos complexos que tentam simular funções cerebrais complexas. O cérebro tensor, uma estrutura computacional criada para simular a forma como o cérebro interpreta e armazena informações, é um exemplo desse modelo. …

Nvidia AI lança Llama-3.1-Nemotron-51B: um novo LLM que permite a execução de cargas de trabalho 4x maiores em uma única GPU durante o direcionamento

Nvidia AI lança Llama-3.1-Nemotron-51B: um novo LLM que permite a execução de cargas de trabalho 4x maiores em uma única GPU durante o direcionamento

A Nvidia apresentou seu mais recente modelo de linguagem grande (LLM), i Lhama-3.1-Nemotron-51B. Baseado no Llama-3.1-70B da Meta, este modelo é ajustado usando métodos avançados de Pesquisa de Arquitetura Neural (NAS), resultando em um avanço em desempenho e eficiência. Projetado para caber em uma única GPU Nvidia H100, o modelo reduz significativamente o consumo de …

Google AI lança dois modelos Gemini atualizados: Gemini-1.5-Pro-002 e Gemini-1.5-Flash-002 com desempenho aprimorado e custo mais baixo

Google AI lança dois modelos Gemini atualizados: Gemini-1.5-Pro-002 e Gemini-1.5-Flash-002 com desempenho aprimorado e custo mais baixo

O Google introduziu recentemente uma atualização interessante para seus modelos Gemini ao lançar Gemini-1.5-Pro-002 e Gemini-1.5-Flash-002, oferecendo versões prontas para produção, preços reduzidos e limites de nível aumentados. Os modelos avançados proporcionam melhor desempenho em uma ampla gama de tarefas, marcando um passo importante para tornar a IA mais acessível e utilizável tanto para empresas …

3 perguntas: Devemos rotular os programas de IA como fazemos com os medicamentos prescritos? | Notícias do MIT

3 perguntas: Devemos rotular os programas de IA como fazemos com os medicamentos prescritos? | Notícias do MIT

Os sistemas de IA estão sendo cada vez mais implantados em ambientes críticos de saúde. No entanto, estes modelos por vezes produzem informações incorretas, fazem previsões tendenciosas ou falham por razões inesperadas, o que pode ter consequências graves para pacientes e enfermeiros. Em um Comentário publicado hoje em Ciência Computacional da NaturezaA professora associada do …

KnowFormer: um modelo de desenvolvimento baseado em transformador para raciocínio eficiente de gráfico de conhecimento, lidando com imperfeições e melhorando a precisão preditiva em conjuntos de dados de grande escala

KnowFormer: um modelo de desenvolvimento baseado em transformador para raciocínio eficiente de gráfico de conhecimento, lidando com imperfeições e melhorando a precisão preditiva em conjuntos de dados de grande escala

Os gráficos de conhecimento (KGs) são representações estruturadas de fatos que incluem entidades e relacionamentos entre elas. Esses gráficos se tornaram a base para inteligência artificial, processamento de linguagem natural e sistemas de recomendação. Ao organizar os dados desta forma sistemática, os gráficos de conhecimento permitem que as máquinas compreendam e pensem sobre o mundo …