Pesquisadores de Stanford apresentam ZIP-FIT: uma nova estrutura de IA de seleção de dados que escolhe compactação em vez de incorporação para ajustar modelos para funções específicas de domínio

Pesquisadores de Stanford apresentam ZIP-FIT: uma nova estrutura de IA de seleção de dados que escolhe compactação em vez de incorporação para ajustar modelos para funções específicas de domínio

Selecionar dados específicos de domínio é uma arte complexa, especialmente se quisermos obter os resultados desejados a partir de modelos de linguagem. Até agora, os investigadores concentraram-se na criação de diversos conjuntos de dados entre tarefas, que se revelaram úteis para formação de uso geral. No entanto, para a otimização específica de domínios e tarefas, …

A anatomia completa da IA ​​ambiental na saúde: um guia de 5 minutos

A anatomia completa da IA ​​ambiental na saúde: um guia de 5 minutos

Como vimos no passado com o surgimento dos modelos Gen AI e GPT, a compreensão contextual está mudando o jogo na forma como os modelos de IA são integrados à vida humana. À medida que as respostas e ações iniciadas pela IA circundante são independentes, consideradas e monitorizadas, os seus efeitos no setor da saúde …

Pesquisadores da JetBrains apresentam CoqPilot: um plug-in para geração de provas baseada em LLM

Pesquisadores da JetBrains apresentam CoqPilot: um plug-in para geração de provas baseada em LLM

Nos últimos anos, a verificação formal de software ganhou destaque, especialmente em áreas onde a confiabilidade do software é importante, como engenharia aeroespacial, finanças e saúde. Assistentes de prova como Coq contribuíram para a validação de software, permitindo que os desenvolvedores criassem provas matemáticas para validar seu código. No entanto, redigir tais provas legais é …

Jupyter Releaser: lançamento fácil de software para o ecossistema Jupyter

Jupyter Releaser: lançamento fácil de software para o ecossistema Jupyter

A comunidade de código aberto e os desenvolvedores de todo o mundo conhecem bem os desafios que acompanham o gerenciamento de lançamento de software. Desde manter a consistência na forma como os lançamentos são tratados em diferentes repositórios até os processos manuais tediosos e propensos a erros envolvidos, o lançamento de novas versões de software …

LongRAG: uma estrutura RAG robusta para respostas longas a consultas de conteúdo

LongRAG: uma estrutura RAG robusta para respostas longas a consultas de conteúdo

Os Modelos de Grandes Idiomas (LLMs) revolucionaram a resposta a perguntas em textos longos (LCQA), uma tarefa complexa que requer pensar em textos extensos para fornecer respostas precisas. Embora os LLMs mais recentes com conteúdo longo, como Gemini e GPT4-128k, possam processar todos os documentos diretamente, eles enfrentam o fenômeno de “perda no meio”, onde …

Pesquisadores da Intel e da Salesforce propõem SynthKG: um fluxo de trabalho de síntese de gráficos de conhecimento sem ontologia em nível de documento em várias etapas baseado em LLMs.

Pesquisadores da Intel e da Salesforce propõem SynthKG: um fluxo de trabalho de síntese de gráficos de conhecimento sem ontologia em nível de documento em várias etapas baseado em LLMs.

A integração do Knowledge Graph (KG) beneficia a pesquisa de inteligência artificial porque pode criar representações de conhecimento estruturadas a partir de dados textuais extensos e não estruturados. Esses gráficos estruturados têm aplicações importantes em áreas que exigem recuperação e raciocínio de informações, como resposta a consultas, resumo complexo de dados e geração avançada de …

LLMWare apresenta Model Depot: uma coleção abrangente de modelos de linguagem pequena (SLMs) para PCs Intel

LLMWare apresenta Model Depot: uma coleção abrangente de modelos de linguagem pequena (SLMs) para PCs Intel

LLMWare.ai, pioneira no lançamento e otimização de Small Language Models (SLMs), anunciou hoje o lançamento do Hugging Face's Model Depot, uma das maiores coleções de SLMs para PCs Intel. Com mais de 100 modelos cobrindo uma ampla gama de casos de uso, como modelos de conversação, codificação, estatística, chamada de tarefa e incorporação, o Model …

10 playgrounds de IA gratuitos para experimentar

10 playgrounds de IA gratuitos para experimentar

Curioso sobre o futuro da IA? Quer ver por si mesmo como a IA pode criar escrita, código ou arte criativa? Os playgrounds de IA oferecem experiência prática para explorar as possibilidades ilimitadas da inteligência artificial. Aqui está uma lista de dez plataformas gratuitas que oferecem o poder de moldar o futuro da IA. Primeiro, …

Este artigo sobre IA apresenta correspondência de covariância total para modelos de distribuição eficientes

Este artigo sobre IA apresenta correspondência de covariância total para modelos de distribuição eficientes

Os modelos de distribuição de probabilidade são importantes para gerar estruturas de dados complexas, como imagens e vídeos. Esses modelos transformam ruído aleatório em dados estruturados, alcançando alto realismo e usabilidade em diversos domínios. O modelo funciona em dois estágios: um estágio avançado que corrompe gradualmente os dados com ruído e um estágio reverso que …

GeoCoder: Melhorando o raciocínio geométrico em modelos de linguagem visual com ajuste fino de código modular e memória aumentada de recuperação

GeoCoder: Melhorando o raciocínio geométrico em modelos de linguagem visual com ajuste fino de código modular e memória aumentada de recuperação

A resolução de problemas de geometria depende muito de habilidades de pensamento avançadas para interpretar informações visuais, processar questões e aplicar fórmulas matemáticas com precisão. Embora os modelos de linguagem visual (VLMs) tenham mostrado progresso em tarefas multimodais, eles ainda enfrentam limitações significativas em geometria, especialmente na execução de operações matemáticas não padronizadas, como o …