Arcee AI lança Arcee-VyLinh: um poderoso modelo de linguagem pequena vietnamita 3B

Arcee AI lança Arcee-VyLinh: um poderoso modelo de linguagem pequena vietnamita 3B

A rápida ascensão da IA ​​foi alimentada por modelos de linguagem poderosos, que estão transformando setores desde o atendimento ao cliente até a criação de conteúdo. No entanto, muitas línguas, especialmente as de pequenas comunidades linguísticas, não têm acesso a ferramentas avançadas de IA. O vietnamita, falado por mais de 90 milhões de pessoas, é …

Pesquisadores da MBZUAI lançam Atlas-Chat (2B, 9B e 27B): uma família de instruções de modelos abertos preparadas para Darija (árabe marroquino)

Pesquisadores da MBZUAI lançam Atlas-Chat (2B, 9B e 27B): uma família de instruções de modelos abertos preparadas para Darija (árabe marroquino)

O processamento de linguagem natural (PNL) fez grandes avanços nos últimos anos, particularmente com o uso de modelos linguísticos de larga escala (LLMs). No entanto, um dos principais problemas desses LLMs é que eles se concentram demais em idiomas ricos em dados, como o inglês, deixando para trás muitos idiomas e dialetos sub-representados. O árabe …

Nova pesquisa do Google DeepMind revela novo tipo de vulnerabilidade que pode recompensar as informações dos usuários no modelo MoE

Nova pesquisa do Google DeepMind revela novo tipo de vulnerabilidade que pode recompensar as informações dos usuários no modelo MoE

A abordagem regulatória dos modelos do MoE levanta um grande desafio de privacidade. Otimize o desempenho do modelo de macrolinguagem LLM selecionando apenas uma pequena parte do total de parâmetros disponíveis e, ao mesmo tempo, simplificando a extração de dados conflitantes por meio de interações dependentes de caminho. Esta vulnerabilidade, que aparentemente existe com o …

LLM-KT: uma estrutura flexível para o desenvolvimento de modelos de filtragem interativos com recursos incorporados desenvolvidos por LLM

LLM-KT: uma estrutura flexível para o desenvolvimento de modelos de filtragem interativos com recursos incorporados desenvolvidos por LLM

A Filtragem Colaborativa (CF) é amplamente usada em sistemas de recomendação para combinar as preferências do usuário com os objetos, mas muitas vezes enfrenta problemas com relacionamentos complexos e adaptação às mudanças nas interações do usuário. Recentemente, os pesquisadores exploraram o uso de LLMs para melhorar as recomendações usando suas habilidades de raciocínio. Os LLMs …

SelfCodeAlign: uma estrutura de IA aberta e transparente para LLMs de código de treinamento que supera modelos maiores sem reduzir custos ou anotações

SelfCodeAlign: uma estrutura de IA aberta e transparente para LLMs de código de treinamento que supera modelos maiores sem reduzir custos ou anotações

A inteligência artificial revolucionou a geração de código, com modelos de linguagem em larga escala (LLMs) de códigos agora essenciais para a engenharia de software. Esses modelos oferecem suporte a tarefas de integração, depuração e otimização de código por meio da análise de grandes bases de código. No entanto, o desenvolvimento destes LLMs orientados a …

Pesquisadores da Microsoft revelam Magentic-One: um sistema modular multiagente focado em melhorar a flexibilidade da IA ​​e a conclusão de tarefas em testes de benchmark

Pesquisadores da Microsoft revelam Magentic-One: um sistema modular multiagente focado em melhorar a flexibilidade da IA ​​e a conclusão de tarefas em testes de benchmark

Os sistemas Agentic são um ramo progressivo da inteligência artificial que visa criar soluções que possam gerenciar automaticamente tarefas complexas e de várias etapas em vários ambientes. Esses sistemas vão além do escopo típico dos modelos de aprendizado de máquina, incorporando capacidades que lhes permitem perceber e agir em ambientes digitais do mundo real, integrando …

Uma teoria causal para estudar relações genéticas de causa e efeito | Notícias do MIT

Uma teoria causal para estudar relações genéticas de causa e efeito | Notícias do MIT

Ao estudar as mudanças na expressão genética, os investigadores aprendem como as células funcionam a nível molecular, o que pode ajudá-los a compreender o desenvolvimento de certas doenças. Mas uma pessoa tem cerca de 20 mil genes que podem interagir de maneiras complexas, portanto, mesmo saber quais grupos de genes atingir é um problema muito …

NVIDIA AI apresenta MM-Shumeka: o primeiro recuperador multimodal que alcança resultados SOTA no benchmark multimodal M-BEIR

NVIDIA AI apresenta MM-Shumeka: o primeiro recuperador multimodal que alcança resultados SOTA no benchmark multimodal M-BEIR

No mundo da recuperação de informação, uma das tarefas mais desafiadoras é criar um sistema que possa compreender e encontrar facilmente o conteúdo certo em diferentes formatos, como texto e imagens, sem perder a precisão. A maioria dos modelos de recuperação de última geração ainda funciona de uma maneira – seja recuperação de texto para …

Meta AI apresenta AdaCache: um método de treinamento gratuito para acelerar transformadores de difusão de vídeo (DiTs)

Meta AI apresenta AdaCache: um método de treinamento gratuito para acelerar transformadores de difusão de vídeo (DiTs)

A produção de vídeo rapidamente se tornou uma área de foco na pesquisa em inteligência artificial, particularmente na produção de vídeos consistentes e de alta fidelidade. Esta área envolve a criação de sequências de vídeo que mantêm a consistência visual entre os quadros e preservam os detalhes ao longo do tempo. Modelos de aprendizado de …

Um sistema de iluminação portátil que pode digitalizar objetos do cotidiano | Notícias do MIT

Um sistema de iluminação portátil que pode digitalizar objetos do cotidiano | Notícias do MIT

Quando Nikola Tesla previu que teríamos telefones celulares que poderiam exibir vídeos, fotos e muito mais, seu canto parecia um sonho distante. Quase 100 anos depois, os smartphones são como um apêndice extra para a maioria de nós. Os engenheiros de digitalização estão agora trabalhando para aumentar a capacidade de exibição de outros objetos do …