A rápida ascensão da IA foi alimentada por modelos de linguagem poderosos, que estão transformando setores desde o atendimento ao cliente até a criação de conteúdo. No entanto, muitas línguas, especialmente as de pequenas comunidades linguísticas, não têm acesso a ferramentas avançadas de IA. O vietnamita, falado por mais de 90 milhões de pessoas, é …
Pesquisadores da MBZUAI lançam Atlas-Chat (2B, 9B e 27B): uma família de instruções de modelos abertos preparadas para Darija (árabe marroquino)
O processamento de linguagem natural (PNL) fez grandes avanços nos últimos anos, particularmente com o uso de modelos linguísticos de larga escala (LLMs). No entanto, um dos principais problemas desses LLMs é que eles se concentram demais em idiomas ricos em dados, como o inglês, deixando para trás muitos idiomas e dialetos sub-representados. O árabe …
Nova pesquisa do Google DeepMind revela novo tipo de vulnerabilidade que pode recompensar as informações dos usuários no modelo MoE
A abordagem regulatória dos modelos do MoE levanta um grande desafio de privacidade. Otimize o desempenho do modelo de macrolinguagem LLM selecionando apenas uma pequena parte do total de parâmetros disponíveis e, ao mesmo tempo, simplificando a extração de dados conflitantes por meio de interações dependentes de caminho. Esta vulnerabilidade, que aparentemente existe com o …
LLM-KT: uma estrutura flexível para o desenvolvimento de modelos de filtragem interativos com recursos incorporados desenvolvidos por LLM
A Filtragem Colaborativa (CF) é amplamente usada em sistemas de recomendação para combinar as preferências do usuário com os objetos, mas muitas vezes enfrenta problemas com relacionamentos complexos e adaptação às mudanças nas interações do usuário. Recentemente, os pesquisadores exploraram o uso de LLMs para melhorar as recomendações usando suas habilidades de raciocínio. Os LLMs …
SelfCodeAlign: uma estrutura de IA aberta e transparente para LLMs de código de treinamento que supera modelos maiores sem reduzir custos ou anotações
A inteligência artificial revolucionou a geração de código, com modelos de linguagem em larga escala (LLMs) de códigos agora essenciais para a engenharia de software. Esses modelos oferecem suporte a tarefas de integração, depuração e otimização de código por meio da análise de grandes bases de código. No entanto, o desenvolvimento destes LLMs orientados a …
Pesquisadores da Microsoft revelam Magentic-One: um sistema modular multiagente focado em melhorar a flexibilidade da IA e a conclusão de tarefas em testes de benchmark
Os sistemas Agentic são um ramo progressivo da inteligência artificial que visa criar soluções que possam gerenciar automaticamente tarefas complexas e de várias etapas em vários ambientes. Esses sistemas vão além do escopo típico dos modelos de aprendizado de máquina, incorporando capacidades que lhes permitem perceber e agir em ambientes digitais do mundo real, integrando …
Uma teoria causal para estudar relações genéticas de causa e efeito | Notícias do MIT
Ao estudar as mudanças na expressão genética, os investigadores aprendem como as células funcionam a nível molecular, o que pode ajudá-los a compreender o desenvolvimento de certas doenças. Mas uma pessoa tem cerca de 20 mil genes que podem interagir de maneiras complexas, portanto, mesmo saber quais grupos de genes atingir é um problema muito …
NVIDIA AI apresenta MM-Shumeka: o primeiro recuperador multimodal que alcança resultados SOTA no benchmark multimodal M-BEIR
No mundo da recuperação de informação, uma das tarefas mais desafiadoras é criar um sistema que possa compreender e encontrar facilmente o conteúdo certo em diferentes formatos, como texto e imagens, sem perder a precisão. A maioria dos modelos de recuperação de última geração ainda funciona de uma maneira – seja recuperação de texto para …
Meta AI apresenta AdaCache: um método de treinamento gratuito para acelerar transformadores de difusão de vídeo (DiTs)
A produção de vídeo rapidamente se tornou uma área de foco na pesquisa em inteligência artificial, particularmente na produção de vídeos consistentes e de alta fidelidade. Esta área envolve a criação de sequências de vídeo que mantêm a consistência visual entre os quadros e preservam os detalhes ao longo do tempo. Modelos de aprendizado de …
Um sistema de iluminação portátil que pode digitalizar objetos do cotidiano | Notícias do MIT
Quando Nikola Tesla previu que teríamos telefones celulares que poderiam exibir vídeos, fotos e muito mais, seu canto parecia um sonho distante. Quase 100 anos depois, os smartphones são como um apêndice extra para a maioria de nós. Os engenheiros de digitalização estão agora trabalhando para aumentar a capacidade de exibição de outros objetos do …