O campo da IA está a desenvolver-se rapidamente, especialmente em áreas que requerem competências de pensamento profundo. No entanto, muitos dos modelos maiores que existem têm um foco restrito e funcionam melhor em áreas com resultados claros e mensuráveis, como estatísticas, codificação ou processos de tomada de decisão bem definidos. Esta limitação torna-se aparente quando …
Pesquisadores do MIT desenvolvem uma maneira eficiente de treinar agentes confiáveis de IA | Notícias do MIT
Campos que vão da robótica à medicina e à ciência política estão tentando treinar sistemas de IA para tomar decisões racionais de todos os tipos. Por exemplo, a utilização de um sistema de IA para gerir de forma inteligente o trânsito numa cidade congestionada pode ajudar os condutores a chegar mais rapidamente aos seus destinos, …
Allen Institute for AI (AI2) lança Tülu 3: uma coleção de modelos de aprendizagem avançada com dados totalmente abertos, código de avaliação e algoritmos de treinamento.
O Allen Institute for AI (AI2) anunciou o lançamento do Silêncio 3uma família moderna de modelos de acompanhamento de instruções projetados para estabelecer um novo padrão em recursos de IA. Esta versão inclui recursos, métodos e ferramentas de última geração, fornecendo aos pesquisadores e desenvolvedores uma solução completa e de código aberto. Com o Tülu …
Microsoft Research apresenta Reducio-DiT: Melhora o desempenho da produção de vídeo com compactação avançada
Avanços recentes nos modelos de produção de vídeo permitiram a produção de videoclipes realistas e de alta qualidade. No entanto, esses modelos enfrentam desafios na escalabilidade para aplicações do mundo real em larga escala devido aos requisitos computacionais necessários para treinamento e compreensão. Os modelos comerciais atuais, como Sora, Runway Gen-3 e Movie Gen, exigem …
Black Forest Labs lança ferramentas FLUX.1: um conjunto de modelos de IA projetados para adicionar controle e robustez ao modelo de base de texto para imagem FLUX.1
Num mundo onde o conteúdo visual é tão importante, a capacidade de criar e manipular imagens com precisão e criatividade é extremamente importante. Black Forest Labs, com suas ferramentas FLUX.1, amplia as possibilidades de geração de texto para imagem. Projetada para trazer controle e flexibilidade ao seu modelo básico, o FLUX.1, esta série de ferramentas …
Melhorando o monitoramento de árvores urbanas com gêmeos digitais alimentados por IA | Notícias do MIT
O filósofo irlandês George Berkely, mais conhecido por sua teoria da impermanência, certa vez ponderou: “Se uma árvore cai na floresta e ninguém a ouve, ela faz algum som?” E quanto às árvores geradas por IA? Provavelmente não farão barulho, mas serão essenciais para aplicações como adaptação de plantas urbanas e mudanças climáticas. Para esse …
SmolTalk lançado: a melhor receita de conjunto de dados dos bastidores para SmolLM2
Avanços recentes no processamento de linguagem natural (PNL) introduziram novos modelos e conjuntos de dados de treinamento destinados a atender às crescentes necessidades de modelos de linguagem eficientes e precisos. No entanto, estes desenvolvimentos também trazem desafios significativos. A maioria dos modelos linguísticos de grande escala (LLMs) lutam para equilibrar desempenho e eficiência, muitas vezes …
Inteligência Artificial, IA e Computação Quântica: Transformando Fronteiras Computacionais
A computação quântica (CQ) está na vanguarda da inovação tecnológica, prometendo potencial revolucionário em todos os domínios científicos e industriais. Os pesquisadores observam que a realização desse potencial depende do desenvolvimento de supercomputadores quânticos rápidos que integrem perfeitamente hardware quântico tolerante a falhas com sistemas de computação avançados. Essas arquiteturas complexas são projetadas para resolver …
MORCELA: Uma nova abordagem de IA para correlacionar pontuações LM de modelos linguísticos com julgamentos de aceitabilidade humana
No processamento de linguagem natural (PNL), uma questão importante é como as probabilidades geradas pelos modelos linguísticos (LMs) correspondem ao comportamento humano. Este alinhamento é frequentemente avaliado comparando as pontuações LM com os julgamentos de aceitabilidade humana, que avaliam o quão natural uma frase parece. Estudos anteriores, como os que utilizam SLOR (Syntactic Log-Odds Ratio), …
Seleção de dados específicos do trabalho: uma abordagem prática para otimizar o desempenho e o desempenho do ajuste fino
No campo em desenvolvimento do aprendizado de máquina, modelos baseados em otimização, como BERT ou LLAMA, para tarefas downstream específicas tornaram-se a norma. No entanto, o sucesso desta otimização depende não só do modelo, mas também muito da qualidade e adequação dos dados de treino. Com grandes repositórios como o Common Crawl contendo bilhões de …