Grandes modelos de linguagem podem fazer coisas impressionantes, como escrever poesia ou criar programas de computador funcionais, embora esses modelos sejam treinados para prever as próximas palavras em um trecho de texto. Essas habilidades incríveis podem fazer parecer que os modelos estão aprendendo alguns fatos gerais sobre o mundo. Mas esse não é realmente o …
OpenAI apresenta recurso de 'resultados previstos': acelerando o GPT-4o em aproximadamente 5x para tarefas como edição de documentos ou refatoração de código
O uso de grandes modelos de linguagem, como GPT-4o e GPT-4o-mini, trouxe avanços significativos no processamento de linguagem natural, permitindo respostas de alta qualidade, reescrita de documentos e melhorias de produtividade em muitos aplicativos. No entanto, um dos maiores desafios que esses modelos enfrentam é a latência. Seja atualizando uma postagem de blog ou corrigindo …
O que precisamos saber sobre IA no reconhecimento de emoções em 2024
IA no reconhecimento de emoções – principais casos de uso A capacidade das máquinas de compreender as nossas emoções subjacentes pode abrir caminho para avanços que podem elevar a saúde e o estilo de vida humanos. Vejamos algumas das maneiras mais benéficas de usar essa tecnologia. Entenda a saúde emocional Uma das maiores preocupações em …
Lançado OuteTTS-0.1-350M: um novo modelo de conversão de texto em fala (TTS) usando um modelo de linguagem pura sem adaptadores externos
Nos últimos anos, o campo da integração de conversão de texto em voz (TTS) tem registado um rápido desenvolvimento, mas ainda está cheio de desafios. Os modelos tradicionais de TTS geralmente dependem de arquiteturas complexas, incluindo redes neurais profundas com módulos especializados, como codificadores de voz, analisadores de texto e outros adaptadores, para sintetizar a …
Habilitando pesquisas sobre racismo sistêmico no MIT e além | Notícias do MIT
No início do século 20, WEB Du Bois escreveu sobre as condições e a cultura dos negros na Filadélfia, documentando também as atitudes e crenças racistas que permeavam a comunidade branca circundante. Explicou como os resultados desiguais em áreas como a saúde podem ser atribuídos não só aos estereótipos raciais, mas também ao racismo enraizado …
Artista e designer Es Devlin recebe o Prêmio Eugene McDermott nas artes no MIT | Notícias do MIT
O artista e designer Es Devlin recebeu o Prêmio Eugene McDermott de Artes de 2025 no MIT. O prémio de 100.000 dólares, que será atribuído numa cerimónia em sua homenagem, inclui também uma residência artística no MIT na primavera de 2025, onde Es Devlin apresentará o seu trabalho numa palestra pública no dia 1 de …
MDAgents: uma estrutura multiagente dinâmica para tomada de decisão médica aprimorada com modelos de linguagem em larga escala
Os modelos básicos são promissores na medicina, especialmente no auxílio a tarefas complexas, como a tomada de decisões médicas (MDM). O MDM é um processo complexo que exige que os médicos analisem diversas fontes de dados – como imagens, registros eletrônicos de saúde e informações genéticas – enquanto se adaptam às novas pesquisas médicas. Os …
A previsão e a interpretação no contexto transformam o aprendizado nas regras de escala bayesiana
Grandes Modelos de Linguagem (LLMs) demonstraram habilidades notáveis de aprendizagem no conteúdo (ICL), onde podem aprender tarefas a partir de demonstrações sem precisar de treinamento adicional. Um desafio importante neste campo é compreender e prever a relação entre o número de determinados displays e a melhoria do desempenho do modelo, conhecida como curva ICL. Estas …
ShadowKV: um sistema de alta definição para inferência LLM de longo alcance
Os modelos linguísticos de grande escala (LLMs) estão melhorando na estimativa e no tratamento de instâncias longas. Como são utilizados em larga escala, tem havido uma necessidade crescente de suporte eficaz para projeções de alto desempenho. No entanto, a implementação adequada desses LLMs de longo contexto apresenta desafios relacionados ao cache de valor-chave (KV), que …
EDLM: um novo modelo de linguagem baseado em energia incorporado em uma estrutura de difusão
Avanços recentes na modelagem de linguagem generativa avançaram no processamento de linguagem natural, tornando possível criar texto consistente e rico em contexto em uma ampla variedade de aplicações. Os modelos autorregressivos (AR) geram texto na ordem da esquerda para a direita e são amplamente utilizados em tarefas como codificação e raciocínio complexo. Porém, esses modelos …