Nos últimos anos, o desenvolvimento de simulações realistas e robustas de agentes semelhantes aos humanos tornou-se um problema complexo e recorrente no campo da inteligência artificial (IA) e da ciência da computação. Um desafio fundamental sempre foi modelar o comportamento humano com precisão satisfatória. Os métodos tradicionais frequentemente envolviam o uso de sistemas baseados em …
Nexusflow lança Athena-V2: conjunto de modelos aberto 72B comparado ao GPT-4o em todos os benchmarks
Nos últimos anos, modelos linguísticos de grande escala (LLMs) tornaram-se a base da IA, de chatbots poderosos, de assistentes virtuais e de uma variedade de aplicações complexas. Apesar do seu sucesso, surgiu um grande problema: a acumulação de leis de escala que historicamente impulsionam o desenvolvimento de modelos. Simplificando, a construção de modelos maiores não …
A Microsoft lançou LLM2CLIP: uma nova abordagem para IA, onde LLM funciona como professor do Visual Encoder do CLIP.
No mundo de hoje, GRAMPO é um dos modelos multimodais básicos mais importantes. Ele combina sinais visuais e textuais em um espaço de recursos compartilhado usando perda de aprendizagem diferencial para pares de imagens de texto grandes. Como detector, o CLIP suporta muitas funções, incluindo classificação zero-shot, detecção, classificação e recuperação de texto de imagem. …
BLIP3-KALE: um conjunto de dados de código aberto de 218 milhões de pares de imagens que transformam legendas com descrições densas e aumentadas por informações
A legendagem de imagens teve um progresso notável, mas ainda existem desafios significativos, especialmente na criação de legendas significativas e factuais. Conjuntos de dados de legendas de imagens tradicionais, como aqueles que dependem inteiramente de legendas artificiais geradas por modelos de linguagem visual (VLMs) ou texto da web copiado por alt, muitas vezes carecem de …
Fixie AI apresenta Ultravox v0.4.1: uma família de modelos de fala aberta especialmente treinados para fornecer conversação em tempo real com LLMs e outros pesos abertos para GPT-4o em tempo real
Interagir perfeitamente com a inteligência artificial em tempo real sempre foi um desafio para desenvolvedores e pesquisadores. O maior desafio reside em combinar informações de múltiplos processos – como texto, imagens e áudio – para criar um sistema de conversação coerente. Apesar dos avanços nos principais modelos de linguagem, como o GPT-4, muitos sistemas de …
FineTuneBench: testa a capacidade do LLM de inserir e atualizar informações por meio do ajuste fino
A necessidade de aperfeiçoar os LLMs para incorporar novos conhecimentos e atualizar os conhecimentos existentes está a aumentar. Embora empresas como OpenAI e Google ofereçam APIs de ajuste fino que permitem a personalização do LLM, sua eficácia na atualização de informações ainda precisa ser determinada. LLMs aplicados em áreas como software e medicina exigem conhecimento …
Lançamento antecipado do OpenAI em janeiro: agentes de IA definidos para automatizar a vida cotidiana
A OpenAI, pioneira em tecnologia de inteligência artificial, está se preparando para lançar seu próximo grande salto: os agentes de IA. Conforme anunciado em muitos relatórios, incl TechCrunch, Bloombergde novo A beiraespera-se que novos agentes de IA da OpenAI comecem já em janeiro de 2024. Esses agentes de IA, considerados ferramentas autônomas capazes de realizar …
Pesquisadores da Snowflake e CMU apresentam SuffixDecoding: um novo método livre de modelo para acelerar a sumarização de modelos de linguagem grande (LLM) com decodificação inferencial
Os modelos de linguagem em larga escala (LLMs) estão rapidamente se tornando uma parte fundamental das aplicações atuais de consumo e de negócios. No entanto, a necessidade de geração rápida de tokens continua sendo um desafio constante, tornando-se muitas vezes um gargalo para aplicações emergentes. Por exemplo, a última tendência em escalas de tempo preditivas …
Nous Research lança dois novos projetos: Forge Reasoning API Beta e Nous Chat
Nos últimos anos, a comunicação alimentada por IA evoluiu rapidamente, mas ainda persistem desafios para melhorar o pensamento e a eficiência em tempo real. A maioria dos modelos de linguagem natural atuais, embora impressionantes na produção de respostas semelhantes às humanas, lutam com a velocidade, a flexibilidade e o poder crescente de raciocínio. Estas deficiências …
Pesquisadores da CMU propõem OpenFLAME: um serviço integrado e localmente descentralizado
Os mapas são amplamente utilizados atualmente e são úteis para muitos aplicativos baseados em localização, incluindo navegação, compartilhamento de viagens, monitoramento de condicionamento físico, jogos, robótica e realidade aumentada. À medida que a tecnologia de localização interna avança, há necessidade de um serviço de mapeamento colaborativo que possa gerenciar ambientes internos e privados e, ao …