Conheça Hawkish 8B: um novo modelo financeiro que pode passar do nível 1 do CFA e passar do Meta 3.1-8B – instruído em benchmarks de matemática e finanças

Conheça Hawkish 8B: um novo modelo financeiro que pode passar do nível 1 do CFA e passar do Meta 3.1-8B – instruído em benchmarks de matemática e finanças

No mundo em evolução das finanças, a necessidade de modelos que forneçam insights robustos nunca foi tão grande. A análise financeira tradicional requer uma compreensão de relacionamentos complexos, indicadores macroeconômicos e nuances financeiras. Apesar dos avanços na IA, muitos modelos de linguagem enfrentam dificuldades com as complexidades dos dados financeiros. Freqüentemente, eles não têm a …

Cohere for AI lança Aya Expanse (8B e 32B): uma família multilíngue de última geração para preencher a lacuna linguística na IA

Cohere for AI lança Aya Expanse (8B e 32B): uma família multilíngue de última geração para preencher a lacuna linguística na IA

Apesar dos rápidos avanços na tecnologia linguística, ainda existe uma grande lacuna na representação em muitas línguas. Grande parte do progresso no processamento de linguagem natural (PNL) concentrou-se em línguas bem utilizadas, como o inglês, deixando muitas outras sub-representadas. Esta desigualdade significa que apenas uma pequena parte da população mundial pode beneficiar plenamente das ferramentas …

Este artigo sobre IA da Amazon e da Michigan State University apresenta uma nova abordagem de IA para melhorar a coerência de longo prazo em modelos de linguagem.

Este artigo sobre IA da Amazon e da Michigan State University apresenta uma nova abordagem de IA para melhorar a coerência de longo prazo em modelos de linguagem.

A inteligência artificial (IA) está fazendo avanços significativos no processamento de linguagem natural (PNL), concentrando-se no desenvolvimento de modelos que possam interpretar e reproduzir com precisão a linguagem humana. Os pesquisadores estão trabalhando para desenvolver modelos que capturem estruturas linguísticas complexas e gerem respostas contextuais e coerentes em conversas prolongadas. Os avanços nesta área são …

Desaprendizado mecanístico: uma nova abordagem de IA que usa interpretação de máquina para localizar e organizar componentes específicos do modelo associados a padrões de memória autênticos

Desaprendizado mecanístico: uma nova abordagem de IA que usa interpretação de máquina para localizar e organizar componentes específicos do modelo associados a padrões de memória autênticos

Os formandos em linguística (LLMs) às vezes aprendem coisas que não queremos que eles aprendam e entendam. É importante encontrar maneiras de remover ou modificar essas informações para manter a IA precisa, precisa e sob controle. Entretanto, editar ou “desler” certas informações nesses modelos é muito difícil. Os métodos padrão para fazer isso muitas vezes …

Pesquisadores do Google apresentam IMPOSSIBLE: um jogo interativo generativo infinito baseado em modelos generativos de IA

Pesquisadores do Google apresentam IMPOSSIBLE: um jogo interativo generativo infinito baseado em modelos generativos de IA

Os jogos podem ser considerados finitos ou infinitos. Os jogos finalizados são organizados para alcançar um resultado específico, com regras definidas, limites e um final claro. Em contraste, os jogos intermináveis ​​concentram-se em continuar a jogar indefinidamente, ajustando regras e limites. A maioria dos videogames tradicionais são limitados porque as limitações de programação e design …

Pesquisadores da Meta AI apresentam um modelo de recompensa do pesquisador em nível de token (TLDR) para fornecer anotações bem caracterizadas de modelos de linguagem de grandes ideias

Pesquisadores da Meta AI apresentam um modelo de recompensa do pesquisador em nível de token (TLDR) para fornecer anotações bem caracterizadas de modelos de linguagem de grandes ideias

Os Vision Language Models (VLMs) mostraram capacidades notáveis ​​na produção de texto semelhante ao humano em resposta a imagens, com exemplos notáveis, incluindo os modelos GPT-4, Gemini, PaLiGemma, LLaVA e Llama 3 Vision. No entanto, estes modelos produzem frequentemente conteúdos com visualizações negativas que não têm base adequada nas imagens de referência, o que evidencia …

Zipu AI lança GLM-4-Voice: um novo modelo de linguagem grande de ponta a ponta

Zipu AI lança GLM-4-Voice: um novo modelo de linguagem grande de ponta a ponta

No mundo em desenvolvimento da inteligência artificial, um dos desafios mais persistentes tem sido colmatar a lacuna entre as máquinas e as interações humanas. Os modelos modernos de IA são excelentes na geração de texto, na compreensão de imagens e até na criação de conteúdo visual, mas a fala – a principal forma de comunicação …

IBM Developers lança Bee Agent Framework: uma estrutura de IA de código aberto para construir, implantar e servir fluxos de trabalho agentes poderosos em escala

IBM Developers lança Bee Agent Framework: uma estrutura de IA de código aberto para construir, implantar e servir fluxos de trabalho agentes poderosos em escala

Nos últimos anos, os fluxos de trabalho e a automação orientados por IA avançaram significativamente. No entanto, construir um fluxo de trabalho de agente complexo, escalável e eficiente ainda é um grande desafio. As complexidades de controlar agentes, gerenciar seus estados e integrá-los perfeitamente a aplicações mais amplas não são triviais. Os desenvolvedores precisam de …

Pesquisadores da CMU propõem agentes da Web baseados em API: uma nova abordagem de IA para agentes da Web, permitindo-lhes usar APIs além das técnicas tradicionais de navegação na Web

Pesquisadores da CMU propõem agentes da Web baseados em API: uma nova abordagem de IA para agentes da Web, permitindo-lhes usar APIs além das técnicas tradicionais de navegação na Web

Os agentes de IA tornaram-se ferramentas essenciais para navegar em espaços web e fazer compras online, gerenciar projetos e navegar em conteúdo. Normalmente, esses agentes imitam ações humanas, como clicar e rolar, em sites projetados principalmente para visualização e interação humana. Embora útil, esse método de navegação na web impõe limites à eficiência da máquina, …

Este artigo sobre IA da Meta AI revela o Dualformer: pensamento controlado e lento e trilhas de pensamento aleatório, tomada de decisões de IA

Este artigo sobre IA da Meta AI revela o Dualformer: pensamento controlado e lento e trilhas de pensamento aleatório, tomada de decisões de IA

Um grande desafio na pesquisa em IA é como desenvolver modelos que possam equilibrar o pensamento rápido e intuitivo e o pensamento lento e detalhado de forma eficiente. A cognição humana funciona por meio de dois sistemas: Sistema 1, que é rápido e intuitivo, e Sistema 2, que é mais lento, porém mais analítico. Nos …