A pesquisa egocêntrica é importante em muitas aplicações, desde a detecção de fraudes financeiras até a pesquisa em redes sociais, porque se concentra em um único vértice e em seus vizinhos imediatos. Estas perguntas fornecem informações sobre a conexão direta, analisando a conexão na área principal. Permitir tais pesquisas sem comprometer a privacidade torna-se mais …
Arcee AI lança SuperNova-Medius: um modelo de linguagem mínima 14B construído na arquitetura Qwen2.5-14B-Instruct
No mundo em constante evolução da inteligência artificial (IA), grandes modelos linguísticos provaram ser úteis na resolução de muitos desafios, desde a execução de tarefas complexas até à melhoria dos processos de tomada de decisão. No entanto, o dimensionamento destes modelos também introduz complexidades, tais como elevados custos computacionais, acessibilidade reduzida e o impacto ambiental …
Pesquisadores da Universidade de Stanford propõem ExPLoRA: uma abordagem de IA eficiente para aprimorar a aprendizagem por transferência para transformadores de visão pré-treinados (ViTs) sob mudanças no cenário
Métodos de ajuste fino com eficiência de parâmetros (PEFT), como adaptação de baixo nível (LoRA), permitem que grandes modelos básicos pré-treinados sejam adaptados para funções downstream usando uma pequena porcentagem (0,1%-10%) dos pesos treináveis originais . Uma área pouco explorada do PEFT estende a fase de pré-treinamento sem rótulos supervisionados – em particular, adaptando modelos …
Pesquisadores da OpenAI apresentam benchmark MLE: um novo benchmark para medir a eficácia de agentes de IA em engenharia de aprendizado de máquina
Os modelos de aprendizado de máquina (ML) mostraram resultados promissores em várias tarefas de codificação, mas ainda há uma lacuna na medição bem-sucedida das capacidades dos agentes de IA na engenharia de ML. Os benchmarks de codificação existentes testam principalmente habilidades de codificação discretas, sem medir totalmente a capacidade de executar tarefas complexas de ML, …
Pesquisadores do Google Cloud e de Stanford propõem CHASE-SQL: uma estrutura de IA para raciocínio multimodal e seleção aprimorada e otimizada de candidatos em Text-to-SQL
Uma ponte importante que conecta a linguagem humana e as linguagens de consulta estruturada (SQL) é a conversão de texto em SQL. Com sua ajuda, os usuários podem converter suas consultas de linguagem regular em comandos SQL que o banco de dados pode compreender e executar. Essa tecnologia facilita a interação dos usuários com bancos …
ACPBench de pesquisadores da IBM: uma referência de IA para avaliação de empregos de consultoria no setor de planejamento
Os LLMs estão ganhando impulso à medida que trabalhadores de todas as áreas exploram a inteligência artificial e a automação para agilizar seu trabalho e tomar decisões críticas. Portanto, os modelos generativos e fundamentais são utilizados para tarefas de pensamento em várias etapas para alcançar o planeamento e a ação da equidade humana. Embora esta …
CausalMM: uma estrutura de inferência causal usando modelos causais construídos em modelos de linguagem de grande escala (MLLMs)
Os Modelos Multimodais de Grandes Linguagens (MLLMs) fizeram progressos significativos em várias aplicações usando o poder dos modelos Transformer e seus mecanismos de atenção. No entanto, estes modelos enfrentam o desafio significativo de preconceitos inerentes aos seus parâmetros iniciais, conhecidos como modalidades anteriores, que podem impactar negativamente a qualidade da produção. O mecanismo de atenção, …
UGround: Um modelo global para GUI de aterramento virtual desenvolvido com Big Data baseado em Web sintética
Os agentes de interface gráfica do usuário (GUI) são importantes para interações automatizadas no ambiente digital, semelhante à forma como as pessoas usam software usando teclados, mouses ou telas sensíveis ao toque. Os agentes GUI podem simplificar processos complexos, como testes de software, automação web e assistência digital, navegando e manipulando automaticamente elementos GUI. Esses …
OpenAI lança Swarm: uma estrutura experimental de IA para construir, orquestrar e distribuir sistemas multiagentes
No mundo em rápido desenvolvimento da inteligência artificial, um desafio que os engenheiros enfrentam é a programação de sistemas multiagentes. Estes sistemas, que incluem muitos agentes de IA que trabalham em conjunto, apresentam frequentemente dificuldades significativas de coordenação, controlo e medição. As soluções atuais são muitas vezes complexas, exigindo uma extensa alocação de recursos, dificultando …
Pesquisadores de IA do Google propõem RAG astuto: uma nova abordagem RAG para lidar com recuperação incompleta e conflito de informações para LLMs
A geração aumentada de recuperação (RAG) tornou-se o principal método para melhorar as habilidades dos LLMs, integrando conhecimento externo em seus resultados. Os métodos RAG permitem que os LLMs acessem informações adicionais de fontes externas, como bancos de dados baseados na web, literatura científica ou um domínio específico, o que melhora seu desempenho em tarefas …