Acelerando a simulação de fase de campo com aprendizado de máquina: conjunto de dados de referência e validação U-Net

Acelerando a simulação de fase de campo com aprendizado de máquina: conjunto de dados de referência e validação U-Net

Os modelos de campo de fase servem como um meio importante de simulação em mesoescala, combinando modelos em escala atômica e fenômenos macroscópicos, descrevendo a evolução microestrutural e as transformações de fase. Esses modelos extraem informações espaciais gratuitas de densidade de energia de medições em pequena escala e as utilizam para prever o comportamento em …

aiOla lança Whisper-NER: um modelo de IA de código aberto para transcrição colaborativa de fala e reconhecimento de negócios

aiOla lança Whisper-NER: um modelo de IA de código aberto para transcrição colaborativa de fala e reconhecimento de negócios

A tecnologia de reconhecimento de fala fez progressos significativos, com avanços na IA melhorando a acessibilidade e a precisão. No entanto, ainda enfrenta desafios, especialmente na compreensão de entidades faladas, como palavras, lugares e palavras específicas. A questão não é apenas converter a fala em texto com precisão, mas também extrair contexto significativo em tempo …

Pesquisadores da CMU propõem XGrammar: uma biblioteca de código aberto para geração funcional, flexível e portátil

Pesquisadores da CMU propõem XGrammar: uma biblioteca de código aberto para geração funcional, flexível e portátil

O campo da manufatura planejada tornou-se importante com o crescimento dos LLMs. Esses modelos, capazes de produzir texto semelhante ao humano, agora têm a tarefa de produzir resultados que sigam formatos rígidos, como JSON, SQL e outras linguagens específicas de domínio. Aplicações como geração de código, controle de robôs e investigação estruturada dependem fortemente dessas …

Conheça a CircleMind: a startup de IA que está revolucionando a recuperação de geração aumentada com gráficos de conhecimento e PageRank

Conheça a CircleMind: a startup de IA que está revolucionando a recuperação de geração aumentada com gráficos de conhecimento e PageRank

Numa era de sobrecarga de informação, o desenvolvimento da IA ​​requer não apenas novas tecnologias, mas também formas inteligentes de processar e compreender dados. Conheça um ao outro CírculoMindé uma startup de IA que reinventa a Geração Aumentada de Recuperação (RAG) usando gráficos de conhecimento e um algoritmo PageRank padronizado. Financiado pela Y Combinator, o …

Desvendando como os transformadores de visão entendem as relações objetais: uma abordagem em duas etapas para a comunicação visual

Desvendando como os transformadores de visão entendem as relações objetais: uma abordagem em duas etapas para a comunicação visual

Apesar do sucesso dos Vision Transformers (ViTs) em tarefas como segmentação e renderização de imagens, eles enfrentam desafios significativos no tratamento de tarefas abstratas que envolvem relacionamentos entre objetos. Uma limitação importante é a dificuldade em executar com precisão tarefas de correlação visual, como determinar se dois objetos são iguais ou diferentes. O raciocínio relacional, …

WebDreamer: Melhorando a navegação na Web com programação baseada em modelo baseada em LLM

WebDreamer: Melhorando a navegação na Web com programação baseada em modelo baseada em LLM

O planejamento estratégico em inteligência artificial atingiu níveis significativos, especialmente na obtenção de desempenho sobre-humano em jogos complexos como Go. Modelos de linguagem em larga escala (LLMs) combinados com algoritmos de programação avançados mostraram melhorias significativas em tarefas complexas de raciocínio. No entanto, surgem vários desafios significativos quando estas capacidades são utilizadas em ambientes baseados …

Neural Magic lança compressor LLM: uma nova biblioteca para compactação de LLMs para entrada rápida com vLLM

Neural Magic lança compressor LLM: uma nova biblioteca para compactação de LLMs para entrada rápida com vLLM

Neural Magic lançou o Compressor LLMuma ferramenta avançada de desenvolvimento de modelos em grande escala que permite inferência muito rápida com compactação avançada de modelos. Portanto, a ferramenta é um importante alicerce na busca da Neural Magic de disponibilizar soluções eficientes de código aberto para a comunidade de aprendizagem profunda, especialmente dentro da estrutura vLLM. …

Guia de treinamento gratuito (TFG): uma estrutura integrada de aprendizado de máquina para geração condicional de modelos distribuídos com melhor desempenho e flexibilidade em todos os domínios

Guia de treinamento gratuito (TFG): uma estrutura integrada de aprendizado de máquina para geração condicional de modelos distribuídos com melhor desempenho e flexibilidade em todos os domínios

Os modelos de difusão surgiram como ferramentas revolucionárias em aprendizado de máquina, fornecendo recursos incomparáveis ​​para gerar amostras de alta qualidade em todos os domínios, como fusão de imagens, estrutura molecular e geração de áudio. Esses modelos funcionam refinando iterativamente os dados ruidosos para corresponder à distribuição desejada, usando procedimentos avançados de remoção de ruído. …

Investigadores da OpenAI propõem método de aprendizado por reforço em várias etapas para melhorar o LLM Red Team

Investigadores da OpenAI propõem método de aprendizado por reforço em várias etapas para melhorar o LLM Red Team

À medida que o uso de modelos linguísticos de grande escala (LLMs) se torna mais difundido em todas as aplicações do mundo real, a preocupação com a sua vulnerabilidade cresce proporcionalmente. Apesar das suas capacidades, os LLMs ainda são vulneráveis ​​a ataques adversários, incluindo aqueles que geram conteúdo tóxico, revelam informações confidenciais ou permitem injeção …

Pesquisadores da Universidade de Maryland e da Adobe apresentam o DynaSaur: um agente LLM que se torna mais inteligente ao criar scripts para seus trabalhos

Pesquisadores da Universidade de Maryland e da Adobe apresentam o DynaSaur: um agente LLM que se torna mais inteligente ao criar scripts para seus trabalhos

Os sistemas tradicionais de agentes de modelagem de linguagem em larga escala (LLM) enfrentam desafios significativos quando aplicados a situações do mundo real devido à sua flexibilidade e adaptabilidade limitadas. Os agentes LLM existentes normalmente selecionam ações de um conjunto predefinido de possibilidades em cada ponto de decisão, uma estratégia que funciona bem em ambientes …