Os modelos linguísticos de grande escala (LLMs) revolucionaram a forma como as máquinas processam e reproduzem a linguagem humana, mas a sua capacidade de raciocinar eficazmente numa vasta gama de tarefas continua a ser um grande desafio. Os pesquisadores em IA estão trabalhando para permitir que esses modelos não apenas compreendam a linguagem, mas também …
DeepSeek AI lança Janus: um modelo multimodal 1.3B com poder de geração de imagens
Os modelos multimodais de IA são ferramentas poderosas, capazes de compreender e gerar conteúdo visual. No entanto, os métodos existentes utilizam frequentemente um único codificador virtual para ambas as tarefas, resultando num fraco desempenho devido às necessidades muito diferentes de compreensão e processamento. A compreensão requer abstração semântica de alto nível, enquanto a geração se …
Avaliação de vulnerabilidade de agentes LLM: benchmark AgentHarm para resiliência contra ataques de jailbreak
A pesquisa sobre a resiliência dos LLMs a ataques de jailbreak concentrou-se principalmente em aplicativos de chatbot, onde os usuários trapaceiam para contornar as medidas de segurança. No entanto, os agentes LLM, que utilizam ferramentas externas e realizam operações em várias etapas, apresentam o risco de uso indevido, especialmente em situações maliciosas, como encomendar itens …
OpenAI lança aplicativo ChatGPT para Windows
O aplicativo ChatGPT para Windows lançado recentemente (versão beta) da OpenAI visa enfrentar vários desafios e criar uma experiência de usuário muito mais simples para indivíduos e empresas. Um dos problemas mais importantes que procura resolver é a necessidade de acesso rápido e contínuo à assistência de IA, sem depender de um navegador da web. …
Lançado PyTorch 2.5: melhorando a eficiência e robustez do aprendizado de máquina
A comunidade PyTorch tem estado na vanguarda do desenvolvimento de estruturas de aprendizado de máquina para atender às crescentes necessidades de pesquisadores, cientistas de dados e desenvolvedores de IA em todo o mundo. Com o recente lançamento do PyTorch 2.5, a equipe pretende enfrentar vários desafios enfrentados pela comunidade de ML, com foco particular na …
Katanemo Open Sources Arch-Function: uma coleção de modelos de grande linguagem (LLMs) que prometem velocidade mais rápida em funções de chamada funcional para fluxos de trabalho de agentes
Um dos maiores desafios que as organizações enfrentam é usar modelos de linguagem em larga escala (LLMs) para lidar com fluxos de trabalho complexos de forma eficaz. Problemas de velocidade, flexibilidade e robustez muitas vezes impedem a automação do fluxo de trabalho que precisa ser integrado em vários sistemas. As empresas lutam com o ambiente …
Do ONNX à incorporação estática: o que torna os conversores de frases v3.2.0 uma virada de jogo?
Há uma necessidade crescente de incorporar modelos que equilibrem precisão, eficiência e flexibilidade. Os modelos existentes muitas vezes lutam para alcançar esse equilíbrio, especialmente em situações que vão desde utilidades de baixo desempenho até aplicações de alto valor. A necessidade de incorporação de alto desempenho e alta qualidade impulsionou o desenvolvimento de novas soluções para …
CodeJudge: uma estrutura de aprendizado de máquina usando LLMs para medir a produção de código sem a necessidade de casos de teste
A Inteligência Artificial está avançando exponencialmente e os Modelos Avançados de Linguagem demonstraram uma capacidade incrível de compreender a entrada de texto humana. Além da simples análise de texto e geração de código, os LLMs têm mostrado resultados promissores no desenvolvimento de software. No entanto, com o aumento da complexidade, fornecer testes de qualidade de …
Este artigo sobre IA fornece uma estrutura de IA para prevenir ataques ponto a ponto em serviços veiculares para microrredes
Os serviços móveis de veículo para microrrede (V2M) permitem que veículos elétricos forneçam ou armazenem energia para redes elétricas locais, melhorando a estabilidade e a flexibilidade da rede. A IA é fundamental para otimizar a distribuição de energia, prever a procura e gerir as interações em tempo real entre os veículos e a microrrede. No …
Meissonic: um modelo de síntese de texto para imagem não autorregressivo que pode produzir imagens de alta resolução
Modelos de Linguagem em Grande Escala (LLMs) mostraram progresso notável em tarefas de processamento de linguagem natural, incentivando os pesquisadores a explorar abordagens semelhantes para integração de texto e imagem. Ao mesmo tempo, os modelos de distribuição tornaram-se o método dominante na produção visual. No entanto, as diferenças funcionais entre estas duas abordagens apresentam um …