Arquivo de Inteligência artificial

Uma revisão sistemática da literatura: estratégias para desenvolver e acelerar LLMs

por Mundo Tecnologiaatualizado em 18/09/202418/09/2024Deixe um comentário

Os principais modelos linguísticos (LLMs) tiveram um sucesso notável no processamento de linguagem natural (PNL). Grandes modelos de aprendizagem profunda, especialmente arquiteturas baseadas em transformadores, cresceram exponencialmente em tamanho e complexidade, atingindo bilhões a bilhões de parâmetros. No entanto, eles apresentam desafios significativos nos recursos de computação e no uso de memória. Mesmo as GPUs …

Inteligência artificial

NiNo: um novo método de aprendizado de máquina para acelerar o treinamento de redes neurais usando interação de neurônios e nowcasting

por Mundo Tecnologiaatualizado em 18/09/202418/09/2024Deixe um comentário

No aprendizado profundo, a otimização de redes neurais tem sido uma importante área de foco. O treinamento de grandes modelos, como transformadores e redes de comunicação, requer recursos computacionais e tempo significativos. Os pesquisadores têm testado técnicas avançadas de desenvolvimento para tornar esse processo mais eficiente. Tradicionalmente, otimizadores adaptativos como Adam têm sido usados para …

Inteligência artificial

Comet apresenta Opik: uma ferramenta completa de código aberto para testes LLM ponta a ponta, rastreamento rápido e testes de pré-implantação com integração perfeita.

por Mundo Tecnologiaatualizado em 17/09/202417/09/2024Deixe um comentário

O cometa foi revelado Opikuma plataforma de código aberto projetada para melhorar a visualização e avaliação de modelos linguísticos de grande escala (LLMs). Esta ferramenta foi projetada para desenvolvedores e cientistas de dados monitorarem, testarem e rastrearem aplicativos LLM desde o desenvolvimento até a produção. Opik fornece uma lista abrangente de recursos que simplificam o …

Inteligência artificial

Conjunto de dados sintético-GSM8K-Reflection-405B de código aberto Gretel AI: melhorando o treinamento do modelo de IA por meio de raciocínio em várias etapas, técnicas de inferência e cenários de solução de problemas do mundo real

por Mundo Tecnologiaatualizado em 17/09/202417/09/2024Deixe um comentário

Com a IA, há uma necessidade crescente de conjuntos de dados de alta qualidade que possam apoiar o treinamento e o teste de modelos em diferentes domínios. Um desses marcos é a disponibilidade aberta de Sintético-GSM8K-reflexão-405B O conjunto de dados Gretel.ai, que é uma promessa significativa para tarefas cognitivas, especialmente aquelas que exigem habilidades de …

Inteligência artificial

Microsoft Research testa inconsistências GPT-4 na execução de tarefas prescritivas: analisando o impacto de pequenas mudanças no desempenho da IA

por Mundo Tecnologiaatualizado em 17/09/202417/09/2024Deixe um comentário

Modelos linguísticos de grande escala (LLMs), como o GPT-4, tornaram-se o foco da inteligência artificial devido à sua capacidade de lidar com uma variedade de tarefas, desde a geração de texto até a resolução de problemas matemáticos complexos. Esses modelos mostraram poder além de sua estrutura original, especialmente para prever a próxima palavra em uma …

Inteligência artificial

O que está prejudicando os programas de conversão de texto em fala – e como podemos corrigi-los? Este artigo de IA apresenta pesquisa de alinhamento super monotônico

por Mundo Tecnologiaatualizado em 17/09/202417/09/2024Deixe um comentário

Um grande desafio nos sistemas de conversão de texto em fala (TTS) são as ineficiências computacionais do algoritmo Monotonic Alignment Search (MAS), responsável por estimar o alinhamento entre sequências de texto e fala. O MAS enfrenta grandes dificuldades de tempo, especialmente quando se trata de grandes insumos. A complexidade é O(T×S), onde T é o …

Inteligência artificial

FLUX.1-dev-LoRA-AntiBlur lançado pela equipe Shakker AI: Avanço na geração de imagens com profundidade de campo aprimorada e alta resolução

por Mundo Tecnologiaatualizado em 17/09/202417/09/2024Deixe um comentário

A liberação de FLUX.1-dev-LoRA-AntiBlur pelo Shakker AI Group marca um avanço significativo na tecnologia de geração de imagens. Este novo LoRA ativo (Low-Rank Adaptation), desenvolvido e especialmente treinado no FLUX.1-dev por Vadim Fedenkotraz uma nova solução para o desafio de manter a qualidade da imagem e, ao mesmo tempo, melhorar a profundidade de campo (DoF), …

Inteligência artificial

Repensando o treinamento LLM: a promessa dos métodos de aprendizagem por reforço cruzado

por Mundo Tecnologiaatualizado em 16/09/202416/09/2024Deixe um comentário

Modelos linguísticos de grande escala (LLMs) têm recebido atenção significativa no campo da inteligência artificial, principalmente devido à sua capacidade de simular o conhecimento humano usando extensos conjuntos de dados. Os métodos atuais para treinar esses modelos dependem fortemente de simulação, especificamente a previsão do próximo token usando a razão de máxima verossimilhança (MLE) durante …

Inteligência artificial

Otimizando a colaboração LLM para soluções mais inteligentes e eficientes | Notícias do MIT

por Mundo Tecnologiaatualizado em 16/09/202416/09/2024Deixe um comentário

Já lhe fizeram uma pergunta para a qual você só sabe parte da resposta? Para dar uma resposta informada, o melhor a fazer seria ligar para um amigo que tenha mais conhecimento no assunto. Este processo colaborativo também pode ajudar os principais tipos linguísticos (LLMs) a melhorar a sua precisão. No entanto, tem sido difícil …

Inteligência artificial

Pesquisadores do Google DeepMind propõem alinhamento de modelos de percepção centrados no ser humano para melhorar a generalização e interpretação da IA

por Mundo Tecnologiaatualizado em 16/09/202416/09/2024Deixe um comentário

A aprendizagem profunda fez avanços significativos na inteligência artificial, particularmente no processamento de linguagem natural e na visão computacional. No entanto, mesmo os sistemas mais avançados falham frequentemente de formas que os humanos não falhariam, realçando a lacuna crítica entre a inteligência artificial e a humana. Essas diferenças alimentaram debates sobre se as redes neurais …