20 repositórios GitHub para dominar o processamento de linguagem natural (PNL)

20 repositórios GitHub para dominar o processamento de linguagem natural (PNL)

O Processamento de Linguagem Natural (PNL) é um campo em rápido crescimento que lida com a interação entre computadores e a linguagem humana. À medida que a PNL continua a evoluir, há uma necessidade crescente de profissionais qualificados para desenvolver novas soluções para diversas aplicações, como chatbots, análise de sentimentos e tradução automática. Para ajudá-lo …

Capturando semelhanças: uma estrutura para analisar representações e exemplos emocionais

Capturando semelhanças: uma estrutura para analisar representações e exemplos emocionais

Para determinar se dois sistemas biológicos ou artificiais processam informações da mesma maneira, diferentes métodos de similaridade são usados, como regressão linear, alinhamento centrado no kernel (CKA), similaridade de Bures normalizada (NBS) e distância angular de Procrustes. Apesar de sua popularidade, os fatores que contribuem para pontuações altas semelhantes e o que define boas pontuações …

OCR (Ocline Character Recognition) – Definição, vantagens, desafios e casos de uso [Infographic]

OCR (Ocline Character Recognition) – Definição, vantagens, desafios e casos de uso [Infographic]

OCR é uma tecnologia que permite que máquinas leiam textos e imagens impressos. É frequentemente usado em aplicações comerciais, como digitalização de documentos para armazenamento ou processamento, e em aplicações de consumo, como digitalização de recibos para reembolso de despesas. Source link

Anthropic adiciona uma nova ferramenta de análise ao Claude que pode escrever e executar código para realizar estatísticas e analisar dados de CSVs

Anthropic adiciona uma nova ferramenta de análise ao Claude que pode escrever e executar código para realizar estatísticas e analisar dados de CSVs

A tecnologia avançada de IA trouxe formas fundamentais de lidar com dados. Para muitas organizações e indivíduos, gerir e analisar dados de forma eficaz é um desafio constante. Um dos principais problemas que os usuários têm enfrentado tem sido o tempo e o conhecimento técnico necessários para realizar análises aprofundadas dos conjuntos de dados. Além …

Microsoft AI lança modelo OmniParser no HuggingFace: um módulo compacto de análise de tela que pode transformar capturas de tela da interface do usuário em objetos editáveis

Microsoft AI lança modelo OmniParser no HuggingFace: um módulo compacto de análise de tela que pode transformar capturas de tela da interface do usuário em objetos editáveis

As interfaces gráficas do usuário (GUIs) são onipresentes, seja em computadores desktop, dispositivos móveis ou sistemas embarcados, fornecendo uma ponte intuitiva entre usuários e atividades digitais. No entanto, automatizar as interações com essas GUIs apresenta um desafio significativo. Esta lacuna é particularmente evidente na construção de agentes inteligentes que possam compreender e executar tarefas baseadas …

Meta AI lança novas versões quantizadas do Llama 3.2 (1B e 3B): oferece aumento de até 2 a 4x na velocidade de computação e redução de 56% no tamanho do modelo

Meta AI lança novas versões quantizadas do Llama 3.2 (1B e 3B): oferece aumento de até 2 a 4x na velocidade de computação e redução de 56% no tamanho do modelo

O rápido crescimento dos principais modelos linguísticos (LLMs) trouxe grandes progressos em vários campos, mas também trouxe grandes desafios. Modelos como o Llama 3 fizeram avanços dramáticos na compreensão e produção de linguagem natural, porém seu tamanho e requisitos computacionais muitas vezes limitaram seu desempenho. Os elevados custos de energia, os longos tempos de formação …

Salesforce AI Research apresenta BLIP-3-Video: um modelo de linguagem de modem para vídeos projetado para capturar com eficiência informações transitórias em vários quadros

Salesforce AI Research apresenta BLIP-3-Video: um modelo de linguagem de modem para vídeos projetado para capturar com eficiência informações transitórias em vários quadros

Os modelos de linguagem visual (VLMs) estão ganhando destaque na inteligência artificial devido à sua capacidade de combinar dados visuais e textuais. Esses modelos desempenham um papel importante em áreas como compreensão de vídeo, interação humano-computador e aplicações multimídia, fornecendo ferramentas para responder perguntas, gerar insights e melhorar a tomada de decisões com base na …

Otimização adaptativa de dados (ADO): um novo algoritmo para distribuição de dados dinâmicos em aprendizado de máquina, reduzindo a complexidade e melhorando a precisão do modelo

Otimização adaptativa de dados (ADO): um novo algoritmo para distribuição de dados dinâmicos em aprendizado de máquina, reduzindo a complexidade e melhorando a precisão do modelo

O aprendizado de máquina, especialmente o treinamento de grandes modelos de base, é altamente dependente da variedade e da qualidade dos dados. Esses modelos, pré-treinados em vários conjuntos de dados, são a base de muitas aplicações modernas de IA, incluindo processamento de linguagem, reconhecimento de imagens e muito mais. O desempenho dos modelos básicos depende …

Salesforce AI Research propõe avaliação programática de VLM (PROVE): um novo paradigma de avaliação para avaliar respostas de VLM a perguntas abertas

Salesforce AI Research propõe avaliação programática de VLM (PROVE): um novo paradigma de avaliação para avaliar respostas de VLM a perguntas abertas

Os Modelos de Visão-Linguagem (VLMs) estão sendo cada vez mais usados ​​para responder perguntas sobre conteúdo visual. Apesar do progresso, muitas vezes sofrem de um grande problema: produzir respostas sonoras, mas incorretas, também conhecidas como alucinações. Estas alucinações podem levar à desconfiança nestes sistemas, especialmente em aplicações de alto desempenho do mundo real. Avaliar a …

Starbucks: uma nova estratégia de treinamento de IA para modelos de incorporação semelhantes a Matryoshka, incluindo fases de ajuste fino e pré-treinamento.

Starbucks: uma nova estratégia de treinamento de IA para modelos de incorporação semelhantes a Matryoshka, incluindo fases de ajuste fino e pré-treinamento.

No aprendizado de máquina, a incorporação é amplamente utilizada para representar dados em um espaço vetorial unidimensional compactado. Eles capturam bem as relações semânticas na execução de tarefas como classificação de texto, análise de sentimento, etc. No entanto, eles acham difícil capturar os relacionamentos complexos nas estruturas hierárquicas complexas dos dados. Isso leva a um …