Principais conjuntos de dados abertos para projetos de ML

Principais conjuntos de dados abertos para projetos de ML

Ao trabalhar em projetos de aprendizado de máquina na área da saúde, o acesso a conjuntos de dados abertos e gratuitos é essencial. Eles fornecem a base para o desenvolvimento de modelos eficazes, mas encontrá-los pode ser um desafio. Para ajudá-lo a começar, aqui estão 19 excelentes conjuntos de dados que podem apoiar seu trabalho …

DELTA: um novo método de IA que rastreia com eficácia (10x mais rápido) cada pixel no espaço 3D a partir de vídeos monoculares

DELTA: um novo método de IA que rastreia com eficácia (10x mais rápido) cada pixel no espaço 3D a partir de vídeos monoculares

Rastrear movimentos 3D densos a partir de vídeos monoculares continua sendo um desafio, especialmente quando se busca precisão no nível de pixel em sequências longas. Os métodos existentes enfrentam desafios na obtenção de rastreamento 3D detalhado porque geralmente rastreiam apenas alguns pontos, o que requer mais detalhes para compreender a cena completa. Eles também exigem …

Shaip democratiza o acesso a dados críticos de saúde em parceria com o Databricks Marketplace

Shaip democratiza o acesso a dados críticos de saúde em parceria com o Databricks Marketplace

Louisville, Kentucky, EUA, 5 de novembro de 2024: Shaip, líder global em soluções de dados de IA, anunciou hoje a listagem de seus registros eletrônicos de saúde (EHR) e conjuntos de dados de fala de ditado médico no Databricks Marketplace. Esta parceria com a Databricks, uma empresa de dados e IA, proporciona aos profissionais de …

Anthropic apresenta o soneto Claude 3.5: IA que entende texto, imagens e muito mais em PDFs

Anthropic apresenta o soneto Claude 3.5: IA que entende texto, imagens e muito mais em PDFs

A sobrecarga de informações apresenta desafios significativos na extração de informações de documentos que contêm texto e imagens, como tabelas, gráficos e imagens. Apesar dos avanços nos modelos linguísticos, a análise destes textos multimodais continua difícil. Os modelos convencionais de IA limitam-se à interpretação de texto simples, muitas vezes lutando para processar recursos visuais complexos …

Lançado Fish Agent v0.1 3B: um modelo básico de voz para voz capaz de capturar e gerar informações de áudio espacial com precisão sem precedentes

Lançado Fish Agent v0.1 3B: um modelo básico de voz para voz capaz de capturar e gerar informações de áudio espacial com precisão sem precedentes

Os sistemas atuais de conversão de texto em fala (TTS), como VALL-E e Fastspeech, enfrentam desafios persistentes relacionados ao processamento de recursos linguísticos complexos, ao gerenciamento de fala polifônica e à produção de fala multilíngue rica. Essas limitações tornam-se particularmente aparentes quando se lida com palavras polifônicas dependentes do contexto e quando se combinam diferentes …

UniMTS: um processo de treinamento pré-convergência para séries temporais de movimento combinando vários objetos e recursos de dispositivos ocultos

UniMTS: um processo de treinamento pré-convergência para séries temporais de movimento combinando vários objetos e recursos de dispositivos ocultos

Reconhecimento de movimento humano o uso de séries temporais de dispositivos móveis e vestíveis é frequentemente usado como principal informação de contexto para diversas aplicações, desde monitoramento do estado de saúde até análise de desempenho esportivo e estudos de comportamento do usuário. No entanto, a recolha de dados de séries temporais de movimentos em grande …

Tencent lança modelo Hunyuan-Large (Hunyuan-MoE-A52B): novo modelo MoE baseado em transformador de código aberto com total de 389 bilhões de parâmetros e 52 milhões de parâmetros funcionais

Tencent lança modelo Hunyuan-Large (Hunyuan-MoE-A52B): novo modelo MoE baseado em transformador de código aberto com total de 389 bilhões de parâmetros e 52 milhões de parâmetros funcionais

Modelos linguísticos de grande escala (LLMs) têm sido a espinha dorsal de muitos sistemas de IA, contribuindo enormemente para o desenvolvimento do processamento de linguagem natural (PNL), da visão computacional e da pesquisa científica. No entanto, esses modelos apresentam seu próprio conjunto de desafios. À medida que cresce a procura por melhores capacidades de IA, …

Conheça a simulação de fluxo estocástico: uma estrutura de IA para mapear espaço latente de baixa resolução, combinando com eficiência alvos de alta resolução

Conheça a simulação de fluxo estocástico: uma estrutura de IA para mapear espaço latente de baixa resolução, combinando com eficiência alvos de alta resolução

A ciência atmosférica e a meteorologia fizeram recentemente progressos na caracterização do tempo e do clima locais, capturando a variabilidade em escala precisa que é essencial para previsões e planeamento precisos. A física atmosférica de pequena escala, incluindo os detalhes complexos de padrões de tempestades, gradientes de temperatura e eventos locais, exige que dados de …

Descobrindo biomarcadores de AVC isquêmico: o aprendizado de máquina encontra a transcriptômica unicelular

Descobrindo biomarcadores de AVC isquêmico: o aprendizado de máquina encontra a transcriptômica unicelular

O AVC isquêmico (AI) é uma das principais causas de incapacidade e morte no mundo. É causada por coágulos sanguíneos nas artérias que levam ao cérebro. É importante dissolver o coágulo num período de cerca de 4,5 horas para evitar que chegue ao cérebro e cause danos às células cerebrais ou mesmo morte celular. Existem …

Melhorando o pré-treinamento de modelos de IA em grande escala para pesquisa educacional: uma abordagem eficiente em termos de recursos

Melhorando o pré-treinamento de modelos de IA em grande escala para pesquisa educacional: uma abordagem eficiente em termos de recursos

O estado da investigação em IA enfrenta grandes desafios devido às enormes exigências computacionais de grandes modelos de linguagem pré-treinados e modelos de percepção. O treinamento, mesmo de modelos modestos, requer grandes recursos; por exemplo, Pythia-1B requer 64 GPUs por três dias, enquanto RoBERTa requer 1.000 GPUs por um dia. Essa barreira computacional afeta os …