Conheça HuatuoGPT-o1: um LLM médico projetado para pensamento médico avançado

A Inteligência Artificial Médica (IA) é promissora, mas traz seu próprio conjunto de desafios. Ao contrário dos problemas matemáticos simples, as tarefas médicas muitas vezes exigem um nível mais profundo de pensamento para apoiar o diagnóstico e o tratamento no mundo real. A complexidade e a diversidade das condições médicas dificultam a garantia de processos de pensamento eficazes. Como resultado, grandes modelos linguísticos específicos de saúde (LLMs) muitas vezes não conseguem fornecer a precisão e a confiabilidade necessárias para aplicações de ponta. Preencher essas lacunas requer abordagens criativas para treinamento de dados e design de modelo – isso é um esforço HuatuoGPT-o1 pretende alcançar.

O que é HuatuoGPT-o1?

Uma equipe de pesquisadores da Universidade Chinesa de Hong Kong e do Instituto de Pesquisa de Big Data de Shenzhen apresenta o HuatuoGPT-o1: um LLM médico projetado para desenvolver habilidades de pensamento no domínio da saúde.. Foi criado usando um conjunto de dados de 40.000 problemas médicos cuidadosamente selecionados e verificados. Este modelo vai além dos LLMs de propósito geral e de domínio específico, seguindo um processo de aprendizagem em duas etapas. Primeiro, desenvolve habilidades de pensamento complexo por meio da repetição orientada por feedback. Em segundo lugar, melhora estas competências através da aprendizagem por reforço (RL). Essa abordagem dupla permite que o HuatuoGPT-o1 crie cadeias de pensamento (CoT) detalhadas, refine iterativamente suas respostas e alinhe suas soluções com os resultados de validação. Essas habilidades tornam-no uma ferramenta valiosa para enfrentar os desafios complexos do raciocínio médico.

	A espinha dorsal	Idiomas Suportados	Link
HuatuoGPT-o1-8B	LLaMA-3.1-8B	Inglês	Ligação HF
HuatuoGPT-o1-70B	LLaMA-3.1-70B	Inglês	Ligação HF
HuatuoGPT-o1-7B	Q2.5-7B	Inglês e Chinês	Ligação HF
HuatuoGPT-o1-72B	Q2.5-72B	Inglês e Chinês	Ligação HF

Avanços Tecnológicos

O desenvolvimento do HuatuoGPT-o1 trouxe várias melhorias importantes. O conjunto de dados de treinamento é retirado de ensaios clínicos desafiadores, transformados em problemas abertos com respostas únicas e significativas. O validador clínico, desenvolvido em GPT-4o, avalia a validade das soluções, permitindo ao modelo desenvolver métodos de raciocínio robustos. Esses métodos são integrados ao modelo durante o ajuste fino, o que incentiva o pensamento reflexivo e iterativo.

Na segunda fase, a aprendizagem por reforço – especificamente a Otimização de Política Proximal (PPO) – é usada para melhorar ainda mais o modelo. Alguns prêmios do guia para verificar esse processo, o que ajuda o HuatuoGPT-o1 a refinar sua precisão de imagem. Esta abordagem passo a passo para a resolução de problemas garante que o modelo possa atender com eficácia às necessidades de aplicações médicas do mundo real.

Desempenho e resultados

HuatuoGPT-o1 mostrou resultados impressionantes em vários benchmarks. EU A versão de 8 bilhões de parâmetros proporcionou uma melhoria de 8,5 pontos em relação à sua linha de base, enquanto a versão de 70 bilhões de parâmetros superou os principais LLMs específicos da área médica em conjuntos de dados como MedQA e PubMedQA. Sua capacidade de bom desempenho em conjuntos de dados tradicionais e complexos ressalta suas fortes capacidades de inferência.

A pesquisa sobre ablação enfatizou a importância de um processo de treinamento modelo em duas etapas. Os modelos que ignoraram o aprendizado por reforço apresentaram desempenho mais fraco, destacando o número de aprimoramentos de CoT e aprimoramentos de RL direcionados ao confirmador. Além disso, o verificador médico demonstrou grande confiabilidade, alcançando uma taxa de precisão de 96,5% durante a primeira fase de treinamento – uma prova de seu papel crítico em todo o processo.

A conclusão

HuatuoGPT-o1 representa um avanço lógico na IA médica. Ao combinar técnicas avançadas de pensamento com um processo de treinamento sistemático, aborda desafios de longa data em pensamento e validação. O seu sucesso, alcançado com um pequeno conjunto de dados, destaca o impacto de métodos de formação bem pensados. À medida que a IA continua a avançar nos cuidados de saúde, modelos como o HuatuoGPT-o1 têm o potencial de melhorar a precisão do diagnóstico e o planeamento do tratamento, estabelecendo uma referência para desenvolvimentos futuros neste campo.

Confira Papel de novo Página GitHub. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Não se esqueça de participar do nosso SubReddit de 60k + ML.

🚨 Tendências: LG AI Research Release EXAONE 3.5: Modelos de três níveis de IA bilíngue de código aberto oferecem seguimento de comando incomparável e insights profundos de conteúdo Liderança global em excelência em IA generativa….

Asif Razzaq é o CEO da Marktechpost Media Inc. Como empresário e engenheiro visionário, Asif está empenhado em aproveitar o poder da Inteligência Artificial em benefício da sociedade. Seu mais recente empreendimento é o lançamento da Plataforma de Mídia de Inteligência Artificial, Marktechpost, que se destaca por sua ampla cobertura de histórias de aprendizado de máquina e aprendizado profundo que parecem tecnicamente sólidas e facilmente compreendidas por um amplo público. A plataforma possui mais de 2 milhões de visualizações mensais, o que mostra sua popularidade entre o público.

🧵🧵 [Download] Avaliação do relatório do modelo de risco linguístico principal (ampliado)

Source link

O que é HuatuoGPT-o1?

Avanços Tecnológicos

Desempenho e resultados

A conclusão

Você também pode gostar...

10 playgrounds de IA gratuitos para experimentar

Integrando a previsão do próximo token e a distribuição de vídeo em visão computacional e robótica | Notícias do MIT

MIT lança novo programa de pós-graduação em tecnologia musical e computação | Notícias do MIT

Deixe um comentário Cancelar resposta