MentalArena: uma estrutura de IA de autojogo projetada para treinar modelos linguísticos para diagnóstico e tratamento de psiquiatria.

No mundo acelerado e conectado de hoje, a saúde mental é mais importante do que nunca. As pressões constantes do trabalho, das redes sociais e dos eventos globais podem afetar o nosso bem-estar emocional e mental. A saúde mental, por mais importante que seja, é mais negligenciada do que outros problemas globais. Embora problemas de saúde mental como ansiedade, depressão e psicose afectem um grande número de pessoas em todo o mundo, uma percentagem significativa das pessoas necessitadas não recebe cuidados adequados devido a limitações de recursos e preocupações de privacidade relacionadas com a recolha de dados médicos pessoais. Pesquisadores da medicina e da tecnologia estão fazendo muitos esforços para democratizar o suporte cognitivo e criar modelos eficazes de aprendizado de máquina para diagnosticar e tratar transtornos mentais.

Os atuais sistemas de saúde mental baseados em IA dependem de abordagens baseadas em modelos ou em árvores, que carecem de flexibilidade e personalização. Esses modelos são treinados com base em dados coletados nas redes sociais, o que introduz preconceitos e pode não representar com precisão a experiência diversificada do paciente. Além disso, as preocupações com a privacidade e a falta de dados dificultam o desenvolvimento de modelos robustos de diagnóstico e tratamento de saúde mental. Até mesmo os modelos de PNL lutam para compreender as nuances da linguagem, as diferenças culturais e o contexto das conversas.

Para resolver essas questões, uma equipe de pesquisadores da Universidade de Illinois Urbana-Champaign, da Universidade de Stanford e da Microsoft Research Asia desenvolveu uma estrutura de autoaprendizagem que se auto-reforça, MentalArena, projetada para treinar modelos linguísticos em larga escala (LLMs) especificamente para diagnóstico. e diagnóstico. tratar problemas de saúde mental. O método gera dados personalizados por meio de interações simuladas entre paciente e terapeuta, permitindo que o modelo melhore continuamente seu desempenho.

A arquitetura do MentalArena possui três módulos básicos: Symptom Encoder, Symptom Decoder e Model Optimizer. O Symptom Encoder converte dados brutos de sintomas em uma representação numérica, enquanto o Symptom Decoder gera descrições ou recomendações de sintomas legíveis por humanos. O Model Optimizer melhora o desempenho e a eficiência do modelo geral usando técnicas como ajuste de hiperparâmetros, remoção, calibração e filtragem de informações. A estrutura visa simular configurações terapêuticas do mundo real, alterando e replicando a dramatização, onde o modelo alterna entre o papel do paciente e do terapeuta, gerando dados de domínio específico de alta qualidade para treinamento.

O estudo avalia o desempenho do MentalArena em seis conjuntos de dados de referência, incluindo tarefas de controle de qualidade biomédica e descoberta de saúde mental, onde o modelo superou LLMs de última geração, como GPT-3.5 e Llama-3-8b. Ajustado nos modelos GPT-3.5-turbo e Llama-3-8b, o MentalArena mostrou uma melhoria de desempenho de 20,7% em relação ao GPT-3.5-turbo e uma melhoria de 6,6% em relação ao Llama-3-8b. Notavelmente, também superou o GPT-4o em 7,7%. MentalArena demonstrou maior precisão no diagnóstico de condições de saúde mental, gerando planos de tratamento personalizados e fortes capacidades de generalização para outros domínios médicos.

Concluindo, a MentalArena representa um desenvolvimento promissor nos cuidados de saúde mental orientados pela IA, abordando os principais desafios de privacidade, acessibilidade e personalização de dados. Ao integrar com sucesso os três módulos, o MentalArena pode processar dados complexos de pacientes, gerar recomendações de tratamento personalizadas e otimizar o desempenho do modelo para uso eficaz. MentalArena permitiu a geração de dados de treinamento grandes e de alta qualidade sem interação real com o paciente, abrindo novas oportunidades para desenvolver soluções de saúde mental eficazes e seguras. O estudo também destaca o potencial para generalizar a estrutura para outros domínios médicos. No entanto, é necessário trabalho futuro para desenvolver ainda mais o modelo, abordar questões éticas como a privacidade e garantir a sua utilização segura em ambientes do mundo real.

Confira Papel. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Se você gosta do nosso trabalho, você vai gostar do nosso jornal.. Não se esqueça de participar do nosso Mais de 50k ML SubReddit.

[Upcoming Live Webinar- Oct 29, 2024] A melhor plataforma para modelos ajustados: mecanismo de inferência Predibase (atualizado)

Pragati Jhunjhunwala é estagiário de consultoria na MarktechPost. Atualmente, ele está cursando bacharelado em tecnologia no Instituto Indiano de Tecnologia (IIT), Kharagpur. Ele é um entusiasta de tecnologia e tem grande interesse em uma ampla gama de aplicativos de software e ciência de dados. Ele está constantemente aprendendo sobre os desenvolvimentos nos vários campos de IA e ML.

Source link

Você também pode gostar...

JailbreakBench: um benchmark de código aberto para jailbreak de grandes modelos de linguagem (LLMs)

Pesquisadores da Meta AI apresentam um modelo de recompensa do pesquisador em nível de token (TLDR) para fornecer anotações bem caracterizadas de modelos de linguagem de grandes ideias

Tokenformer: a arquitetura de transformador de próxima geração que aproveita parâmetros tokenizados para escalonamento contínuo e rápido em aplicativos de IA

Deixe um comentário Cancelar resposta