Rumo a modelos de geração de vídeo do mundo molecular | Notícias do MIT
Inteligência artificial

Rumo a modelos de geração de vídeo do mundo molecular | Notícias do MIT

À medida que o poder dos modelos generativos de IA cresceu, você deve ter visto como eles podem transformar comandos de texto simples em imagens hiperrealistas e até mesmo em clipes de vídeo estendidos.

Recentemente, a IA generativa demonstrou potencial para ajudar químicos e biólogos a analisar moléculas estáticas, como proteínas e DNA. Modelos como o AlphaFold podem prever a estrutura molecular para acelerar a descoberta de medicamentos, e a “RFdiffusion” assistida pelo MIT, por exemplo, pode ajudar a projetar novas proteínas. Outro desafio, no entanto, é que as moléculas estão em constante movimento e movimento, o que é importante modelar ao projetar novas proteínas e medicamentos. Simular esses movimentos em um computador usando a física – um processo conhecido como dinâmica molecular – pode ser muito caro, exigindo bilhões de passos de tempo em supercomputadores.

Como um passo para simular esse comportamento de forma mais eficaz, o Laboratório de Ciência da Computação e Inteligência Artificial do MIT (CSAIL) e os pesquisadores do Departamento de Matemática desenvolveram um modelo generativo que aprende com dados anteriores. O sistema da equipe, chamado MDGen, pode pegar um quadro de uma molécula 3D e simular o que acontece a seguir como um vídeo, conectar diferentes sons e preencher os quadros faltantes. Ao pressionar o “botão play” nas moléculas, a ferramenta pode ajudar os químicos a projetar novas moléculas e explorar como seus medicamentos para o câncer e outras doenças podem interagir com a estrutura molecular que visam.

O co-autor Bowen Jing SM '22 diz que o MDGen é uma prova inicial de conceito, mas sugere o início de uma nova e excitante direção de pesquisa. “Desde o início, os modelos generativos de IA produziram vídeos simples, como uma pessoa piscando ou um cachorro abanando o rabo”, disse Jing, estudante de doutorado no CSAIL. “Avançamos alguns anos e agora temos modelos incríveis como Sora ou Veo que podem ser úteis de todas as maneiras interessantes. Esperamos aplicar a mesma ideia ao mundo molecular, onde as trajetórias dinâmicas são vídeos. Por exemplo, você pode dar ao modelo o primeiro e o décimo quadro, e ele ganhará vida com o conteúdo, ou pode remover o ruído do vídeo do celular e adivinhar o que estava oculto.

Os pesquisadores dizem que o MDGen representa uma mudança de paradigma em relação ao trabalho anterior comparável com IA para manufatura, de uma forma que permite casos de uso mais amplos. Os métodos anteriores eram “automáticos”, o que significa que dependiam do quadro estático anterior para criar o próximo, começando pelo primeiro quadro para criar uma sequência de vídeo. Em contrapartida, o MDGen gera quadros de acordo com a distribuição. Isso significa que o MDGen pode ser usado, por exemplo, para interpolar quadros no final ou para “amostrar” uma rota com taxa de quadros mais baixa, além de compactar a reprodução do quadro original.

Este trabalho foi apresentado em um artigo apresentado na Conferência sobre Sistemas de Processamento de Informações Neurais (NeurIPS) em dezembro passado. No verão passado, foi premiado por seu potencial impacto comercial no Workshop ML4LMS da Conferência Internacional sobre Aprendizado de Máquina.

Alguns pequenos passos em frente para a evolução molecular

Em testes, Jing e seus colegas descobriram que as simulações do MDGen eram semelhantes ao uso direto de simulações do mundo real, ao mesmo tempo que geravam trajetórias 10 a 100 vezes mais rápidas.

A equipe primeiro testou a capacidade de seu modelo de capturar a estrutura 3D de uma molécula e gerar os próximos 100 nanossegundos. Seu sistema incluía blocos consecutivos de 10 nanossegundos para que essas gerações atingissem esse tempo. A equipe descobriu que o MDGen foi capaz de competir com a precisão do modelo de linha de base, ao mesmo tempo que concluiu o processo de geração de vídeo em cerca de um minuto – uma fração das três horas que o modelo de linha de base levou para simular a mesma dinâmica.

Ao receber o primeiro e o último quadro de uma única sequência de nanossegundos, o MDGen também modela as etapas intermediárias. O programa dos investigadores mostrou um certo grau de realismo em mais de 100.000 previsões diferentes: combinou trajetórias moleculares que são mais prováveis ​​do que as suas bases em clipes com menos de 100 nanossegundos. Nestas experiências, o MDGen também demonstrou a capacidade de produzir péptidos nunca antes vistos.

Os recursos do MDGen também incluem simulação quadro a quadro, etapas de “amostragem” em cada nanossegundo para capturar eventos moleculares rápidos o suficiente. Pode até “pintar” as estruturas das moléculas, restaurando informações sobre elas que foram removidas. Esses recursos podem eventualmente ser usados ​​por pesquisadores para projetar proteínas com base no princípio de como as diferentes partes da molécula devem se mover.

Brincando com a dinâmica das proteínas

Jing e o co-autor Hannes Stärk dizem que o MDGen é o primeiro sinal de progresso no sentido de tornar a dinâmica molecular mais poderosa. No entanto, eles não têm os dados para fazer com que esses modelos tenham impacto imediato no design de medicamentos ou moléculas que atraiam o movimento que os químicos desejam ver na estrutura alvo.

Os pesquisadores pretendem dimensionar o MDGen desde a modelagem de moléculas até a previsão de como as proteínas mudarão ao longo do tempo. “No momento, estamos usando sistemas de brinquedo”, diz Stärk, que também é estudante de doutorado na CSAIL. “Para melhorar o poder preditivo do MDGen para modelagem de proteínas, precisaremos aproveitar a estrutura atual e os dados disponíveis. Atualmente não temos um banco de dados na escala do YouTube para esse tipo de simulação, então esperamos desenvolver uma abordagem diferente de aprendizado de máquina que possa acelerar o processo de coleta de dados para nosso modelo.”

Enquanto isso, o MDGen apresenta um caminho interessante na caracterização de alterações moleculares que são invisíveis a olho nu. Os farmacêuticos podem usar essas simulações para investigar o comportamento de modelos de medicamentos para doenças como câncer ou tuberculose.

“Os métodos de aprendizado de máquina que aprendem a partir de simulações físicas representam uma nova fronteira emergente na IA científica”, disse Bonnie Berger, professora de matemática do MIT Simons, investigadora principal do CSAIL e autora sênior do artigo. “O MDGen é uma estrutura de modelagem muito versátil, que combina esses dois domínios, e estamos muito entusiasmados em compartilhar nossos primeiros modelos nesse sentido.”

“Amostragem dos mecanismos físicos de mudança entre estados moleculares é um grande desafio”, disse o co-autor sênior Tommi Jaakkola, que é professor de Engenharia Elétrica e Ciência da Computação do MIT Thomas Siebel e do Instituto de Dados, Sistemas e Sociedade, e um Investigador principal do CSAIL. . “Este trabalho inicial mostra como podemos começar a enfrentar esses desafios, transformando um modelo generativo num jogo de simulação completo.”

Pesquisadores da área de bioinformática elogiaram este programa por sua capacidade de simular mutações moleculares. “O MDGen modela simulações de dinâmica molecular como uma distribuição conjunta de incorporações estruturais, capturando o movimento molecular entre diferentes etapas de tempo”, disse Simon Olsson, professor associado da Universidade de Tecnologia de Chalmers, que não esteve envolvido na pesquisa. “Usando o objetivo de aprendizagem oculto, o MDGen permite que novos casos de uso modelem o caminho da mudança, desenhando ilustrações nos caminhos de pintura que conectam os estágios de mudança.”

O trabalho dos pesquisadores do MDGen é apoiado, em parte, pelo Instituto Nacional de Ciências Médicas Gerais, pelo Departamento de Energia dos EUA, pela National Science Foundation, pelo Consórcio de Aprendizado de Máquina para Descoberta e Síntese Farmacêutica, pela Clínica Abdul Latif Jameel para Aprendizado de Máquina. . da Saúde, a Agência de Redução de Ameaças de Defesa e a Agência de Projetos de Pesquisa Avançada de Defesa.



Source link

Você também pode gostar...

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *