A previsão de estruturas 3D de RNA é importante para a compreensão de suas funções biológicas, melhorando a descoberta de medicamentos direcionados ao RNA e projetando aplicações de biologia sintética. No entanto, a variabilidade estrutural do RNA e a disponibilidade limitada de dados resolvidos experimentalmente representam desafios. Apesar da importância do RNA na regulação genética, as estruturas de RNA por si só representam menos de 1% do Banco de Dados, e os métodos tradicionais, como cristalografia de raios X e crio-EM, são lentos e consomem muitos recursos. Técnicas computacionais, incluindo métodos baseados em modelos, como ModeRNA e métodos de novo, como FARFAR2, melhoraram a representação do RNA, mas muitas vezes exigem mais velocidade e disponibilidade de dados. Os modelos de aprendizagem profunda surgiram como ferramentas revolucionárias para o uso de dados de sequenciamento de RNA.
Métodos recentes baseados em aprendizagem profunda incluem alinhamentos de sequência detalhados (MSAs) e restrições de estrutura secundária para melhorar a previsão da estrutura 3D do RNA. Métodos como DeepFoldRNA e trRosettaRNA usam MSAs para derivar recursos geométricos para modelagem baseada em energia, enquanto estruturas ponta a ponta, como AlphaFold3 e RoseTTAFoldNA, predizem diretamente estruturas 3D a partir de sequências. Embora os métodos baseados em MSA forneçam alta precisão, eles são computacionalmente caros devido às extensas pesquisas em bancos de dados. Outros métodos, como o DRFold, dependem apenas de uma única sequência, o que proporciona resultados mais rápidos e uma precisão ligeiramente inferior. Os desenvolvimentos futuros visam combinar a velocidade dos modelos sequenciais e a precisão das técnicas baseadas em MSA para previsões mais eficientes.
RhoFold+ é uma estrutura avançada de aprendizagem profunda desenvolvida por pesquisadores de instituições como a Universidade Chinesa de Hong Kong, Shanghai Zelixir Biotech Company Ltd, Instituto de Tecnologia Avançada de Shenzhen, Universidade Fudan, Laboratório de Inteligência Artificial de Xangai, Universidade de Harvard, MIT, Broad Institute of MIT e Harvard, Arizona State University e Biociências Integradas. Projetado para previsão precisa da estrutura 3D do RNA de novo, o RhoFold+ usa um modelo de linguagem de RNA pré-treinado em mais de 23,7 milhões de sequências e inclui múltiplos alinhamentos de sequência (MSAs) para resolver as limitações de dados. Validado por benchmarks como RNA-Puzzles e CASP15, ele prevê estruturas secundárias e ângulos de ligação, proporcionando ampla funcionalidade em biologia de RNA e estudos funcionais.
A plataforma RhoFold+ inclui vários métodos para previsão da estrutura do RNA. Ele integra recursos de MSA usando ferramentas como Infernal e rMSA, que capturam informações evolutivas do sequenciamento de RNA. O modelo de linguagem RNA-FM, construído em uma arquitetura de transformador semelhante ao BERT, é treinado em um grande conjunto de dados de sequências de RNA não codificantes do RNAcentral. O modelo usa aprendizado supervisionado para prever nucleotídeos ocultos na sequência. RhoFold+ inclui um módulo de previsão de estrutura que usa um método de atenção com reconhecimento de geometria (IPA) para otimização de estrutura 3D. O modelo foi treinado em várias funções de perda, incluindo MLM, perda de alcance e perda de estrutura secundária, para obter previsões precisas da estrutura do RNA.
RhoFold+ é uma ferramenta computacional para previsão de estrutura 3D de RNA, construída usando informações e dados específicos de RNA. Ele usa modelagem de linguagem de RNA (RNA-FM) para incorporação de sequências e MSAs para modelagem de estrutura. O desempenho do modelo foi avaliado rigorosamente, mostrando precisão superior em comparação aos métodos existentes nos desafios RNA-Puzzles e CASP15, com um RMSD médio de 4,02 Å. RhoFold+ é excelente em predição de estrutura, mesmo para sequências abstratas, e apresenta tempos de predição mais rápidos do que outros métodos. Testado em diferentes estruturas de RNA, alcançou alta precisão em vários cenários de validação.
Concluindo, RhoFold + é uma ferramenta de previsão de estrutura 3D de RNA baseada em aprendizado intensivo que combina um modelo de linguagem de RNA pré-treinado em 23,7 milhões de sequências. Ele fornece uma abordagem automatizada e escalável para a previsão da estrutura do RNA sem exigir conhecimento especializado ou procedimentos computadorizados. RhoFold+ supera os métodos existentes em precisão, especialmente para RNAs de fita simples, e é eficaz na previsão de RNA 3D e estruturas secundárias. Pode generalizar em diferentes conjuntos de dados e prever estruturas de RNA desconhecidas. Apesar do seu potencial, os desafios ainda precisam ser enfrentados, incluindo dados limitados sobre a diversidade estrutural, a complexidade do sequenciamento de RNA grande e as interações com ligantes ou proteínas. O desenvolvimento futuro poderá resolver estas limitações.
Confira Papel. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Se você gosta do nosso trabalho, você vai gostar do nosso jornal.. Não se esqueça de participar do nosso SubReddit de 55k + ML.
[FREE AI VIRTUAL CONFERENCE] SmallCon: Conferência Virtual GenAI gratuita com. Meta, Mistral, Salesforce, Harvey AI e mais. Junte-se a nós em 11 de dezembro para este evento de visualização gratuito para aprender o que é necessário para construir grande com pequenos modelos de pioneiros em IA como Meta, Mistral AI, Salesforce, Harvey AI, Upstage, Nubank, Nvidia, Hugging Face e muito mais.
Sana Hassan, estagiária de consultoria na Marktechpost e estudante de pós-graduação dupla no IIT Madras, é apaixonada pelo uso de tecnologia e IA para enfrentar desafios do mundo real. Com um profundo interesse em resolver problemas do mundo real, ele traz uma nova perspectiva para a intersecção entre IA e soluções da vida real.
🐝🐝 Leia este relatório de pesquisa de IA da Kili Technology 'Avaliação de vulnerabilidade de um modelo de linguagem grande: uma análise comparativa de métodos de passagem vermelha'