A síntese química é importante para a criação de novas moléculas para uso em medicina, ciência de materiais e química fina. Este processo, que envolve orquestrar reações químicas para criar moléculas-alvo, tem tradicionalmente dependido do conhecimento humano. Avanços recentes recorreram a métodos computacionais para melhorar a eficiência da retrossíntese – trabalhando de trás para frente a partir de uma molécula alvo para determinar a cadeia de reações necessárias para sintetizá-la. Usando métodos computacionais modernos, os pesquisadores pretendem resolver problemas de longa data na química sintética, tornando esses processos mais rápidos e precisos.
Um dos desafios críticos na retrossíntese é prever com precisão as reações químicas incomuns ou incomuns encontradas. Esta reação, embora rara, é importante na concepção de novos métodos químicos. Os modelos convencionais de aprendizado de máquina muitas vezes não conseguem prever essa resposta devido à representação insuficiente nos dados de treinamento. Além disso, os erros de programação de múltiplas etapas de retrossíntese podem ser reduzidos, levando a rotas sintéticas inválidas. Esta limitação dificulta a capacidade de explorar novos e diferentes métodos de síntese química, especialmente em situações que requerem reações incomuns.
Os métodos computacionais existentes para retrossíntese concentram-se principalmente em modelos de uma etapa ou sistemas especialistas baseados em regras. Estes métodos baseiam-se em regras predefinidas ou em extensos conjuntos de dados de treino, o que limita a sua adaptação a novos e diferentes tipos de reações. Por exemplo, alguns métodos usam modelos baseados em gráficos ou em sequências para prever mudanças potenciais. Embora estes métodos tenham melhorado a precisão das reações gerais, muitas vezes requerem mais flexibilidade para responder à complexidade e nuances de reações químicas incomuns, levando a uma lacuna na programação retrossintética completa.
Pesquisadores da Microsoft Research, da Novartis Biomedical Research e da Jagiellonian University desenvolveram o Chimera, uma estrutura integrada para prever a retrossíntese. Chimera combina o resultado de vários modelos de aprendizado de máquina com vários vieses, combinando seus pontos fortes com benchmarks de aprendizado de máquina. Este método utiliza dois modelos desenvolvidos recentemente: NeuralLoc, que se concentra na classificação molecular usando redes neurais de grafos, e R-SMILES 2, um modelo de novo que utiliza uma estrutura Transformer sequencial. Ao combinar esses modelos, o Chimera melhora a precisão e a escalabilidade das previsões retrossintéticas.
A metodologia da Chimera baseia-se na combinação de resultados de modelos existentes utilizando um sistema de pontuação que atribui pontos com base na concordância do modelo e na confiança preditiva. NeuralLoc codifica estruturas moleculares como gráficos, permitindo previsão precisa de locais e modelos de reação. Este método garante que as conformações previstas estejam em conformidade com as leis químicas conhecidas, mantendo a eficiência computacional. Enquanto isso, o R-SMILES 2 utiliza métodos avançados de atenção, incluindo Atenção de Grupo de Perguntas, para prever padrões de reação. A estrutura deste modelo também inclui melhorias nas funções de normalização e aplicação, garantindo alto gradiente de fluxo e velocidade de corte. O Chimera agrega essas previsões, usando uma pontuação baseada na sobreposição para avaliar caminhos potenciais. Esta integração garante que a estrutura equilibre o poder das abordagens baseadas em sequenciamento e de novo, permitindo previsões robustas mesmo para reações complexas e incomuns.
O desempenho do Chimera foi rigorosamente validado em relação a conjuntos de dados disponíveis publicamente, como USPTO-50K e USPTO-FULL, bem como ao conjunto de dados proprietário Pistachio. No USPTO-50K, o Chimera alcançou uma melhoria de 1,7% na precisão das 10 principais previsões em relação aos métodos de última geração anteriores, demonstrando sua capacidade de prever com precisão reações comuns e raras. Para o USPTO-FULL, também melhorou a precisão dos 10 primeiros em 1,6%. A calibração do modelo no conjunto de dados Pistachio, que contém dados USPTO-FULL em triplicado, mostrou que o Chimera manteve alta precisão em uma ampla gama de reações. Comparações feitas por especialistas e bioquímicos revelaram que as previsões da Quimera eram mais populares do que os modelos individuais, confirmando a sua eficácia em aplicações práticas.
A estrutura também foi testada num conjunto de dados interno da Novartis com mais de 10.000 reações para testar a sua robustez sob mudanças distributivas. Nesta configuração de disparo zero, onde nenhum ajuste fino adicional foi realizado, o Chimera demonstrou precisão superior em comparação com seus modelos equivalentes. Isto destaca a sua capacidade de generalizar para todos os conjuntos de dados e prever métodos sintéticos eficazes, mesmo em situações do mundo real. Além disso, o Chimera é altamente bem-sucedido em tarefas de retrossíntese em várias etapas, atingindo taxas de sucesso de quase 100% em benchmarks como o SimpRetro, que supera modelos individuais. A capacidade da estrutura de encontrar os caminhos das moléculas mais desafiadoras também sublinha o seu potencial para revolucionar a retrossíntese computacional.
A quimera representa um avanço significativo na previsão da retrossíntese, abordando os desafios de prever reações anormais e sequenciamento de múltiplas etapas. A estrutura demonstra alta precisão e escalabilidade ao combinar vários modelos e usar um método de classificação robusto. Com sua capacidade de integrar conjuntos inteiros de dados e se destacar em tarefas retrossintéticas complexas, o Chimera está preparado para acelerar o progresso na síntese química, abrindo caminho para novas abordagens ao design molecular.
Confira eu Papel. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Não se esqueça de participar do nosso SubReddit de 60k + ML.
🚨 Tendências: LG AI Research Release EXAONE 3.5: Modelos de três níveis de IA bilíngue de código aberto oferecem seguimento de comando incomparável e insights profundos de conteúdo Liderança global em excelência em IA generativa….
Nikhil é consultor estagiário na Marktechpost. Ele está cursando dupla graduação em Materiais no Instituto Indiano de Tecnologia, Kharagpur. Nikhil é um entusiasta de IA/ML que pesquisa constantemente aplicações em áreas como biomateriais e ciências biomédicas. Com sólida formação em Ciência de Materiais, ele explora novos desenvolvimentos e cria oportunidades para contribuir.
🧵🧵 [Download] Avaliação do relatório de trauma do modelo de linguagem principal (estendido)