Formular uma hipótese de pesquisa única e promissora é uma habilidade básica de qualquer cientista. Também pode ser demorado: novos estudantes de doutoramento podem passar o primeiro ano do seu programa a tentar decidir o que testar na sua avaliação. E se a inteligência artificial pudesse ajudar?
Os pesquisadores do MIT desenvolveram uma maneira de gerar e avaliar automaticamente ideias de pesquisa promissoras em todos os campos, por meio da interação entre humanos e IA. Num novo artigo, eles descrevem como usaram esta estrutura para desenvolver hipóteses baseadas em evidências que abordam necessidades de investigação não satisfeitas no campo dos materiais de inspiração biológica.
Publicado na quarta-feira às Materiais AvançadosO estudo foi coautor de Alireza Ghafarollahi, pós-doutorado no Laboratório de Mecânica Atomística e Molecular (LAMM), e Markus Buehler, professor de engenharia Jerry McAfee nos departamentos de Engenharia Civil e Ambiental e Engenharia Mecânica do MIT e diretor do LAMM.
A estrutura, que os investigadores chamam de SciAgents, contém muitos agentes de IA, cada um com competências específicas e acesso a dados, o que promove métodos de “pensamento gráfico”, onde os modelos de IA utilizam gráficos de informação para organizar e explicar as relações entre vários conceitos científicos. A abordagem multiagente imita a forma como os sistemas biológicos se organizam como coleções de blocos de construção básicos. Buehler observa que este princípio de “dividir para conquistar” é um paradigma proeminente na biologia em muitos níveis, desde materiais até insectos e civilizações – todos exemplos em que a inteligência colectiva é maior do que a soma das capacidades individuais.
“Ao usar vários agentes de IA, estamos tentando imitar o processo pelo qual as comunidades científicas passam”, disse Buehler. “No MIT, fazemos isso com um grupo de pessoas de diferentes origens trabalhando juntas e se encontrando em cafeterias ou no Corredor Infinito do MIT. Mas isso foi muito coincidente e muito lento. Nossa ambição é simular o processo de descoberta, testando se os programas de IA podem criar e descobrir.”
Automação é uma ótima ideia
Como demonstraram desenvolvimentos recentes, os modelos linguísticos de grande escala (LLMs) demonstraram uma capacidade notável de responder a perguntas, resumir informações e realizar tarefas simples. Mas eles são limitados quando se trata de gerar novas ideias do zero. Os pesquisadores do MIT queriam projetar um sistema que permitisse aos modelos de IA executar um processo complexo e de várias etapas que fosse além de lembrar informações aprendidas durante o treinamento, até descobrir e criar novas informações.
A base de sua abordagem é um gráfico de ontologia do conhecimento, que organiza e faz conexões entre diferentes conceitos científicos. Para fazer gráficos, os pesquisadores alimentam um conjunto de artigos científicos em um modelo generativo de IA. Em um livro anterior, Buehler usou um campo da matemática conhecido como teoria das categorias para ajudar o modelo de IA a desenvolver conceitos científicos como gráficos, que se concentram na descrição de relações entre componentes, de uma forma que possa ser analisada por outros modelos por meio de um processo chamado raciocínio gráfico. . . Isso concentra os modelos de IA no desenvolvimento de uma abordagem sistemática para a compreensão de conceitos; também permite otimizar melhor os domínios.
“Isso é muito importante para construirmos modelos de IA orientados para a ciência, uma vez que as teorias científicas são frequentemente focadas em princípios empíricos, em vez de apenas memorizar informações”, disse Buehler. “Ao focar os modelos de IA no 'pensamento' desta forma, podemos ir além dos métodos convencionais e explorar usos mais criativos da IA.”
No último artigo, os pesquisadores usaram cerca de 1.000 estudos científicos sobre materiais biológicos, mas Buehler diz que os gráficos de conhecimento podem ser criados usando muitos ou poucos artigos de pesquisa de qualquer área.
Com a invenção do gráfico, os investigadores estão a construir um sistema de IA para a descoberta científica, com muitos modelos especializados para desempenhar funções específicas no sistema. A maioria dos componentes foi construída com modelos da série ChatGPT-4 da OpenAI e usou um método conhecido como aprendizagem em contexto, onde o prompt fornece informações contextuais sobre a função do modelo no sistema, permitindo-lhe aprender com os dados fornecidos.
Os agentes individuais da estrutura trabalham juntos para resolver em conjunto um problema complexo que nenhum deles consegue resolver sozinho. A primeira tarefa que lhes é dada é gerar uma hipótese de pesquisa. A interação do LLM começa após a definição de um subgráfico no gráfico de conhecimento, o que pode acontecer de forma aleatória ou inserindo manualmente as palavras-chave discutidas nos artigos.
Nesse framework, um modelo de linguagem que os pesquisadores chamaram de “Ontologista” tem a tarefa de definir termos científicos em documentos e explorar as conexões entre eles, gerando um gráfico de conhecimento. Um modelo denominado “Cientista 1” faz então uma proposta de pesquisa baseada em fatores como sua capacidade de revelar estruturas inesperadas e novidades. A proposta inclui uma discussão de possíveis descobertas, implicações de pesquisa e hipóteses sobre mecanismos subjacentes. O modelo “Cientista 2” expande a ideia, sugere algumas maneiras de testar e simular e fazer outras melhorias. Finalmente, o modelo “Crítica” destaca os seus pontos fortes e fracos e sugere novas melhorias.
“Trata-se de construir uma equipe de profissionais com ideias semelhantes”, disse Buehler. “Eles têm que pensar de forma diferente e ter habilidades diferentes. O Agente de Crítica é deliberadamente criado para criticar os outros, então você não tem todos concordando e dizendo que é uma boa ideia. Você tem um agente que diz: 'Há um ponto fraco aqui, você pode explicar melhor?' Isso torna o resultado muito diferente dos modelos individuais.”
Outros agentes no sistema são capazes de pesquisar a literatura existente, o que fornece ao sistema uma forma não só de testar a viabilidade, mas também de criar e testar a novidade de cada ideia.
Para tornar o sistema robusto
Para validar sua metodologia, Buehler e Ghafarollahi criaram um gráfico de conhecimento baseado nas palavras “seda” e “intensivo”. Usando a estrutura, o modelo “Science 1” propôs combinar seda com corantes à base de dente-de-leão para criar biomateriais com propriedades ópticas e mecânicas melhoradas. O modelo previu que o material seria mais resistente do que os materiais tradicionais de seda e exigiria menos energia para ser processado.
O Cientista 2 então fez sugestões, como usar algumas ferramentas de simulação molecular dinâmica para testar como os materiais propostos funcionariam juntos, acrescentando que uma boa aplicação para esse material seria a cola bioinspirada. O modelo Crítico destaca então vários pontos fortes do material proposto e áreas para melhoria, como sua escalabilidade, estabilidade a longo prazo e impactos ambientais do uso de solventes. Para responder a essas preocupações, o Crítico sugeriu que fossem realizados estudos piloto para validar o processo e realizar uma análise rigorosa da durabilidade do material.
Os pesquisadores também realizaram outros experimentos com palavras-chave selecionadas aleatoriamente, gerando várias ideias originais sobre chips microfluídicos biomiméticos eficientes, melhorando as propriedades mecânicas de estruturas à base de colágeno e conectando grafeno e fibrilas amilóides para criar dispositivos para – bioeletrônica.
“O programa foi capaz de apresentar ideias novas e robustas com base na abordagem do gráfico de conhecimento”, disse Ghafarollahi. “Em termos de novidade e usabilidade, os materiais pareciam fortes e inovadores. Em trabalhos futuros, geraremos milhares, ou dezenas de milhares, de novas ideias de pesquisa, e então poderemos categorizá-las, tentar entender melhor como essas coisas são geradas e como podem ser desenvolvidas”.
No futuro, os pesquisadores esperam incorporar novas ferramentas de recuperação e simulação de informações em sua estrutura. Eles também podem trocar facilmente modelos básicos em suas estruturas por modelos mais avançados, permitindo que o sistema se adapte às mais recentes inovações em IA.
“Devido à forma como estes agentes interagem, a melhoria de um modelo, mesmo que seja pequena, tem um grande impacto no comportamento e na produção de todo o sistema”, disse Buehler.
Desde o lançamento de uma pré-impressão detalhada de código aberto do seu método, os investigadores foram contactados por centenas de pessoas interessadas em utilizar a estrutura em vários campos científicos e até mesmo em áreas como finanças e segurança cibernética.
“Há muitas coisas que você pode fazer sem ir ao laboratório”, disse Buehler. “Você quer ir para o laboratório no final do processo. O laboratório é caro e demorado, então você deseja um sistema que possa se aprofundar nas melhores ideias, gerar as melhores ideias e prever com precisão os comportamentos emergentes. Nossa ideia é tornar isso fácil de usar, para que você possa usar o aplicativo para trazer outras ideias ou arrastar conjuntos de dados para desafiar o modelo para novas descobertas.”