O Machine Learning ML fornece poder significativo para acelerar a solução de equações diferenciais parciais (PDEs), uma área importante da física computacional. O objetivo é gerar soluções PDE precisas mais rapidamente do que os métodos numéricos tradicionais. Embora o ML se mostre promissor, as preocupações com a replicabilidade na ciência baseada no ML estão crescendo. Problemas como vazamento de dados, fundamentos fracos e validação insuficiente prejudicam as reivindicações de desempenho em muitos campos, incluindo o ML médico. Apesar desses desafios, o interesse em usar ML para melhorar ou substituir os solucionadores PDE tradicionais continua, com benefícios potenciais de melhoria de problemas inversos e redução do tempo de computação em diversas aplicações.
Pesquisadores da Universidade de Princeton revisaram a literatura de aprendizado de máquina de ML para resolver PDEs relacionadas a fluidos e encontraram alegações de excesso de confiança. A análise revelou que 79% dos estudos compararam modelos de ML com bases fracas, levando a resultados de desempenho exagerados. Além disso, os enviesamentos de notificação generalizados, incluindo os enviesamentos de resultados e de publicação, distorceram ainda mais os resultados através da subnotificação de efeitos secundários. Embora os solucionadores PDE baseados em ML, como as redes neurais informadas pela física (PINNs), tenham demonstrado potencial, eles geralmente falham em termos de velocidade, precisão e estabilidade. O estudo conclui que a literatura científica atual não fornece uma avaliação confiável da eficácia do AM na resolução de EDP.
Os solucionadores de PDEs baseados em máquinas muitas vezes comparam seu desempenho com métodos numéricos padrão, mas muitas comparações sofrem de fundamentos fracos, levando a afirmações exageradas. Duas armadilhas principais incluem a comparação de métodos com diferentes níveis de precisão e o uso de métodos numéricos ineficientes como referência. Em revisão de 82 artigos sobre AM para resolução de EDP, 79% compararam bases fracas. Além disso, o preconceito na notificação foi predominante, com os resultados positivos frequentemente destacados, enquanto os resultados negativos foram subnotificados ou ocultados. Esse viés contribui para uma visão excessivamente otimista do desempenho dos solucionadores de PDE baseados em ML.
A análise utiliza um método de revisão sistemática para investigar a frequência com que a literatura de ML sobre resolução de EDP compara seu desempenho com fundamentos fracos. A pesquisa se concentra especificamente em tópicos que utilizam ML para encontrar soluções aproximadas de vários EDPs relacionados a fluidos, incluindo as equações de Navier-Stokes e Burgers. Os critérios de inclusão enfatizam a necessidade de rapidez quantitativa ou comparações de custos computacionais, ao mesmo tempo que excluem uma série de EDPs não relacionados a fluidos, comparações qualitativas sem evidências de apoio e artigos sem fundamentos relevantes. O processo de busca envolveu a compilação de uma lista abrangente de autores da área e o uso do Google Acadêmico para identificar publicações relevantes a partir de 2016, incluindo 82 artigos que atenderam aos critérios definidos.
O estudo estabelece condições importantes para garantir uma comparação justa, como comparar solucionadores de ML e métodos numéricos que funcionam com igual precisão ou tempo de execução. São fornecidas recomendações para melhorar a confiabilidade da comparação, incluindo a interpretação cuidadosa dos resultados de algoritmos especiais de ML versus bibliotecas numéricas de uso geral e a adequação da escolha do hardware usado nos experimentos. A revisão mostra claramente a necessidade de explorar o básico em aplicações de ML para PDE, observando o domínio das redes neurais em artigos selecionados. Finalmente, a revisão sistemática visa iluminar as deficiências da literatura atual, ao mesmo tempo que incentiva estudos futuros a adotarem métodos comparativos mais rigorosos.
As bases fracas do aprendizado de máquina para resolver PDE são frequentemente causadas pela falta de experiência na comunidade de ML, análise numérica limitada e consciência insuficiente da importância de uma base sólida. Para reduzir problemas de reprodutibilidade, recomenda-se que os estudos de ML comparem os resultados comparando métodos numéricos convencionais e outros solucionadores de ML. Os investigadores também devem justificar a sua escolha de base e seguir regras estabelecidas de comparação apropriada. Além disso, abordar o preconceito na comunicação de informações e promover uma cultura de transparência e responsabilização melhorará a credibilidade da investigação sobre BC nos programas de PDE.
Confira Papel. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Se você gosta do nosso trabalho, você vai gostar do nosso jornal..
Não se esqueça de participar do nosso Mais de 50k ML SubReddit
Sana Hassan, estagiária de consultoria na Marktechpost e estudante de pós-graduação dupla no IIT Madras, é apaixonada pelo uso de tecnologia e IA para enfrentar desafios do mundo real. Com um profundo interesse em resolver problemas do mundo real, ele traz uma nova perspectiva para a intersecção entre IA e soluções da vida real.