SHREC: um método de aprendizado de máquina baseado em física para análise de séries temporais
Inteligência artificial

SHREC: um método de aprendizado de máquina baseado em física para análise de séries temporais


A reconstrução de fatores causais não medidos de séries temporais complexas a partir de dados de resposta observados representa um desafio fundamental em vários domínios científicos. Variáveis ​​latentes, incluindo controles genéticos ou fatores ambientais, são importantes na determinação da dinâmica do sistema, mas raramente são medidas. Os desafios dos métodos atuais vêm do ruído dos dados, do alto tamanho do sistema e das capacidades inerentes dos algoritmos no tratamento de interações não lineares. Isto será de grande ajuda na modelagem, previsão e controle de sistemas de alta dimensão em biologia de sistemas, ecologia e dinâmica de fluidos.

As técnicas comumente usadas para reconstrução de drivers causais geralmente dependem de processamento de sinais ou estruturas de aprendizado de máquina. Alguns dos mais comuns incluem métodos de informação conjunta, aplicações de redes neurais e reconstrução dinâmica de atratores. Embora esses métodos funcionem bem em alguns casos, eles apresentam limitações importantes. A maioria deseja conjuntos de dados grandes e de alta qualidade que raramente estão disponíveis em aplicações do mundo real. Eles são mais propensos a ruídos de medição, resultando em menor precisão de reconstrução. Alguns requerem algoritmos computacionalmente caros e, portanto, não são adequados para aplicações em tempo real. Além disso, muitos modelos carecem de princípios físicos, o que limita a sua interpretação e aplicabilidade entre domínios.

Pesquisadores da Universidade do Texas estão introduzindo uma estrutura de aprendizagem não supervisionada baseada em física chamada SHREC (Shared Repetitions) para reconstruir fatores causais a partir de dados de séries temporais. O método é baseado no conceito de sistemas dinâmicos de produtos distorcidos e análise de dados topológicos. As inovações incluem o uso de eventos recorrentes em séries temporais para inferir estruturas causais comuns entre as respostas, a construção de um gráfico de recorrência de consenso truncado para revelar dinâmicas de driver ocultas e a introdução de novos embeddings de rede que adaptam o ruído a diferentes conjuntos de dados usando estruturas difusas simples. . Ao contrário dos métodos existentes, a estrutura SHREC captura bem dados ruidosos e não lineares, requer pouco ajuste de parâmetros e fornece informações úteis sobre a dinâmica física subjacente aos sistemas de resposta do driver.

O algoritmo SHREC é implementado em vários estágios. As séries temporais de resposta medidas são mapeadas em redes recorrentes ponderadas por incorporação topológica, onde uma matriz de afinidade é construída para cada série temporal com base nas distâncias dos vizinhos mais próximos e nos limites variáveis. Gráficos de recorrência são compilados a partir de cada série temporal para obter um gráfico de consistência que captura a dinâmica do conjunto. Diferentes drivers de tempo foram vinculados e decompostos por algoritmos de detecção pública, incluindo o método de Leiden, para fornecer diferentes classes de equivalência. Para drivers contínuos, por outro lado, a decomposição Laplaciana do gráfico revela os modos temporais correspondentes aos estados dos drivers. O algoritmo foi testado em uma variedade de dados: expressão genética, abundância de plâncton e fluxo turbulento. Ele mostrou excelente reconstrução de drivers sob condições desafiadoras, como ruído alto e dados ausentes. A estrutura do framework é baseada em ações baseadas em gráficos. Portanto, evita a dispendiosa otimização baseada em gradiente e o torna computacionalmente eficiente.

O SHREC teve um desempenho notável e consistente em conjuntos de dados desafiadores. A abordagem reconstrói com sucesso determinantes causais a partir de conjuntos de dados de expressão gênica, revelando assim os principais componentes regulatórios, mesmo na presença de dados esparsos e ruidosos. Em experimentos envolvendo fluxo turbulento, este método obteve com sucesso características de forçamento senoidal, mostrando superioridade sobre as técnicas convencionais de processamento de sinais. No que diz respeito aos conjuntos de dados ambientais, o SHREC revelou tendências induzidas pela temperatura nas populações de plâncton, apesar da informação muito limitada, demonstrando assim a sua robustez a dados incompletos e ruidosos. Comparações com outros métodos destacaram o aumento da precisão e eficiência do SHREC nos cálculos, especialmente na presença de altos níveis de ruído e dependências não lineares complexas. Essas descobertas destacam sua ampla aplicabilidade e confiabilidade em muitos campos.

SHREC é uma estrutura de aprendizagem não supervisionada baseada em física que permite a reconstrução de fatores causais observáveis ​​a partir de dados de séries temporais complexas. Este novo método aborda os difíceis obstáculos das técnicas atuais, incluindo a tendência ao ruído e aos altos custos computacionais, usando propriedades iterativas e incorporação topológica. O desempenho bem-sucedido do SHREC em diversos conjuntos de dados ressalta sua ampla aplicabilidade com a capacidade de desenvolver modelagem baseada em IA em disciplinas de biologia, física e engenharia. Esta abordagem melhora a precisão da reconstrução do factor causal e, ao mesmo tempo, estabelece um quadro baseado nos princípios da teoria dos sistemas dinâmicos e lança nova luz sobre aspectos importantes da transferência de informação dentro de sistemas interligados.


Confira Papel. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Não se esqueça de participar do nosso SubReddit de 65k + ML.

🚨 [Recommended Read] Nebius AI Studio se estende com modelos de visão, novos modelos de linguagem, embeddings e LoRA (Promovido)


Aswin AK é consultor da MarkTechPost. Ele está cursando seu diploma duplo no Instituto Indiano de Tecnologia, Kharagpur. Ele é apaixonado por ciência de dados e aprendizado de máquina, o que traz consigo uma sólida formação acadêmica e experiência prática na solução de desafios de domínio da vida real.

📄 Conheça 'Height': a única ferramenta autônoma de gerenciamento de projetos (patrocinado)



Source link

Você também pode gostar...

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *