Google AI lança modelo básico de dinâmica populacional (PDFM): uma estrutura de aprendizado de máquina desenvolvida para potencializar a modelagem geoespacial
Inteligência artificial

Google AI lança modelo básico de dinâmica populacional (PDFM): uma estrutura de aprendizado de máquina desenvolvida para potencializar a modelagem geoespacial


Apoiar a saúde e o bem-estar de diversas populações em todo o mundo requer uma compreensão diferenciada das complexas relações entre o comportamento humano e os ambientes locais. Isto requer a identificação de populações vulneráveis ​​e a optimização da alocação de recursos para obter o máximo impacto. Os métodos tradicionais muitas vezes dependem de recursos escolhidos a dedo e modelos específicos de tarefas, tornando-os difíceis e desafiadores de adaptação a tarefas novas ou relacionadas. Os modelos de dinâmica populacional, pelo contrário, fornecem um quadro dinâmico para examinar como os factores ambientais, sociais e económicos influenciam os resultados da saúde pública. A investigação sublinha que os factores ambientais podem prever melhor os resultados de saúde a longo prazo do que a genética, destacando o importante papel da modelização geoespacial na abordagem dos desafios de saúde pública, incluindo a gestão de doenças e os impactos na saúde relacionados com o clima.

O aprendizado de máquina melhorou muito a modelagem geoespacial ao usar diversas fontes de dados para aumentar a resolução espacial e temporal. O estudo utilizou dados de telefones celulares, tendências de pesquisa na web, imagens de satélite e informações meteorológicas para prever movimentos populacionais, surtos de doenças e condições econômicas. Apesar de fornecerem insights possíveis, essas abordagens geralmente dependem de operações em grande escala, recursos artesanais e modelos personalizados, limitando a escalabilidade e a interoperabilidade. Para resolver isso, desenvolvimentos recentes como GPS2Vec, SatCLIP e GeoCLIP concentram-se na criação de codificadores para vários locais usando dados georreferenciados, imagens de satélite e alinhamento de imagem para GPS. Com base nestas inovações, novos modelos visam combinar sinais comportamentais humanos com dados ambientais para gerar estruturas de uso geral para navegação geoespacial avançada.

Pesquisadores do Google Research e da Universidade de Nevada, Reno, introduziram o Population Dynamics Foundation Model (PDFM), uma estrutura dinâmica para modelagem geoespacial. Ao criar um conjunto de dados georreferenciados que combina comportamento humano (por exemplo, tendências de pesquisa agregadas) e sinais ambientais (por exemplo, clima, qualidade do ar), o PDFM usa redes neurais gráficas para construir incorporações para diversas funções. Marcado em 27 funções de saúde, socioeconômicas e ambientais, o PDFM alcança interpretação geoespacial de alta qualidade, precisão de extrapolação e desempenho de alta resolução. Ele melhora modelos preditivos como o TimesFM, ignorando métodos supervisionados sem ajuste fino. Com incorporações e códigos disponíveis publicamente, o PDFM fornece soluções geoespaciais para aplicações de pesquisa, bem público, saúde e negócios.

O estudo selecionou cinco conjuntos de dados em nível de código postal nos EUA contíguos (CONUS) para treinamento e teste, com foco em tendências de pesquisa agregadas, mapas, ocupação, clima e imagens de satélite. As tendências de pesquisa incluem as 1.000 principais consultas de julho de 2022, dimensionadas e anonimizadas para privacidade. Mapas e dados de ocupação fornecem informações sobre serviços e níveis de atividade por categoria. As métricas meteorológicas e de qualidade do ar incluem dados meteorológicos e de poluição para julho de 2022. Incorporação de satélite usando imagens Sentinel-2 do SatCLIP de 2021–2023. Embora o alinhamento temporal tenha variado, estes conjuntos de dados incluíam 28.000 códigos postais, representando mais de 95% da população dos EUA, excluindo áreas de baixa população.

Para desenvolver o PDFM, cinco conjuntos de dados abrangendo mapas, ocupação, tendências de pesquisa, clima e qualidade do ar foram coletados em nível de CEP e condado. Usando GNNs, o PDFM foi treinado para realizar incorporações multivariadas para resolver 27 tarefas de saúde, socioeconômicas e ambientais de baixo nível. Os testes interpretativos e aditivos simulam condições de dados que não estão nos níveis de código postal, e os benchmarks PDFM, como SatCLIP e GeoCLIP, apresentam bom desempenho em diversas tarefas. A pesquisa de ablação revelou tendências de pesquisa e mapas como principais contribuidores. Em tarefas de alta resolução, o PDFM tem demonstrado alto desempenho, alcançando alta correlação na previsão em nível de código postal, destacando seu desempenho em previsão geoespacial e aplicações downstream.

Concluindo, o PDFM Framework aborda uma variedade de desafios geoespaciais nos EUA, superando os modelos existentes, como SatCLIP e GeoCLIP, em uma variedade de tarefas e modelos de previsão aprimorados, como o TimesFM. Combina diversos conjuntos de dados, mostrando adaptabilidade a novas tarefas, condições de dados limitadas e diferentes decisões. As direções futuras incluem resolver problemas de alinhamento temporal, incluindo incorporação dinâmica, exploração de conjuntos de dados adicionais e obtenção de bordas gráficas sem espaço. As limitações incluem a dependência de dados agregados e inconsistências de dados regionais. O design que preserva a privacidade do PDFM garante ampla aplicabilidade, com potenciais extensões globais exigindo novas soluções para regiões com poucos dados e estimativas de confiabilidade para melhorar as previsões em áreas sub-representadas.


Confira Papel e repositório GitHub. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Se você gosta do nosso trabalho, você vai gostar do nosso jornal.. Não se esqueça de participar do nosso SubReddit de 60k + ML.

🚨 [Must Attend Webinar]: 'Transforme provas de conceito em aplicativos e agentes de IA prontos para produção' (Promovido)


Sana Hassan, estagiária de consultoria na Marktechpost e estudante de pós-graduação dupla no IIT Madras, é apaixonada pelo uso de tecnologia e IA para enfrentar desafios do mundo real. Com um profundo interesse em resolver problemas do mundo real, ele traz uma nova perspectiva para a intersecção entre IA e soluções da vida real.

🚨🚨 WEBINAR DE IA GRATUITO: 'Acelere suas aplicações LLM com deepset e Haystack' (promovido)





Source link

Você também pode gostar...

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *