Inferência causal assistida por IA: usando LLMs para transformar a seleção de variáveis ​​instrumentais

A endogeneidade apresenta um grande desafio na condução de inferências causais em ambientes observacionais. Pesquisadores das ciências sociais, matemática e áreas afins desenvolveram várias técnicas de identificação para superar esse obstáculo, recriando condições experimentais naturais. O método de variáveis instrumentais (VI) emergiu como o método líder, onde os pesquisadores encontram VIs em vários ambientes e justificam sua adesão aos limites de exclusão. Contudo, estes limites de exclusão são pressupostos inquestionáveis, muitas vezes dependentes de debates específicos do contexto. O processo de identificação de potenciais VIs requer pensamento crítico, engenhosidade e, por vezes, sorte dos investigadores, o que contribui para a natureza da investigação liderada pelo homem. Esta abordagem selectiva e não estatística à selecção e ajustamento de IV destaca a necessidade de abordagens robustas e sistemáticas para a compreensão causal.

Grandes Modelos de Linguagem (LLMs) surgiram como uma ferramenta promissora para descobrir novos IVs na pesquisa de inferência causal. Um investigador da Universidade de Bristol mostra que estes sistemas de IA, com as suas capacidades avançadas de processamento de linguagem, podem ajudar a procurar IVs válidos e fornecer razões para falar, semelhante aos investigadores humanos, mas a um ritmo mais rápido. Os LLMs podem explorar um grande espaço de pesquisa, realizar pesquisas sistemáticas de hipóteses e envolver-se em raciocínio contrafactual, tornando-os adequados para tarefas causais. Esta abordagem assistida por IA oferece várias vantagens: faz uma pesquisa rápida e sistemática capaz de se adaptar a situações específicas de investigação, aumenta as hipóteses de encontrar mais VIs para avaliar a validade jurídica e melhora as hipóteses de encontrar ou direcionar a criação de dados relevantes contendo IV. O método proposto envolve a criação cuidadosa de instruções que orientem os LLMs na busca por candidatos válidos a IV, incluindo a interpretação verbal dos limites de emissão e o uso de técnicas de simulação para simular os processos de tomada de decisão dos agentes.

A metodologia proposta usa ChatGPT-4 (GPT4) da OpenAI para encontrar IVs para três exemplos bem conhecidos da economia aplicada: retorno à escola, atividades produtivas e resultados dos pares. Esta abordagem envolve a criação de comandos específicos que orientam o GPT4 na busca por candidatos IV válidos, incluindo a interpretação verbal das restrições de saída e o uso de técnicas de simulação para simular os processos de tomada de decisão dos agentes. Esta abordagem produziu com sucesso listas de candidatos IV, incluindo proposições únicas e variáveis que são amplamente utilizadas na literatura, bem como razões para a sua validade. O conceito se estende além da descoberta de IV para outros métodos causais, como a busca de variáveis de controle em métodos de regressão e diferenças em diferenças e a identificação de variáveis ativas em projetos de regressão de abandono. Embora as listas produzidas não sejam definitivas, servem como referências importantes para encorajar os investigadores sobre as variáveis e domínios potenciais a explorar. O diálogo com o GPT4 também pode ajudar os investigadores a refinar os argumentos para serem mais realistas, enfatizando o poder da colaboração entre investigadores humanos e IA no desenvolvimento de métodos de inferência causal.

A metodologia proposta utiliza uma abordagem em duas etapas para detecção de IV usando LLMs. Na etapa 1, o LLM é instruído a procurar IVs que satisfaçam as definições verbais de restrição de emissão (i) e condição de compatibilidade. A Etapa 2 filtra a pesquisa selecionando IVs da Etapa 1 que atendem à definição verbal de restrição de exclusão (ii). Ambas as medidas envolvem declarações falsas e exigem que o LLM forneça razões para as suas respostas. Esta abordagem em duas etapas oferece diversas vantagens: melhora o desempenho do LLM ao separar tarefas complexas, permite a avaliação do usuário de resultados intermediários e fornece informações valiosas sobre esses resultados intermediários. As instruções foram inicialmente construídas sem covariáveis para simplificar, com informações mais práticas incluindo covariáveis introduzidas posteriormente. Esta abordagem cria uma estrutura flexível para a descoberta de VI, permitindo o ajuste fino e a adaptação a situações específicas de pesquisa, mantendo ao mesmo tempo uma abordagem sistemática para determinar a causalidade.

Este estudo serve de base para a integração dos LLMs na descoberta de variáveis importantes para a compreensão causal. As direções futuras para a tecnologia incluem a integração de IVs conhecidos da literatura para orientar os LLMs na descoberta de novos, que podem usar menos aprendizado para melhorar o desempenho. Além disso, métodos de teste para agrupar resultados em múltiplas sessões do LLM podem levar em conta e explorar a aleatoriedade inerente aos resultados do LLM. Essas melhorias poderiam levar a processos de aquisição IV mais eficientes e completos. À medida que a IA continua a evoluir, a colaboração entre investigadores humanos e sistemas de IA em métodos de inferência causal promete abrir novos caminhos para uma investigação energética mais eficiente e perspicaz em economia e campos relacionados.

Confira Papel. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Se você gosta do nosso trabalho, você vai gostar do nosso jornal.. Não se esqueça de participar do nosso Mais de 50k ML SubReddit

Interessado em promover sua empresa, produto, serviço ou evento para mais de 1 milhão de desenvolvedores e pesquisadores de IA? Vamos trabalhar juntos!

Asjad é consultor estagiário na Marktechpost. Ele está cursando B.Tech em engenharia mecânica no Instituto Indiano de Tecnologia, Kharagpur. Asjad é um entusiasta do aprendizado de máquina e do aprendizado profundo que está constantemente pesquisando a aplicação do aprendizado de máquina na área da saúde.

Source link

Inferência causal assistida por IA: usando LLMs para transformar a seleção de variáveis instrumentais

Deixe um comentário Cancelar resposta

Você também pode gostar...

O aprendizado de máquina encontra a física: o argumento para o Prêmio Nobel de 2024

DPO: Aprimorando o modelo de linguagem controlando a entropia

Leopard: um modelo multilíngue (MLLM) projetado especificamente para lidar com tarefas de linguagem visual que envolvem várias imagens ricas em texto

Deixe um comentário Cancelar resposta