Os sistemas de recomendação têm sido amplamente utilizados para aprender as preferências do usuário; no entanto, eles enfrentam desafios significativos na captura precisa das preferências do usuário, especialmente no contexto da filtragem colaborativa de gráficos neurais. Embora esses sistemas utilizem o histórico de interações entre usuários e objetos por meio de Redes Neurais de Grafos (GNNs) para extrair informações ocultas e capturar interações de alta ordem, a qualidade dos dados coletados representa um grande obstáculo. Além disso, ataques maliciosos que introduzem interações falsas degradam ainda mais a qualidade das recomendações. Este desafio é exacerbado na filtragem colaborativa de gráficos neurais, onde o método de passagem de mensagens dos GNNs amplifica o impacto dessas interações ruidosas, levando a recomendações inconsistentes que não refletem os interesses dos usuários.
Os esforços existentes para enfrentar estes desafios centram-se principalmente em duas abordagens: sistemas de recomendação dedutivos e sistemas de recomendação conscientes do tempo. Os métodos de remoção de ruído usam várias técnicas, como identificar e ponderar interações entre diferentes usuários e objetos, podar amostras com grandes perdas durante o treinamento e usar técnicas baseadas em memória para identificar amostras limpas. Sistemas com reconhecimento de tempo são amplamente utilizados em recomendações sequenciais, mas apresentam desempenho limitado em situações de filtragem colaborativa. Muitas abordagens temporais concentram-se na integração de carimbos de data/hora em modelos sequenciais ou na construção de gráficos de objetos com base na ordem temporal, mas não conseguem abordar a complexa interação entre padrões temporais e ruído na interação do usuário.
Pesquisadores da Universidade de Illinois em Urbana-Champaign EUA e da Amazon EUA propuseram o DeBaTeR, uma nova maneira de descrever gráficos bipartidos temporais em sistemas de recomendação. O método apresenta duas técnicas diferentes: DeBaTeR-A e DeBaTeR-L. A primeira técnica, DeBaTeR-A, concentra-se na reconstrução da matriz de adjacência usando uma pontuação de confiabilidade derivada de incorporações de usuários conscientes do tempo e do objeto, usando métodos de manipulação suaves e difíceis para lidar com comunicações ruidosas. A segunda técnica, DeBaTeR-L, usa um gerador de peso que utiliza incorporação com reconhecimento de tempo para identificar e desponderar conexões potencialmente ruidosas na função de perda.
Uma extensa estrutura de testes é usada para testar o desempenho preditivo e os recursos de remoção de ruído do DeBaTeR em conjuntos de dados de ruído simples e sintéticos para garantir testes robustos. Para conjuntos de dados vanilla, critérios de filtragem específicos são aplicados para reter apenas interações de alta qualidade (classificações ≥ 4 para Yelp e ≥ 4,5 para Amazon Movies and TV) de usuários e itens com alto envolvimento (>50 avaliações). Os conjuntos de dados foram divididos usando uma proporção de 7:3 para treinamento e teste, com variância ruidosa criada pela introdução de 20% de interações aleatórias nos conjuntos de treinamento. A estrutura de teste explora recursos temporais usando um carimbo de data/hora definido do teste original como o horário da consulta de cada usuário, com resultados médios de quatro rodadas de testes.
Resultados experimentais para a questão “Como o método proposto se compara aos métodos convencionais de filtragem colaborativa de gráficos neurais?” mostram o desempenho superior de ambas as variantes do DeBaTeR em todos os conjuntos de dados e múltiplas métricas. O DeBaTeR-L atinge pontuações NDCG mais altas, tornando-o mais adequado para tarefas de classificação, enquanto o DeBaTeR-A apresenta melhor precisão e métricas de recall, indicando seu melhor desempenho para tarefas de recuperação. Além disso, o DeBaTeR-L mostra maior robustez ao trabalhar com conjuntos de dados ruidosos, superando o DeBaTeR-A em todas as métricas adicionais em comparação com seu desempenho em conjuntos de dados simples. A melhoria relativa em relação aos primeiros sete métodos é significativa, confirmando a eficácia de ambos os métodos propostos.
Neste artigo, os pesquisadores apresentaram o DeBaTeR, uma nova abordagem para lidar com ruído em sistemas de recomendação usando geração de incorporação com reconhecimento de tempo. As duas técnicas deste método – DeBaTeR-A para reponderação de matrizes de adjacência e DeBaTeR-L para reponderação de funções de perda fornecem soluções flexíveis para diversas situações de recomendação. O sucesso da estrutura reside na integração de informações temporais e na incorporação de usuários/objetos, o que é demonstrado por meio de extensos experimentos em conjuntos de dados do mundo real. As direções de pesquisas futuras apontam para a exploração de algoritmos de filtragem interativa de gráficos neurais com reconhecimento de tempo e a expansão dos recursos de remoção de ruído para incluir perfis de usuário e atributos de objetos.
Confira Papel. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Se você gosta do nosso trabalho, você vai gostar do nosso jornal.. Não se esqueça de participar do nosso SubReddit de 55k + ML.
[FREE AI WEBINAR] Usando processamento inteligente de documentos e GenAI em serviços financeiros e transações imobiliárias– Da estrutura à produção
Sajjad Ansari se formou no último ano do IIT Kharagpur. Como entusiasta da tecnologia, ele examina as aplicações da IA com foco na compreensão do impacto das tecnologias de IA e suas implicações no mundo real. Seu objetivo é transmitir conceitos complexos de IA de maneira clara e acessível.
🐝🐝 Evento do LinkedIn, 'Uma plataforma, possibilidades multimodais', onde o CEO da Encord, Eric Landau, e o chefe de engenharia de produto, Justin Sharps, falarão sobre como estão reinventando o processo de desenvolvimento de dados para ajudar o modelo de suas equipes – a IA está mudando o jogo, rápido.