A mineração de dados é essencial para descobrir padrões e relacionamentos significativos em grandes conjuntos de dados. Essas informações permitem a tomada de decisões informadas nos diversos setores de varejo, saúde e financeiro. A principal técnica neste domínio é a mineração de regras de associação, que identifica a relação entre variáveis em dados relacionados, para facilitar aplicações como análise do comportamento do cliente, otimização de estoque e recomendações personalizadas.
Um desafio constante na legislação federal de mineração é medir a contribuição de elementos individuais para a força das leis produzidas. Compreender esta contribuição é essencial para interpretar os resultados e utilizá-los de forma eficaz. No entanto, a complexidade das dependências entre os elementos de dados torna esta tarefa difícil. As informações obtidas podem carecer de clareza e aplicação prática sem uma medição precisa.
Os métodos existentes para avaliar a importância dos factores nas regras organizacionais baseiam-se frequentemente em heurísticas, que podem não reflectir com precisão a verdadeira contribuição de cada componente. Esses métodos também podem ser computacionalmente caros, especialmente para grandes conjuntos de dados, limitando sua escalabilidade e desempenho no mundo real. Esta limitação enfatiza a necessidade de um método eficiente e preciso.
Uma equipe de pesquisadores da Universidade de Bar-Ilan e da Universidade da Pensilvânia desenvolveu uma nova medida da contribuição de um fator para um conjunto de regras organizacionais, chamada SHARQ (Shapley Rules Quantification), baseada nos valores de Shapley do teoria dos jogos cooperativos. Seu trabalho inclui uma estrutura eficiente para calcular o valor SHARQ exato de um único elemento. O tempo de execução deste cálculo é aproximadamente proporcional ao número de regras, que abordam problemas de escalabilidade, mantendo a precisão.
A estrutura SHARQ calcula os valores de Shapley para determinar o valor médio da contribuição de cada elemento em todos os componentes de regra possíveis. Os pesquisadores desenvolveram um algoritmo que simplifica esse processo, garantindo cálculos precisos e redução significativa do tempo de operação. Além disso, esta estrutura suporta computação SHARQ multicomponente, o que permite a avaliação simultânea de múltiplos componentes, reduzindo o esforço computacional. Este método garante que o método seja eficaz para analisar conjuntos de dados complexos e grandes conjuntos de regras.
Os pesquisadores demonstraram a eficiência computacional do SHARQ usando um algoritmo de item único, que atinge um tempo de execução aproximadamente igual ao número de regras. Além disso, eles desenvolveram um algoritmo SHARQ multiobjetivo que integra cálculos em vários objetos. Este design melhora a eficiência, garantindo que a estrutura permaneça computacionalmente eficiente mesmo quando aplicada a grandes conjuntos de regras baseadas em conjuntos de dados complexos. Estes resultados enfatizam a robustez e o desempenho do SHARQ para aplicações do mundo real.
SHARQ melhora os processos de tomada de decisão baseados em mineração organizacional, fornecendo uma medida robusta e interpretável das contribuições de recursos. Sua capacidade de especificar a função de componentes de dados individuais garante insights acionáveis, tornando-o uma ferramenta valiosa para analistas e tomadores de decisão em diversos domínios.
Concluindo, este estudo aborda o desafio de quantificar a importância dos fatores nas regras de agregação através da introdução do SHARQ, uma medida baseada nos valores de Shapley. A eficiência e precisão da estrutura marcam um avanço significativo neste campo, fornecendo uma solução abrangente para a interpretação de dados relacionais complexos.
Confira Papel. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Não se esqueça de participar do nosso SubReddit de 60k + ML.
🚨 Tendências: LG AI Research Release EXAONE 3.5: Modelos de três níveis de IA bilíngue de código aberto oferecem seguimento de comando incomparável e insights profundos de conteúdo Liderança global em excelência em IA generativa….
Nikhil é consultor estagiário na Marktechpost. Ele está cursando dupla graduação em Materiais no Instituto Indiano de Tecnologia, Kharagpur. Nikhil é um entusiasta de IA/ML que pesquisa constantemente aplicações em áreas como biomateriais e ciências biomédicas. Com sólida formação em Ciência de Materiais, ele explora novos desenvolvimentos e cria oportunidades para contribuir.
🧵🧵 [Download] Avaliação do relatório de trauma do modelo de linguagem principal (estendido)