Marqo introduziu quatro conjuntos de dados básicos e modelos avançados de comércio eletrônico incorporados projetados para melhorar a pesquisa de produtos, recuperação e recursos de recomendação no comércio eletrônico. Esses modelos, Marqo-Ecommerce-B e Marqo-Ecommerce-L, oferecem melhorias significativas na precisão e relevância das plataformas de comércio eletrônico, fornecendo apresentações incorporadas de dados de produtos de alta qualidade. Juntamente com esses modelos, Marqo lançou uma série de conjuntos de dados de teste, incluindo AmazonProducts-3m, GoogleShopping-1m, AmazonProducts-Eval-100k e GoogleShopping-General-Eval-100k, para fornecer uma base sólida para benchmarking e comparação do modelo.
Recém-introduzido Marqo-Ecommerce-B de novo Marqo-Ecommerce-L modelos de incorporação representam um passo importante nos sistemas de pesquisa e recomendação de comércio eletrônico. O Marqo-Ecommerce-B, com 203 milhões de parâmetros, e o Marqo-Ecommerce-L, com 652 milhões de parâmetros, foram desenvolvidos para capturar recursos complexos em imagens de produtos e descrições de texto. Esses modelos sugerem treinamento extensivo em dados de produtos cruzados para facilitar comparações múltiplas e melhorar a compreensão do conteúdo dos atributos de produtos cruzados.
Para demonstrar o desempenho desses modelos, Marqo utilizou dois importantes conjuntos de dados para testes: AmazonProducts-3m e GoogleShopping-1m. Esses conjuntos de dados permitem que os usuários testem e validem os recursos do modelo em cenários de comércio eletrônico, simulando a diversidade e a complexidade de uma plataforma de comércio eletrônico do mundo real.
Os resultados da simulação sublinham o desempenho impressionante dos modelos de Marqo. Marqo-Ecommerce-L, o maior dos dois modelos, apresentou uma melhoria média de 17,6% no Mean Reciprocal Rank (MRR) e 20,5% no nDCG@10 em comparação com o melhor modelo de código aberto, ViT-SO400M-14-SigLIP, para todas as atividades dentro do conjunto de dados Marqo-Ecommerce-Hard. Comparado ao modelo proprietário da Amazon, Amazon-Titan-Multimodal, o Marqo-Ecommerce-L obteve melhorias ainda mais significativas: 38,9% em MRR, 45,1% em nDCG@10 e 35,9% em Recall para todas as funções de texto para imagem. . Essas métricas destacam as capacidades da Marqo-Ecommerce-L em combinar com precisão os produtos certos e seu alto desempenho na compreensão de entradas textuais e visuais complexas.
Quatro conjuntos de dados foram extraídos
Para apoiar o teste do modelo, Marqo extraiu quatro conjuntos de dados, cada um com uma finalidade diferente em pesquisa e desenvolvimento relacionado ao comércio eletrônico:
- AmazonProducts-3m: Este grande conjunto de dados de três milhões de produtos Amazon foi projetado para testes de modelos de alta qualidade. Ele fornece uma variedade de dados de produtos, incluindo imagens e descrições de texto, que desafiam os modelos a capturar com precisão as nuances nas características dos produtos em diversas categorias.
- GoogleShopping-1m: Este conjunto de dados inclui um milhão de entradas do Google Shopping e fornece uma perspectiva diferente do conjunto de dados AmazonProducts, que fornece produtos que podem ter atributos exclusivos ou um produto. Este conjunto de dados permite testes abrangentes da adaptabilidade do modelo a diversas plataformas de comércio eletrônico e categorias de produtos.
- AmazonProducts-Eval-100k: uma versão mais compacta do AmazonProducts-3m, AmazonProducts-Eval-100k foi projetado para pesquisadores que podem precisar de uma pequena amostra para testes iniciais ou refinamento de modelo. Ele mantém a diversidade de atributos do produto encontrados no AmazonProducts-3m, permitindo uma avaliação rápida, porém completa, do desempenho do modelo.
- GoogleShopping-General-Eval-100k: GoogleShopping-General-Eval-100k é uma versão abreviada do GoogleShopping-1m, que permite uma avaliação eficiente com diversas ferramentas de cálculo. Este conjunto de dados fornece acesso aos principais recursos dos dados do Google Shopping, tornando-o adequado para testes rápidos e ajuste de modelo iterativo.
Os modelos incorporáveis do Marqo estão disponíveis no Hugging Face, permitindo que os desenvolvedores os carreguem facilmente em aplicativos de comércio eletrônico baseados em texto e imagem. Com a biblioteca Transformers do Hugging Face, os usuários podem integrar perfeitamente os modelos do Marqo em seus aplicativos. Por exemplo, com trechos de código simples, os usuários podem carregar Marqo-Ecommerce-L ou Marqo-Ecommerce-B usando as classes `AutoModel` e `AutoProcessor`. Os modelos podem ser usados para processar e analisar imagens e textos de produtos, facilitando aos usuários a extração de incorporações de alta qualidade que facilitam pesquisas e recomendações eficazes de produtos.
Alternativamente, os modelos do Marqo podem ser carregados usando `open_clip` para usuários executando OpenCLIP. Esta estrutura permite aos usuários pré-processar imagens de produtos e tokenizar a entrada de texto, modelando a arquitetura do Marqo para você. Os resultados gerados com o OpenCLIP fornecem oportunidades de rótulos que mostram a importância de uma determinada imagem ou texto para os rótulos de determinados produtos, auxiliando na categorização precisa e na recomendação de produtos.
Um componente central do teste do modelo de Marqo é o Generalized Contrastive Learning (GCL), um método que melhora a eficiência da correspondência texto-imagem e correspondência imagem-texto. Ao usar GCL, Marqo garante que seus modelos identifiquem relacionamentos falhos entre dados textuais e visuais. Esse recurso é essencial para qualquer plataforma de comércio eletrônico que forneça recomendações confiáveis e funcionalidade robusta de pesquisa de produtos.
Marqo incluiu os scripts de teste necessários, facilitando aos desenvolvedores a replicação de resultados de marcação e o teste de dados adicionais. Com GCL como principal método de teste, os modelos da Marqo são desenvolvidos para aplicações de comércio eletrônico do mundo real que exigem incorporação altamente precisa de todos os detalhes variados e complexos.
O lançamento desses modelos e conjuntos de dados pela Marqo apresenta muitas aplicações práticas para empresas de comércio e pesquisadores. Os profissionais de marketing podem usar os modelos da Marqo para implementar recomendações precisas de produtos, realizar pesquisas de produtos mais rápidas e precisas e melhorar a satisfação do cliente, melhorando a relevância de suas plataformas. Os investigadores também podem beneficiar da amplitude e diversidade do conjunto de dados, utilizando-os como referências para comparar os seus modelos ou ampliar os limites dos sistemas de recomendação de comércio eletrónico.
Concluindo, os novos modelos de incorporação e conjuntos de dados da Marqo marcam um marco no desenvolvimento da IA do comércio eletrônico. Ao fornecer modelos robustos e de alto desempenho e conjuntos de dados cuidadosamente selecionados, a Marqo fornece às empresas de comércio e à comunidade de pesquisa ferramentas valiosas para realizar pesquisas de produtos e recomendações inovadoras. Estes recursos sublinham a importância crescente da IA na transformação do comércio eletrónico e estabelecem uma nova referência para o que os modelos de IA neste setor podem alcançar.
Confira Modelos e conjuntos de dados aqui. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Se você gosta do nosso trabalho, você vai gostar do nosso jornal.. Não se esqueça de participar do nosso SubReddit de 55k + ML.
[FREE AI WEBINAR] Usando processamento inteligente de documentos e GenAI em serviços financeiros e transações imobiliárias– Da estrutura à produção
Asif Razzaq é o CEO da Marktechpost Media Inc. Como empresário e engenheiro visionário, Asif está empenhado em aproveitar o poder da Inteligência Artificial para o benefício da sociedade. Seu mais recente empreendimento é o lançamento da Plataforma de Mídia de Inteligência Artificial, Marktechpost, que se destaca por sua ampla cobertura de histórias de aprendizado de máquina e aprendizado profundo que parecem tecnicamente sólidas e facilmente compreendidas por um amplo público. A plataforma possui mais de 2 milhões de visualizações mensais, o que mostra sua popularidade entre os telespectadores.
🐝🐝 Evento do LinkedIn, 'Uma plataforma, possibilidades multimodais', onde o CEO da Encord, Eric Landau, e o chefe de engenharia de produto, Justin Sharps, falarão sobre como estão reinventando o processo de desenvolvimento de dados para ajudar o modelo de suas equipes – a IA está mudando o jogo, rápido.