Do ONNX à incorporação estática: o que torna os conversores de frases v3.2.0 uma virada de jogo?
Inteligência artificial

Do ONNX à incorporação estática: o que torna os conversores de frases v3.2.0 uma virada de jogo?


Há uma necessidade crescente de incorporar modelos que equilibrem precisão, eficiência e flexibilidade. Os modelos existentes muitas vezes lutam para alcançar esse equilíbrio, especialmente em situações que vão desde utilidades de baixo desempenho até aplicações de alto valor. A necessidade de incorporação de alto desempenho e alta qualidade impulsionou o desenvolvimento de novas soluções para atender a essas necessidades em evolução.

Visão geral dos conversores de frases v3.2.0

Sentence Transformers v3.2.0 é o maior lançamento em dois anos, oferecendo melhorias significativas na pesquisa semântica e no aprendizado de representação. Ele se baseia em versões anteriores com novos recursos que melhoram a usabilidade e a robustez. Esta versão se concentra em treinamento aprimorado e eficiência de conceitos, suporte estendido ao modelo de transformador e melhor estabilidade, tornando-o adequado para diversas configurações e grandes instalações de produção.

Aprimoramentos tecnológicos

Do ponto de vista técnico, o Sentence Transformers v3.2.0 traz várias melhorias notáveis. Uma das principais melhorias está no gerenciamento de memória, incluindo técnicas aprimoradas para gerenciar grandes conjuntos de dados, permitindo um treinamento mais rápido e eficiente. Esta versão também permite melhor utilização da GPU, reduzindo o tempo de projeção em até 30% e tornando mais viáveis ​​as aplicações em tempo real.

Além disso, a v3.2.0 introduz dois novos backends para modelos de incorporação: ONNX e OpenVINO. O backend ONNX usa o ONNX Runtime para acelerar a renderização do modelo na CPU e na GPU, atingindo velocidades de até 1,4x-3x, dependendo da precisão. Também inclui métodos auxiliares para otimizar e estimar modelos para referência rápida. O backend OpenVINO, que usa o kit de ferramentas OpenVINO da Intel, ignora o ONNX em alguns casos na CPU. A compatibilidade estendida com a biblioteca Hugging Face Transformers permite fácil uso de modelos pré-treinados, proporcionando flexibilidade adicional para uma variedade de aplicações de PNL. Novas técnicas de clustering também garantem que os embeddings sejam mais robustos e significativos, melhorando a qualidade de tarefas como clustering, pesquisa semântica e classificação.

Introdução à incorporação estática

Outro recurso importante é a incorporação estática, uma versão moderna da incorporação de palavras tradicional, como GLoVe e word2vec. Strong Embedding é uma coleção de embeddings de tokens que são somados para criar uma incorporação de texto, permitindo uma incorporação muito rápida sem a necessidade de redes neurais. Eles são inicializados usando Model2Vec, um método para integrar modelos de transformadores de frases em embeddings estáticos, ou inicialização aleatória seguida de refinamento. Model2Vec permite a destilação em segundos, proporcionando uma melhoria de velocidade – 500x mais rápida na CPU em comparação com os modelos tradicionais – enquanto mantém um custo de precisão razoável de cerca de 10-20%. Combinar a incorporação estática e um novo recodificador padrão é uma solução promissora para cenários de pesquisa eficientes.

Funcionalidade e Usabilidade

Sentence Transformers v3.2.0 oferece arquitetura eficiente que reduz restrições de uso em ambientes com recursos limitados. As medições mostram melhorias significativas na velocidade de previsão e qualidade de incorporação, ganhos de precisão de até 10% em tarefas de similaridade semântica. Os back-ends ONNX e OpenVINO fornecem aceleração de 2x a 3x, permitindo implantação em tempo real. Estas melhorias tornam-no mais adequado para uma variedade de casos de utilização, equilibrando desempenho e eficiência, ao mesmo tempo que abordam as necessidades públicas para uma utilização mais ampla.

A conclusão

O Sentence Transformers v3.2.0 melhora muito a eficiência, o uso de memória e a compatibilidade dos modelos, tornando-o mais versátil para todos os aplicativos. Aprimoramentos como técnicas de cluster, otimização de GPU, back-ends ONNX e OpenVINO e integração Hugging Face o tornam adequado para pesquisa e produção. A incorporação estática amplia sua funcionalidade, fornecendo incorporação semântica escalonável e acessível para uma variedade de tarefas.


Confira Detalhes de novo Página de texto. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Se você gosta do nosso trabalho, você vai gostar do nosso jornal.. Não se esqueça de participar do nosso Mais de 50k ML SubReddit.

[Upcoming Live Webinar- Oct 29, 2024] Melhor plataforma para modelos ajustados: mecanismo de inferência Predibase (avançado)


Shobha é um analista de dados com histórico comprovado no desenvolvimento de soluções de aprendizado de máquina que geram valor comercial.





Source link

Você também pode gostar...

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *