Stanford Investigators, UC Berkeley e ETH Zurique lançaram Warp: um mecanismo de estabelecimento de um vetor-vetor com mecanismo de busca rápido e agressivo

O retorno multi-vetor como um desenvolvimento sensível na restauração da informação, especialmente a aprovação dos modelos de remoção de transformadores. Ao contrário da restauração de um vetor, incluindo perguntas e textos como um vetor extra, retorna de múltiplos vetores, permitindo muita documentação de cada documento e cada consulta. Essa abordagem fornece uma série de granulares granulares, melhore a precisão da qualidade de busca e aposentadoria. Com o tempo, os pesquisadores desenvolveram várias estratégias para melhorar a eficiência e a restauração de muitas vectroence, abordando os desafios da gestão no tratamento de grandes conjuntos de dados.

O problema médico no retorno do multi-vetor é medir a eficiência retornando ao trabalho. Os planos de restauração tradicionais são rápidos, mas não conseguem obter relacionamentos semânticos graves nos documentos. Por outro lado, as maneiras corretas de devolver os vetores encontram um local muito alto, porque muitos métodos de maneiras são necessários. Portanto, desafio para fazer um sistema como desejado devolver muitos vetores. No entanto, além da sobrecarga computacional, é a mais reduzida para fazer a pesquisa em tempo real por uma grande solicitação.

Vários progressos são introduzidos para aumentar a eficiência no retorno do multi-vetor. Colbert apresentou o caminho para trabalhar o suficiente para adicionar a recuperação, fazendo a integração das perguntas que funcionam bem. Em seguida, Colbertv2 e Playert enfatizaram novamente em apreciação por altas estratégias por dimensão e bolos preparados em C ++. Da mesma forma, o esboço do XTR do Google DeepMind facilitou o processo de pontuação sem exigir uma categoria privada do documento. No entanto, esses modelos ainda estão ativos em tendência, especialmente tokens e tokens e os documentos do documento, tornando a latência relacionada ao uso de recursos.

A equipe de pesquisa da ETH Zurich, UC Berkeley e Stanford University introduziu o Warp, um mecanismo de busca projetado para adicionar a Recuperação de Colbert baseada em XPR. A urdidura inclui o desenvolvimento da Colbertv2 e inclui xadrez ao mesmo tempo em que insere desempenho diferente para melhorar os reembolsos. O estabelecimento básico da urdidura, incluindo o WarpSelect, os meios de energia dinâmica removendo habilidades desnecessárias, um processo de diminuição abrangente para as atividades de memória e uma diminuição na fase de duas classes. Esses aprimoramentos permitem que a Warp traga um grande progresso sem comprometer a qualidade.

O mecanismo de deformação está usando uma maneira sistemática de fazer bem para melhorar o desempenho da eficiência. Primeiro, insira as perguntas e escrituras usando o melhor transformador T5 e produz uma taxa de tokens. Em seguida, Warpkecect decide o lucro mais direcionado da questão, evitando o mesmo cálculo. Em vez de uma má conduta clara durante o retorno, a urdidura faz toda a deterioração para reduzir a computação sobre a superfície. Como reduzir as duas categorias é usado para calcular as pontuações do documento corretamente. Esta é a combinação da qualidade dos tokens e resume as posições dos documentos dos documentos por várias variáveis, tornam a urdidura bem organizada em comparação com outros motores de retorno em comparação.

A urdidura está aumentando bastante o trabalho, reduzindo o tempo para o processamento mais. Os resultados do teste indicam que as adições de latência de ponta a ponta, a urdidura pode atingir três programas sobre o Colbertv2 / Plaid. O tamanho do índice também é organizado, vencendo os requisitos finais do 2x-4x, existem maneiras básicas. Além disso, a Warp sofreu modelos pré-recuperados, mantendo uma alta qualidade em todos os conjuntos de dados de referência.

O Desenvolvimento de Warp percebe um passo importante para a restauração da restauração dos vetores. A equipe de pesquisa desenvolveu com sucesso velocidades e eficiência, combinando as novas técnicas de gravação com estruturas de retorno estabelecidas. Os estudos destacam a importância de reduzir as garrafas de contato, mantendo a qualidade do retorno. O lançamento do Warp abre o caminho para futuros programas de desenvolvimento nos programas de pesquisa de vários vetores, que fornecem uma solução limitada para a velocidade e a recuperação de informações precisas.

Enquete Página e papel do github. Todo o crédito deste estudo é pesquisado para este projeto. Além disso, não se esqueça de seguir Sane e junte -se ao nosso Estação de telégrafo incluindo LinkedIn grtópico. Não se esqueça de se juntar ao nosso 70k + ml subreddit.

🚨 Conheça o trabalho: um código aberto aberto com várias fontes para verificar o programa difícil AI ^(Atualizado)

Nikhil é um estudante de estudantes em Marktechpost. Perseguindo graduados integrados combinados no Instituto Indiano de Tecnologia, Kharagpur. Nikhl é um entusiasmo de interface do usuário / ml que procura aplicativos como biomotomentores e ciências biomédicas. Após um sólido na ciência material, ele examina novos empreendimentos e desenvolvendo oportunidades de contribuir.

✅ [Recommended] Junte -se ao nosso canal de telégrafo

Source link

Você também pode gostar...

Decodificação Contrastiva Dinâmica (DCD): um novo método de IA que remove seletivamente logs infiéis para melhorar a precisão da resposta em modelos de percepção de linguagem em grande escala

Pesquisadores da EPFL lançam 4M: uma estrutura de treinamento de código aberto para desenvolver IA multimodal

AMD lança AMD-135M: a primeira série de modelos de linguagem pequena da AMD treinada do zero em aceleradores AMD Instinct™ MI250 usando tokens 670B

Deixe um comentário Cancelar resposta