Meta AI Just Open Sourced Llama 3.3: Novo modelo multilíngue grande 70B (LLM)

Meta AI acaba de ser lançado Lama 3.3é um modelo de linguagem de código aberto projetado para fornecer melhor desempenho e qualidade para aplicações baseadas em texto, como geração de dados sintéticos, a um custo muito menor. O Llama 3.3 aborda alguns dos principais desafios no espaço da PNL, fornecendo uma solução econômica e fácil de usar. As melhorias nesta versão se devem a um novo processo de alinhamento e aos avanços no aprendizado por reforço online. Essencialmente, o Llama 3.3 oferece a mesma funcionalidade de seu antecessor, Llama 3.1–405B, mas com um modelo menor, de 70 bilhões de parâmetros, que pode ser executado em hardware de desenvolvedor padrão. Isso torna os recursos avançados de IA acessíveis a um público mais amplo.

O Llama 3.3 vem com muitas melhorias técnicas que melhoram seu desempenho. Uma das maiores melhorias é a redução no número de parâmetros – de 405 bilhões no Llama 3.1 para apenas 70 bilhões – sem sacrificar o desempenho. Isto foi conseguido através de melhores preferências online e melhor alinhamento durante o processo de formação. O alinhamento do modelo com as preferências do usuário, alimentado pela aprendizagem por reforço, significa que ele pode gerar respostas altamente relevantes e conscientes do contexto. O tamanho pequeno facilita a implantação, pois requer menos energia e memória. Os desenvolvedores agora podem executar o Llama 3.3 em seus próprios computadores, em vez de depender de GPUs caras ou infraestrutura em nuvem, expandindo enormemente o acesso a ferramentas de PNL de alta qualidade.

A Meta AI testou extensivamente o Llama 3.3 e os resultados foram muito bons. O modelo teve um bom desempenho em vários benchmarks, destacando-se em tarefas como resposta a consultas, resumo e geração de dados sintéticos. Ele mostrou desempenho comparável ao modelo maior Llama 3.1–405B, mas com requisitos de computação muito mais baixos. Isso o torna uma ótima opção para desenvolvedores e organizações que antes não conseguiam usar grandes modelos de linguagem. O Llama 3.3 também possui fortes recursos multilíngues, tornando-o adequado para aplicações que exigem a compreensão de vários idiomas. A Meta AI destacou suas sugestões econômicas, tornando-a uma opção viável para criação de conteúdo, geração artificial de dados e ferramentas interativas como chatbots, especialmente em ambientes com recursos limitados.

Resumindo, o Llama 3.3 é um grande passo em frente para tornar modelos de linguagem poderosos mais acessíveis. Ao fornecer processamento de modelos em grande escala de maneira altamente eficiente, que pode ser executado em hardware padrão, o Meta AI ajuda a reduzir as barreiras à implementação de tecnologias avançadas de PNL. O Llama 3.3 traz ferramentas sofisticadas de IA para uma ampla gama de pessoas, incluindo desenvolvedores, educadores e pesquisadores, incentivando a inovação e a criatividade no espaço da IA.

Confira Modelo abraçando o rosto. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Se você gosta do nosso trabalho, você vai gostar do nosso jornal.. Não se esqueça de participar do nosso SubReddit de 60k + ML.

🚨 [Partner with us]: 'Próxima revista/relatório – IA de código aberto na manufatura'

Asif Razzaq é o CEO da Marktechpost Media Inc. Como empresário e engenheiro visionário, Asif está empenhado em aproveitar o poder da Inteligência Artificial em benefício da sociedade. Seu mais recente empreendimento é o lançamento da Plataforma de Mídia de Inteligência Artificial, Marktechpost, que se destaca por sua ampla cobertura de histórias de aprendizado de máquina e aprendizado profundo que parecem tecnicamente sólidas e facilmente compreendidas por um amplo público. A plataforma possui mais de 2 milhões de visualizações mensais, o que mostra sua popularidade entre os telespectadores.

🚨🚨 WEBINAR DE IA GRATUITO: 'Acelere suas aplicações LLM com deepset e Haystack' (promovido)

Source link

Você também pode gostar...

Lançado Transformers.js v3: trazendo poder e flexibilidade ao aprendizado de máquina baseado em navegador

FunctionChat-Bench: um teste abrangente de recursos de modelagem de linguagem em todos os contextos interativos

Avaliando o desempenho do aprendizado de máquina na resolução de equações diferenciais: abordando bases fracas e preconceitos de relatórios

Deixe um comentário Cancelar resposta