IBM lança modelos de IA Granite 3.0 2B e 8B para empresas de IA

A inteligência artificial está a avançar rapidamente, mas as empresas enfrentam muitos desafios quando tentam utilizar a IA de forma eficaz. As organizações precisam de modelos que sejam flexíveis, seguros e capazes de compreender contextos específicos de domínio, ao mesmo tempo que mantêm a conformidade com os padrões de privacidade. Os modelos tradicionais de IA muitas vezes têm dificuldades para fornecer essa funcionalidade personalizada, exigindo que as empresas façam escolhas entre personalização e funcionalidade geral. Além disso, muitos modelos de IA carecem de transparência, o que impede a confiança entre os utilizadores empresariais.

A IBM lançou oficialmente os modelos Granite 3.0 AI, uma nova linha de modelos básicos projetados para trazer recursos avançados de IA para as empresas. Esses modelos representam um avanço significativo nos esforços contínuos da IBM para fornecer às empresas soluções de IA que não sejam apenas altamente eficientes, mas também seguras e confiáveis. Os modelos Granite 3.0 são projetados para oferecer suporte a uma variedade de casos de uso em ambientes de negócios, desde a compreensão da linguagem natural até o suporte a processos avançados de tomada de decisão. Construído na plataforma de dados e IA watsonx da IBM, o Granite 3.0 visa permitir que as empresas integrem facilmente a IA em seus fluxos de trabalho, melhorando assim a eficiência e, ao mesmo tempo, atendendo aos requisitos específicos de segurança e privacidade que as empresas frequentemente exigem.

Tecnicamente falando, os modelos de IA Granite 3.0 da IBM são construídos com base em modelos linguísticos de grande escala (LLMs), projetados especificamente para aplicações de IA de negócios. Isso inclui os modelos somente de decodificador compacto 8B e 2B, que funcionam ignorando o Llama-3.1 8B do mesmo tamanho na tabela de classificação OpenLLM (v2) do Hugging Face. Modelos treinados em mais de 12 bilhões de tokens em 12 idiomas e 116 linguagens de programação, fornecendo uma base flexível para tarefas de processamento de linguagem natural (PNL) e garantindo privacidade e segurança. Com recursos que vão desde a compreensão de dados não estruturados, geração de conteúdo, resumo de informações e até mesmo facilitação de tomadas de decisões complexas, o Granite 3.0 oferece os poderosos recursos da PNL de maneira segura e transparente.

Além disso, esses modelos são abertos e extensíveis, dando aos desenvolvedores a liberdade de adaptá-los de acordo com as necessidades do seu negócio. Os modelos são licenciados sob Apache 2.0, com dados e métodos de treinamento expostos e estão disponíveis na plataforma IBM Watsonx e por meio de parceiros. Notavelmente, os modelos foram treinados com energia 100% renovável, ressaltando o compromisso da IBM com a sustentabilidade.

Uma das principais razões pelas quais o Granite 3.0 é um desenvolvimento tão importante é o seu foco na abertura, escalabilidade e transparência, que aborda uma das principais barreiras à adoção da IA em ambientes de negócios: a confiança. O Granite 3.0 oferece transparência sobre como os modelos são construídos, com documentação completa disponível, facilitando o entendimento das empresas sobre como o modelo toma decisões. Além disso, a integração do Granite 3.0 com a plataforma Watsonx significa que ele se beneficia das ferramentas Watsonx, incluindo a capacidade de gerenciar dados, monitorar modelos e ajustar rapidamente.

De acordo com benchmarks da IBM, o Granite 3.0 demonstrou maior precisão em tarefas específicas de campo em comparação com modelos anteriores, resultando em maior eficiência na tomada de decisões para usuários corporativos. Os modelos competem com os modelos Meta e Mistral AI em benchmarks acadêmicos, lideram no RAGBench em aplicativos empresariais, lideram em benchmarks de segurança cibernética e superam seus pares em benchmarks de chamada de tarefas. A durabilidade líder do setor no benchmark rápido da AttaQ demonstra a confiabilidade do Granite 3.0. O uso de materiais de código aberto também permite que as organizações testem e refinem modelos para atender às suas necessidades específicas, reduzindo o tempo e o esforço necessários para a personalização e implantação de IA.

A versão Granite 3.0 inclui ofertas bem definidas, como os modelos Mixture of Experts (MoE) – 3B-A800M e 1B-A400M – projetados para dispositivos de alto desempenho, servidores de CPU e casos de uso de baixa latência. Além disso, o modelo de decodificador preditivo acelera as previsões em 220%, graças aos novos processos de estado do token e ao treinamento em dois estágios. Essas melhorias tornam o Granite 3.0 especialmente atraente para empresas que precisam não apenas de alto desempenho, mas também de opções de implantação eficientes e econômicas.

Os modelos de IA do IBM Granite 3.0 marcam um salto significativo para a IA corporativa, concentrando-se nas necessidades específicas de segurança, adaptabilidade e transparência. Ao fornecer modelos abertos e extensíveis que incluem a plataforma Watsonx AI da IBM, o Granite 3.0 ajuda as empresas a superar algumas das barreiras comuns à adoção de IA, como preocupações com privacidade, falta de personalização e confiança em sistemas de IA. A flexibilidade do Granite 3.0 com funções de linguagem natural, combinada com a sua transparência e capacidades de fácil integração, posiciona-o como uma ferramenta essencial para empresas que procuram utilizar a IA de forma eficaz e responsável. À medida que as organizações continuam a enfrentar os desafios da implementação de IA, o Granite 3.0 da IBM serve como base ideal para impulsionar a inovação, a eficiência e melhorar a tomada de decisões em todos os setores.

Confira Detalhes e modelo em Hugging Face. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Se você gosta do nosso trabalho, você vai gostar do nosso jornal.. Não se esqueça de participar do nosso Mais de 50k ML SubReddit.

[Upcoming Live Webinar- Oct 29, 2024] Melhor plataforma para modelos ajustados: mecanismo de inferência Predibase (avançado)

Asif Razzaq é o CEO da Marktechpost Media Inc. Como empresário e engenheiro visionário, Asif está empenhado em aproveitar o poder da Inteligência Artificial em benefício da sociedade. Seu mais recente empreendimento é o lançamento da Plataforma de Mídia de Inteligência Artificial, Marktechpost, que se destaca por sua ampla cobertura de histórias de aprendizado de máquina e aprendizado profundo que parecem tecnicamente sólidas e facilmente compreendidas por um amplo público. A plataforma possui mais de 2 milhões de visualizações mensais, o que mostra sua popularidade entre o público.

Ouça nossos podcasts e vídeos de pesquisa de IA mais recentes aqui ➡️

Source link

Você também pode gostar...

Ataque de falha de falácia: uma nova abordagem de IA para explorar a incapacidade de grandes modelos de linguagem de gerar pensamento falácia

Os pesquisadores da Universidade de Bath desenvolveram métodos eficientes e estáveis ​​do treinamento em nefip com ODPEs com a memória do pé O (1)

Solicitação de cadeia de captura: tudo o que você precisa saber sobre isso

Deixe um comentário Cancelar resposta

Os pesquisadores da Universidade de Bath desenvolveram métodos eficientes e estáveis do treinamento em nefip com ODPEs com a memória do pé O (1)