Microsoft AI acaba de abrir totalmente o Phi-4: Modelo de microlinguagem disponível em Hug Face sob licença do MIT

Microsoft tem isso Phi-4 de código aberto, um modelo de minilinguagem compacto e eficiente, no Hugging Face sob a licença do MIT. Esta decisão destaca a mudança em direção à transparência e colaboração na comunidade de IA, oferecendo novas oportunidades aos desenvolvedores e pesquisadores.

O que é o Microsoft Phi-4?

Phi-4 é um modelo de linguagem de 14 bilhões de parâmetros construído com foco na qualidade e eficiência dos dados. Ao contrário da maioria dos modelos que dependem fortemente de fontes de dados biológicos, o Phi-4 incorpora dados sintéticos de alta qualidade gerados através de métodos inovadores, como informações multiagentes, instrução reversa e autorrelato da tarefa de autorrelato. Essas técnicas melhoram suas habilidades de raciocínio e resolução de problemas, tornando-os adequados para tarefas que exigem diferentes entendimentos.

Phi-4 é construído em uma arquitetura Transformer somente decodificador com um comprimento de núcleo estendido de 16k tokens, garantindo flexibilidade para aplicações que envolvem grandes entradas. Seu pré-treinamento envolveu quase 10 bilhões de tokens, usando uma combinação de dados biológicos artificiais e altamente selecionados para alcançar um forte desempenho em benchmarks como MMLU e HumanEval.

Recursos e benefícios

Compacto e acessível: funciona efetivamente em hardware de consumo.
Consulta melhorada: Excede antecessores e modelos importantes em carreiras focadas em STEM.
Personalize-o: Ele oferece suporte ao ajuste fino com vários conjuntos de dados sintéticos adaptados para necessidades específicas de domínio.
Fácil Integração: Disponível em Hugging Face com documentação detalhada e APIs.

Por que código aberto?

O Phi-4 de código aberto incentiva a colaboração, a transparência e a ampla descoberta. Motivações importantes incluem:

Desenvolvimento Colaborativo: Pesquisadores e engenheiros podem melhorar o desempenho do modelo.
Acesso à Educação: Ferramentas gratuitas que permitem aprendizado e exploração.
Diversidade de Engenharia: O desempenho e o preço acessível do Phi-4 o tornam uma opção atraente para aplicações do mundo real.

Inovações Tecnológicas em Phi-4

O desenvolvimento do Phi-4 foi orientado por três pilares:

Dados transacionais: Gerados usando métodos multiagentes e de autocura, os dados artificiais formam o núcleo do processo de treinamento do Phi-4, melhorando o poder de inferência e reduzindo a dependência de dados naturais.
Melhorias pós-treinamento: Técnicas como descarte de amostras e Otimização de preferência direta (DPO) melhoram a qualidade da saída e o alinhamento com as preferências humanas.
Dados de treinamento não contaminados: Procedimentos rigorosos de filtragem garantiram a extração de dados e benchmarks sobrepostos, melhorando a generalização.

Phi-4 também usa Pivotal Token Search (PTS) para identificar pontos-chave de tomada de decisão em suas respostas, refinando sua capacidade de lidar com tarefas pesadas de raciocínio com eficiência.

Acesso ao Phi-4

Phi-4 está hospedado no Hugging Face sob a licença do MIT. Os usuários podem:

Acesse o código do modelo e a documentação.
Ajuste-o para tarefas específicas usando os conjuntos de dados e ferramentas fornecidos.
Estenda APIs para integração perfeita em projetos.

Impacto na IA

Ao reduzir as barreiras às ferramentas avançadas de IA, a Phi-4 promove:

Crescimento da pesquisa: Prepara-se para exames em áreas como STEM e atividades multilíngues.
Educação Avançada: Fornece um recurso de aprendizagem eficaz para alunos e professores.
Aplicações Industriais: permite soluções econômicas para desafios como suporte ao cliente, tradução e resumo de documentos.

Sociedade e o Futuro

O lançamento do Phi-4 foi bem recebido, com desenvolvedores compartilhando adaptações bem ajustadas e novos aplicativos. Sua capacidade de ter um bom desempenho em benchmarks de pensamento STEM demonstra sua capacidade de redefinir quais tipos de linguagens podem ser acessadas. Espera-se que a colaboração da Microsoft com a Hugging Face leve ao software de código aberto, promovendo a inovação em IA.

A conclusão

A oferta aberta do Phi-4 demonstra o compromisso da Microsoft em democratizar a IA. Ao disponibilizar gratuitamente um poderoso modelo de linguagem, a empresa permite que uma comunidade global inove e colabore. À medida que o Phi-4 continua a encontrar uma variedade de aplicações, ele demonstra o potencial transformador da IA de código aberto no avanço da pesquisa, da educação e da indústria.

Obrigado a todos que pediram à Microsoft para abrir o código Phi4, funcionou!

Que outro modelo é atualmente mantido em segredo/código fechado/por trás da API e deve ser divulgado ao mundo para obter o máximo impacto? pic.twitter.com/CTrd899mCo

-clem 🤗 (@ClementDelangue) 8 de janeiro de 2025

Confira Papel e modelo na mesma face. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Não se esqueça de participar do nosso SubReddit de 60k + ML.

🚨 PRÓXIMO WEBINAR GRATUITO DE IA (15 DE JANEIRO DE 2025): Aumente a precisão do LLM com dados artificiais e inteligência experimental–Participe deste webinar para obter insights práticos sobre como melhorar o desempenho e a precisão do modelo LLM e, ao mesmo tempo, proteger a privacidade dos dados.

Asif Razzaq é o CEO da Marktechpost Media Inc. Como empresário e engenheiro visionário, Asif está empenhado em aproveitar o poder da Inteligência Artificial em benefício da sociedade. Seu mais recente empreendimento é o lançamento da Plataforma de Mídia de Inteligência Artificial, Marktechpost, que se destaca por sua ampla cobertura de histórias de aprendizado de máquina e aprendizado profundo que parecem tecnicamente sólidas e facilmente compreendidas por um amplo público. A plataforma possui mais de 2 milhões de visualizações mensais, o que mostra sua popularidade entre o público.

✅ [Recommended Read] Nebius AI Studio se expande com modelos de visão, novos modelos de linguagem, incorporados e LoRA (Aprimorado)

Source link

O que é o Microsoft Phi-4?

Recursos e benefícios

Por que código aberto?

Inovações Tecnológicas em Phi-4

Acesso ao Phi-4

Impacto na IA

Sociedade e o Futuro

A conclusão

Você também pode gostar...

Pesquisadores do Google Cloud e de Stanford propõem CHASE-SQL: uma estrutura de IA para raciocínio multimodal e seleção aprimorada e otimizada de candidatos em Text-to-SQL

Pesquisadores do Google DeepMind propõem RT-Affordance: uma abordagem de recursos que usa custos como representações centrais de políticas

A ferramenta de citação oferece uma nova abordagem para conteúdo confiável gerado por IA | Notícias do MIT

Deixe um comentário Cancelar resposta