Microsoft AI acaba de abrir totalmente o Phi-4: Modelo de microlinguagem disponível em Hug Face sob licença do MIT
Inteligência artificial

Microsoft AI acaba de abrir totalmente o Phi-4: Modelo de microlinguagem disponível em Hug Face sob licença do MIT


Microsoft tem isso Phi-4 de código aberto, um modelo de minilinguagem compacto e eficiente, no Hugging Face sob a licença do MIT. Esta decisão destaca a mudança em direção à transparência e colaboração na comunidade de IA, oferecendo novas oportunidades aos desenvolvedores e pesquisadores.

O que é o Microsoft Phi-4?

Phi-4 é um modelo de linguagem de 14 bilhões de parâmetros construído com foco na qualidade e eficiência dos dados. Ao contrário da maioria dos modelos que dependem fortemente de fontes de dados biológicos, o Phi-4 incorpora dados sintéticos de alta qualidade gerados através de métodos inovadores, como informações multiagentes, instrução reversa e autorrelato da tarefa de autorrelato. Essas técnicas melhoram suas habilidades de raciocínio e resolução de problemas, tornando-os adequados para tarefas que exigem diferentes entendimentos.

Phi-4 é construído em uma arquitetura Transformer somente decodificador com um comprimento de núcleo estendido de 16k tokens, garantindo flexibilidade para aplicações que envolvem grandes entradas. Seu pré-treinamento envolveu quase 10 bilhões de tokens, usando uma combinação de dados biológicos artificiais e altamente selecionados para alcançar um forte desempenho em benchmarks como MMLU e HumanEval.

Recursos e benefícios

  1. Compacto e acessível: funciona efetivamente em hardware de consumo.
  2. Consulta melhorada: Excede antecessores e modelos importantes em carreiras focadas em STEM.
  3. Personalize-o: Ele oferece suporte ao ajuste fino com vários conjuntos de dados sintéticos adaptados para necessidades específicas de domínio.
  4. Fácil Integração: Disponível em Hugging Face com documentação detalhada e APIs.

Por que código aberto?

O Phi-4 de código aberto incentiva a colaboração, a transparência e a ampla descoberta. Motivações importantes incluem:

  • Desenvolvimento Colaborativo: Pesquisadores e engenheiros podem melhorar o desempenho do modelo.
  • Acesso à Educação: Ferramentas gratuitas que permitem aprendizado e exploração.
  • Diversidade de Engenharia: O desempenho e o preço acessível do Phi-4 o tornam uma opção atraente para aplicações do mundo real.

Inovações Tecnológicas em Phi-4

O desenvolvimento do Phi-4 foi orientado por três pilares:

  1. Dados transacionais: Gerados usando métodos multiagentes e de autocura, os dados artificiais formam o núcleo do processo de treinamento do Phi-4, melhorando o poder de inferência e reduzindo a dependência de dados naturais.
  2. Melhorias pós-treinamento: Técnicas como descarte de amostras e Otimização de preferência direta (DPO) melhoram a qualidade da saída e o alinhamento com as preferências humanas.
  3. Dados de treinamento não contaminados: Procedimentos rigorosos de filtragem garantiram a extração de dados e benchmarks sobrepostos, melhorando a generalização.

Phi-4 também usa Pivotal Token Search (PTS) para identificar pontos-chave de tomada de decisão em suas respostas, refinando sua capacidade de lidar com tarefas pesadas de raciocínio com eficiência.

Acesso ao Phi-4

Phi-4 está hospedado no Hugging Face sob a licença do MIT. Os usuários podem:

  • Acesse o código do modelo e a documentação.
  • Ajuste-o para tarefas específicas usando os conjuntos de dados e ferramentas fornecidos.
  • Estenda APIs para integração perfeita em projetos.

Impacto na IA

Ao reduzir as barreiras às ferramentas avançadas de IA, a Phi-4 promove:

  • Crescimento da pesquisa: Prepara-se para exames em áreas como STEM e atividades multilíngues.
  • Educação Avançada: Fornece um recurso de aprendizagem eficaz para alunos e professores.
  • Aplicações Industriais: permite soluções econômicas para desafios como suporte ao cliente, tradução e resumo de documentos.

Sociedade e o Futuro

O lançamento do Phi-4 foi bem recebido, com desenvolvedores compartilhando adaptações bem ajustadas e novos aplicativos. Sua capacidade de ter um bom desempenho em benchmarks de pensamento STEM demonstra sua capacidade de redefinir quais tipos de linguagens podem ser acessadas. Espera-se que a colaboração da Microsoft com a Hugging Face leve ao software de código aberto, promovendo a inovação em IA.

A conclusão

A oferta aberta do Phi-4 demonstra o compromisso da Microsoft em democratizar a IA. Ao disponibilizar gratuitamente um poderoso modelo de linguagem, a empresa permite que uma comunidade global inove e colabore. À medida que o Phi-4 continua a encontrar uma variedade de aplicações, ele demonstra o potencial transformador da IA ​​de código aberto no avanço da pesquisa, da educação e da indústria.


Confira Papel e modelo na mesma face. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Não se esqueça de participar do nosso SubReddit de 60k + ML.

🚨 PRÓXIMO WEBINAR GRATUITO DE IA (15 DE JANEIRO DE 2025): Aumente a precisão do LLM com dados artificiais e inteligência experimentalParticipe deste webinar para obter insights práticos sobre como melhorar o desempenho e a precisão do modelo LLM e, ao mesmo tempo, proteger a privacidade dos dados.


Asif Razzaq é o CEO da Marktechpost Media Inc. Como empresário e engenheiro visionário, Asif está empenhado em aproveitar o poder da Inteligência Artificial em benefício da sociedade. Seu mais recente empreendimento é o lançamento da Plataforma de Mídia de Inteligência Artificial, Marktechpost, que se destaca por sua ampla cobertura de histórias de aprendizado de máquina e aprendizado profundo que parecem tecnicamente sólidas e facilmente compreendidas por um amplo público. A plataforma possui mais de 2 milhões de visualizações mensais, o que mostra sua popularidade entre o público.

✅ [Recommended Read] Nebius AI Studio se expande com modelos de visão, novos modelos de linguagem, incorporados e LoRA (Aprimorado)





Source link

Você também pode gostar...

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *