Microsoft AI apresenta Phi-4: um novo modelo paramétrico sublingual de 14 bilhões para raciocínio complexo

Modelos de linguagem em larga escala fizeram grandes avanços na compreensão da linguagem natural, na resolução de tarefas de programação e na abordagem de desafios de raciocínio. No entanto, o seu elevado custo computacional e a dependência de conjuntos de dados em grande escala apresentam os seus próprios problemas. A maioria destes conjuntos de dados carece da diversidade e profundidade necessárias para inferências complexas, enquanto questões como a contaminação de dados podem comprometer a precisão da avaliação. Esses desafios exigem modelos menores e mais eficientes que possam lidar com soluções avançadas de problemas sem sacrificar a acessibilidade ou a confiabilidade.

Para enfrentar esses desafios, a Microsoft Research desenvolveu o Phi-4, um modelo de linguagem de 14 bilhões de parâmetros que se destaca em tarefas de raciocínio enquanto utiliza recursos. Com base na família de modelos Phi, o Phi-4 inclui novos métodos para inteligência artificial, design curricular e desenvolvimento pós-treinamento. Essas inovações permitem que o Phi-4 concorra efetivamente com modelos maiores, como o GPT-4 e o Llama-3, especialmente em tarefas que focam no pensamento.

Phi-4 depende fortemente de dados artificiais de alta qualidade para treinamento, projetados usando métodos como informações multiagentes e transformação instrucional. Estes dados confirmam que o modelo atende a várias condições sistemáticas que se aproximam das tarefas cognitivas do mundo real. Técnicas pós-treinamento, incluindo rejeição de amostra e otimização de preferência direta (DPO), ajustam ainda mais as respostas do modelo, melhorando a precisão e a usabilidade.

Avanços Tecnológicos

Phi-4 é um modelo desenvolvido para medir eficiência e competência. Com 14 bilhões de parâmetros, ele alcança um desempenho robusto enquanto mantém os custos computacionais razoáveis. Seu treinamento enfatiza dados sintéticos projetados para raciocínio e resolução de problemas, bem como conjuntos de dados biológicos cuidadosamente filtrados para manter a qualidade e evitar contaminação.

Os principais recursos incluem:

Processamento de Dados Transacionais: Técnicas como o pensamento em cadeia criam conjuntos de dados que incentivam o pensamento sistemático.
Refinamento Pós-Treino: A pesquisa de token chave no DPO garante consistência lógica nos resultados, identificando os principais pontos de decisão.
Comprimento do núcleo estendido: O comprimento do contexto do modelo foi aumentado de 4K para 16K tokens durante o treinamento intermediário, permitindo melhor manuseio de operações lógicas de cadeia longa.

Esses recursos garantem que o Phi-4 resolva questões práticas como sobrecarga e latência, tornando-o adequado para aplicações do mundo real.

Resultados e detalhes

O desempenho do Phi-4 enfatiza seu poder em tarefas que exigem muita reflexão. Ele supera consistentemente seu modelo principal, o GPT-4o, e modelos ainda maiores em vários benchmarks:

GPQA: Pontuação 56,1, superando 40,9 do GPT-4o e 49,1 do Llama-3.
ESTATÍSTICAS: Alcançar uma pontuação de 80,4, indicando habilidades avançadas de resolução de problemas.
Avaliação Humana: Excelente desempenho na escrita de benchmarks com 82,6 pontos.

Além disso, Phi-4 mostrou bons resultados em competições de matemática do mundo real, como AMC-10/12, confirmando seu uso prático. Estes resultados destacam a importância de dados de alta qualidade e métodos de formação direcionados.

A conclusão

Phi-4 representa uma evolução conceitual em modelagem de linguagem, com foco na eficiência e poder de raciocínio. Ao enfatizar dados artificiais e técnicas avançadas de pós-treinamento, mostra que modelos pequenos podem alcançar resultados comparáveis aos seus homólogos maiores. Isso faz do Phi-4 um passo à frente na criação de ferramentas de IA acessíveis e versáteis.

À medida que o campo da IA avança, modelos como o Phi-4 destacam o valor da inovação destinada a superar desafios tecnológicos. Seu equilíbrio entre capacidades conceituais e eficiência estabelece o padrão para desenvolvimentos futuros em modelagem de linguagem.

Confira eu Papel de novo Detalhes. Todo o crédito deste estudo vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir Twitter e junte-se ao nosso Estação telefônica de novo LinkedIn Gracima. Não se esqueça de participar do nosso SubReddit de 60k + ML.

🚨 Tendências: LG AI Research Release EXAONE 3.5: Modelos de três níveis de IA bilíngue de código aberto oferecem seguimento de comando incomparável e insights profundos de conteúdo Liderança global em excelência em IA generativa….

Asif Razzaq é o CEO da Marktechpost Media Inc. Como empresário e engenheiro visionário, Asif está empenhado em aproveitar o poder da Inteligência Artificial em benefício da sociedade. Seu mais recente empreendimento é o lançamento da Plataforma de Mídia de Inteligência Artificial, Marktechpost, que se destaca por sua ampla cobertura de histórias de aprendizado de máquina e aprendizado profundo que são tecnicamente sólidas e facilmente compreendidas por um amplo público. A plataforma possui mais de 2 milhões de visualizações mensais, o que mostra sua popularidade entre os telespectadores.

🧵🧵 [Download] Avaliação do relatório de trauma do modelo de linguagem principal (estendido)

Source link

Avanços Tecnológicos

Resultados e detalhes

A conclusão

Você também pode gostar...

Por que a diversidade de dados é importante para modelos precisos de visão computacional

CodeMaker AI Avanço no Desenvolvimento de Software: Alcança 91% de Precisão na Recriação de 90.000 Linhas de Código, Estabelece Nova Referência para Geração de Código Orientada por IA e Modelagem Afinada

MOS-Bench: uma coleção completa de conjuntos de dados para modelos de treinamento e teste para avaliação de qualidade de fala de sujeito (SSQA)

Deixe um comentário Cancelar resposta