Microsoft: il ragionamento Phi-4 compete con modelli più grandi e raggiunge le prestazioni di DeepSeek-R1

Microsoft: il ragionamento Phi-4 compete con modelli più grandi e raggiunge le prestazioni di DeepSeek-R1

Microsoft presenta Phi-4-Reasoning: una svolta nei modelli linguistici

In un’entusiasmante evoluzione per l’intelligenza artificiale, Microsoft ha introdotto il Phi-4-reasoning, un modello da 14 miliardi di parametri progettato per affrontare compiti di ragionamento complessi con un’efficacia impressionante. Questo modello innovativo è stato creato utilizzando un fine-tuning supervisionato su un set di prompt “teachable” appositamente selezionati, generati con l’aiuto di o3-mini, garantendo che i dati di training siano sia di alta qualità che pertinenti.

Parallelamente, l’azienda ha lanciato anche Phi-4-reasoning-plus, una variante che non solo mantiene il design del parametro 14B, ma migliora anche le capacità di ragionamento producendo tracce di ragionamento più lunghe, offrendo così benchmark di prestazioni migliorati.

Indicatori di performance: un vantaggio competitivo

Secondo i risultati dettagliati nel recente white paper di Microsoft, i modelli di ragionamento Phi-4 dimostrano prestazioni superiori rispetto a diversi modelli più grandi, tra cui il noto DeepSeek-R1-Distill-Llama-70B. Sorprendentemente, questi modelli eguagliano persino le capacità complete del modello DeepSeek-R1 in benchmark specifici. Inoltre, hanno superato Claude 3.7 Sonnet di Anthropic e Gemini 2 Flash Thinking di Google in quasi tutte le attività, con alcune eccezioni per GPQA e Calendar Planning.

Microsoft Phi-4-Ragionamento
Modello di ragionamento Phi-4 di Microsoft

Approfondimenti sullo sviluppo del modello e sui suoi limiti

Le promettenti prestazioni del modello di ragionamento Phi-4 rafforzano l’idea che una meticolosa cura dei dati per il fine-tuning supervisionato (SFT) possa migliorare significativamente le capacità dei modelli di linguaggio di ragionamento. Inoltre, esiste il potenziale per un miglioramento delle prestazioni attraverso l’implementazione di tecniche di apprendimento per rinforzo.

Tuttavia, il modello di ragionamento Phi-4 presenta alcune restrizioni. In primo luogo, è pensato per testi in inglese ed è stato addestrato principalmente in Python, utilizzando librerie di programmazione standard. Inoltre, opera con una lunghezza di contesto limitata a 32.000 token. Per una comprensione più approfondita delle sue capacità e dei suoi limiti, i lettori possono consultare il whitepaper.

Introduzione al ragionamento Phi-4, che aggiunge modelli di ragionamento alla famiglia di SLM Phi. Il modello viene addestrato sia con un finetuning supervisionato (utilizzando un dataset accuratamente selezionato di dimostrazioni di ragionamento) sia con l’apprendimento per rinforzo.📌Risultati competitivi sui benchmark di ragionamento con… pic.twitter.com/p2FkjD4qfu

Implicazioni per lo sviluppo dell’intelligenza artificiale

Microsoft considera i modelli di ragionamento Phi-4 come strumenti fondamentali per il progresso della ricerca sui modelli linguistici. Si prevede che le loro applicazioni saranno particolarmente utili in ambienti in cui la memoria o le risorse di calcolo sono limitate, in scenari con elevati requisiti di latenza e in attività che richiedono un ragionamento intensivo.

Per ulteriori informazioni e approfondimenti, visita la fonte originale: Fonte e immagini.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *