Si vocifera del modello di intelligenza artificiale DeepSeek R2: si prevede una riduzione dei costi del 97% rispetto a GPT-4, completamente basato sui chip Ascend di Huawei

Si vocifera del modello di intelligenza artificiale DeepSeek R2: si prevede una riduzione dei costi del 97% rispetto a GPT-4, completamente basato sui chip Ascend di Huawei

L’azienda tecnologica cinese DeepSeek sembra pronta a lanciare a breve il suo ultimo modello di intelligenza artificiale, il “DeepSeek R2”.I primi dettagli sono emersi, suscitando interesse nella comunità tecnologica.

DeepSeek R2: una svolta nell’intelligenza artificiale basata sulla tecnologia Huawei

Il primo modello di intelligenza artificiale mainstream di DeepSeek, l’R1, ha consolidato la capacità della Cina di competere nel panorama dell’intelligenza artificiale di fascia alta, sfidando la percepita supremazia tecnologica delle aziende occidentali. La presentazione dell’R1 ha avuto ripercussioni sul mercato azionario statunitense, contribuendo a perdite miliardarie e rivelando che lo sviluppo di un’intelligenza artificiale avanzata non richiede sempre gli ingenti budget promessi da aziende come OpenAI. Recentemente, i media cinesi hanno iniziato a diffondere indiscrezioni sul prossimo modello R2, suggerendo che il settore dell’intelligenza artificiale occidentale potrebbe essere colto di sorpresa ancora una volta dalle innovazioni cinesi.

Nonostante l’entusiasmo che circonda il modello R2 sia entusiasmante, è fondamentale affrontare questi report con cautela, poiché DeepSeek non ha ancora confermato ufficialmente alcun dettaglio. Secondo alcune fonti, DeepSeek R2 utilizzerà un’architettura ibrida Mixture of Experts (MoE), un’iterazione migliorata che potenzialmente integra meccanismi di gating avanzati insieme ai tradizionali livelli densi. Si prevede che questa architettura raddoppierà quasi il numero di parametri, arrivando a ben 1, 2 trilioni.

Modello AI DeepSeek R2

Il solo numero di parametri posiziona R2 come un formidabile contendente contro modelli come GPT-4 Turbo di OpenAI e Gemini 2.0 Pro di Google. Tuttavia, le implicazioni finanziarie sono altrettanto significative; i report suggeriscono che DeepSeek R2 offrirà costi di elaborazione dei token fino al 97, 4% inferiori a quelli di GPT-4, con un prezzo fissato a circa 0, 07 dollari per milione di token in input e 0, 27 dollari per milione di token in output. Questa strategia di prezzo indica che R2 potrebbe facilmente diventare la soluzione di intelligenza artificiale più economicamente sostenibile disponibile, rimodellando le dinamiche di mercato.

Inoltre, è degno di nota il fatto che si prevede che il modello R2 utilizzi l’82% delle risorse di calcolo del cluster di chip Ascend 910B di Huawei, dimostrando una solida capacità di calcolo di 512 PetaFLOPS con precisione FP16. Questa scelta strategica di sfruttare i chip interni testimonia l’impegno di DeepSeek nel consolidare la propria supply chain di intelligenza artificiale e nell’ottimizzare la gestione delle risorse.

Sebbene questi sviluppi relativi a DeepSeek R2 rimangano speculativi, le informazioni preliminari delineano il quadro di un prodotto che potrebbe rappresentare una sfida significativa per gli operatori affermati nel campo dell’intelligenza artificiale. Il lancio previsto potrebbe rappresentare un punto di svolta, influenzando non solo il progresso tecnologico, ma anche l’economia dell’intelligenza artificiale nei mercati globali.

Fonte e immagini

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *