
Intel ha annunciato ufficialmente la sua architettura grafica Xe3, destinata a debuttare nella GPU integrata dei prossimi processori Panther Lake, con piani per una variante Xe3P nel prossimo futuro.
Intel presenta l’architettura Xe3 per l’iGPU di Panther Lake: promette un aumento delle prestazioni fino al 50%
L’architettura Xe3 di Intel segue l’architettura Xe2 dello scorso anno, che ha migliorato significativamente l’offerta di prodotti integrandola in due release chiave: le CPU Lunar Lake “Core Ultra 200” e le schede grafiche dedicate Arc B-Series “Battlemage”.L’architettura Xe2 ha capitalizzato l’esperienza acquisita con la sua predecessora, Xe1, e con la famiglia iniziale Arc Alchemist A-series, ottenendo un lancio di successo su entrambe le piattaforme.



I recenti miglioramenti software hanno inoltre potenziato l’offerta Intel in termini di supporto driver, a vantaggio non solo del gaming, ma anche della creazione di contenuti, del rendering e dei processi di intelligenza artificiale. La nuova serie Arc Pro si è integrata perfettamente con l’ecosistema di driver esistente, insieme alle GPU Battlemage.

Gli ultimi mesi hanno visto Intel compiere notevoli progressi nella tecnologia grafica, evidenziati dalla prossima serie Panther Lake “Core Ultra 300”, che introduce l’architettura all’avanguardia Xe3.
iGPU Xe3: la prossima generazione di Arc B-Series e approfondimenti su Xe3P
L’architettura Xe3 si basa su Xe2, espandendo le capacità grafiche per configurazioni più ampie e ottimizzando la produttività. In particolare, le iGPU basate su Xe3 saranno marchiate Arc B-Series.
È interessante notare che, mentre le GPU dedicate Battlemage sono basate su Xe2, le iGPU Panther Lake passano all’architettura Xe3. Questo allineamento riflette la decisione strategica di Intel di unificare il suo stack di prodotti tra opzioni integrate e dedicate.

Gli sviluppi futuri indicano che è in fase di sviluppo una famiglia Arc che utilizza un’architettura Xe3 aggiornata denominata Xe3P, pronta a fornire ulteriori ottimizzazioni anziché passare direttamente a Xe4. Questa mossa strategica suggerisce che Xe3P potrebbe essere utilizzata sia in soluzioni GPU discrete che in configurazioni iGPU avanzate per le prossime CPU Nova Lake.
Sebbene Xe3P non farà parte dell’attuale Arc B-Series, insieme alle dGPU Battlemage o alle iGPU Panther Lake, cresce l’attesa per quella che probabilmente sarà la prossima generazione della famiglia Arc, forse la Arc C-Series. Chiariti questi elementi, approfondiamo i dettagli dell’architettura Xe3.
Xe3 – Miglioramento delle prestazioni e dell’efficienza energetica dell’iGPU
L’architettura Xe3 segna un significativo miglioramento nelle capacità di rendering. La precedente architettura Xe2 presentava 4 core Xe e 4 unità di ray tracing dedicate per ogni slice di rendering.

Al contrario, Xe3 introduce un robusto numero di 6 core Xe e 6 unità di ray tracing per slice di rendering, che si traduce in un aumento del 50%.Questo miglioramento consente a Intel di implementare in modo efficiente diverse configurazioni di tile GPU all’interno dei suoi SoC Panther Lake.

Le configurazioni disponibili includono un die a 4 core Xe per WeU 8C e 16C e una configurazione più avanzata a 12 core Xe destinata al die 16C superiore, promettendo un’evoluzione nelle dinamiche delle prestazioni rispetto ai concorrenti come Arrow Lake e Lunar Lake.

Le specifiche per le due configurazioni sono le seguenti:
- Configurazione 4 Xe Core:
- 4 core Xe (architettura Xe3)
- 1 fetta di rendering
- 32 motori XMX
- Cache L2 da 4 MB
- 1 Conduttura Geo
- 4 campionatori
- 4 unità di Ray Tracing
- 2 Pixel Backend
- Configurazione del core 12 Xe:
- 12 core Xe (architettura Xe3)
- 2 sezioni di rendering
- 96 motori XMX
- Cache L2 da 16 MB
- 2 condotte geotermiche
- 12 campionatori
- 12 unità di Ray Tracing
- 4 Pixel Backend

Nonostante rappresenti una diminuzione della cache L2 per la configurazione 4Xe, il modello 12Xe eccelle con la sua cache L2 da 16 MB, riducendo efficacemente il traffico sul fabric SoC, con conseguente riduzione del traffico fino al 36% durante gli scenari di gioco.

Gli aggiornamenti architetturali all’interno del framework Xe3 includono funzionalità core migliorate, come otto motori vettoriali a 512 bit e otto motori XMX a 2048 bit, insieme a un aumento del 33% della cache L1/SLM condivisa.

Questa architettura innovativa garantisce che Xe Vector Engine possa ora sfruttare fino al 25% di thread in più, supportando al contempo l’allocazione di registri variabili, il che migliora le prestazioni, in particolare nelle attività incentrate sull’intelligenza artificiale.

Inoltre, i motori XMX sono progettati per l’accelerazione AI, con una iGPU 12Xe in grado di fornire fino a 120 TOP, mentre una iGPU 4Xe può raggiungere circa 40 TOP. Per fare un confronto, la precedente architettura Xe2 produceva un massimo di 67 TOP, rendendo il passaggio a Xe3 un notevole balzo in avanti in termini di prestazioni.

Le operazioni per clock per Xe-core dell’architettura Xe3 sono dettagliate come segue:
- XMX TF32: 1024 operazioni/clk
- XMX FP16: 2048 operazioni/crollo
- XMX BF16: 2048 operazioni/clicchi
- XMX INT8: 4096 operazioni/clk
- XMX INT4: 8192 operazioni/clk
- XMX INT2: 8192 operazioni/clk

Inoltre, Intel ha introdotto un’unità di ray tracing all’avanguardia con gestione dinamica dei raggi, progettata per il ray tracing asincrono. Questa unità è dotata di più pipeline di attraversamento, unità di intersezione triangolare e una cache BVH, migliorando le prestazioni complessive.

Il nuovo gestore URB semplifica gli aggiornamenti parziali, migliorando notevolmente l’efficienza nella gestione dei dati sulla GPU. Inoltre, i miglioramenti includono un filtraggio anisotropico fino a 2 volte superiore e velocità di test degli stencil, distinguendo ulteriormente la Xe3.
Sul fronte multimediale, l’architettura include funzionalità avanzate come la codifica/decodifica AV1, la decodifica VVC e il supporto eDP 1.5. Ulteriori funzionalità includono il supporto AVC a 10 bit e la compatibilità con vari formati Sony XAVC, arricchendo le capacità di gestione multimediale di Xe3 in Panther Lake.
Intel continua a scalare e migliorare le prestazioni della GPU con Xe3
Intel ha pubblicato le valutazioni preliminari delle prestazioni delle sue GPU Xe3, concentrandosi su microbenchmark che valutano singoli segmenti della microarchitettura della GPU rispetto alle iterazioni precedenti.

I risultati iniziali per le prestazioni di blending e backend indicano fluttuazioni minime, dato che le allocazioni delle risorse rimangono costanti in Xe3. Tuttavia, un sorprendente aumento del 50% nelle metriche FP16 per GEMM riflette il vantaggio di scalabilità della GPU. Con Xe3 che supera Xe2 in termini di dimensioni, questi benchmark ne sfruttano appieno le capacità, evidenziando notevoli miglioramenti architetturali, come miglioramenti nella velocità anisotropica, nella velocità di rendering della mesh, nelle letture sparse e nell’intersezione del ray tracing, che vanno da 2x a 2, 7x.

I notevoli progressi in ambiti quali i test di profondità e le applicazioni che richiedono un uso intensivo dei registri hanno evidenziato miglioramenti superiori a 7 volte rispetto alla generazione precedente, a dimostrazione del balzo in avanti negli standard prestazionali.

Per una rappresentazione visiva, un frame renderizzato utilizzando Xe3 rispetto a Xe2 rivela i progressi compiuti in termini di miglioramenti delle prestazioni.

Inoltre, Intel sta potenziando il suo Windows Graphics Software Stack, introducendo utili aggiornamenti, tra cui miglioramenti del compilatore tramite Intel Graphics Compiler (IGC) e allocazione di registri variabili per ottimizzare ulteriormente le prestazioni.

Intel sta introducendo funzionalità di scheduling più rapide tramite prelazione diretta, che consente un rapido cambio di contesto senza svuotamento. Inoltre, gli ultimi aggiornamenti includono il supporto per i vettori cooperativi DirectX, presentati nella demo “Neural Radiance Field” di Intel che utilizza questi vettori.

In sintesi, l’architettura Intel Xe3 rappresenta un notevole miglioramento rispetto alla Xe2, che attualmente compete con le principali iGPU RDNA 3.5 come la Radeon 880M e la 890M nei laptop mainstream. Sebbene la Xe2 potrebbe non essere all’altezza delle implementazioni RDNA 3.5 di fascia superiore, come Strix Halo, le collaborazioni tra Intel e NVIDIA per la produzione di SoC personalizzati potrebbero colmare questo divario.
Lascia un commento