Intel lancia l’SDK di compressione neurale per i set di texture: ottieni texture fino a 18 volte più piccole

Durante la GDC 2026, Marissa Dubois, ingegnere grafico di Intel, è salita sul palco per presentare l’innovativo approccio di Intel alla compressione neurale delle texture, che presenta delle analogie con la tecnologia NTC di NVIDIA. Questa presentazione ha segnato un significativo passo avanti rispetto al precedente prototipo di ricerca e sviluppo di Intel mostrato alla GDC 2025, rivelando che la tecnologia si è ora evoluta in un kit di sviluppo software (SDK) autonomo e completamente commercializzato.

Denominato Texture Set Neural Compression (TSNC), questo metodo rappresenta un approccio avanzato per l’archiviazione delle texture utilizzate nei videogiochi. Le tecniche convenzionali di compressione a blocchi GPU, che spaziano dai formati BC1 a BC7, applicano in genere algoritmi fissi. Sebbene questi metodi siano veloci e universalmente adottati, spesso non sfruttano appieno il potenziale di compressione. Al contrario, TSNC sfrutta la potenza dell’apprendimento automatico, utilizzando una piccola rete neurale che impiega la discesa del gradiente stocastico per codificare e decodificare in modo efficiente specifici set di texture. Questa innovazione culmina in una rappresentazione compatta dello spazio latente, che un percettrone multistrato compatto può ricostruire in fase di esecuzione, consentendo il recupero dei dati originali delle texture, inclusi gli attributi di diffusione, normali, rugosità, metallicità, occlusione ambientale ed emissione.

L'immagine è un diagramma intitolato "Compressione neurale 101" che illustra il processo di compressione dei dati di input tramite un "Encoder" in "valori nello spazio latente" e la loro decompressione con un "Decoder" per produrre "dati di output", con informazioni sulla determinazione dei pesi del modello per le reti di encoder e decoder.

Un aspetto fondamentale di TSNC è la comprensione del fatto che un set di texture, che include tutte le mappe PBR per un materiale specifico, spesso contiene dati sovrapposti sui suoi canali. TSNC sfrutta abilmente questa ridondanza in modi che la compressione a blocchi standard non riesce a ottenere.

I due livelli delle piramidi di funzionalità

Al centro della metodologia di compressione di TSNC si trova la piramide di caratteristiche, composta da quattro texture di spazio latente codificate in BC1 che variano a seconda delle diverse configurazioni di risoluzione. Intel introduce due varianti distinte, ognuna delle quali offre un diverso compromesso tra qualità ed efficienza di compressione:

La variante A presenta due immagini latenti a piena risoluzione e due a metà risoluzione. Per le texture destinate a input 4K, ciò si traduce in due immagini latenti 4K e due 2K, con una compressione impressionante di 9x, che riduce le dimensioni del file da 256 MB a circa 26, 8 MB. La perdita di qualità percettiva, valutata utilizzando lo strumento di analisi FLIP di NVIDIA, si aggira intorno al 5%, con impatti minimi sulle normal map.
La variante B adotta un approccio più aggressivo, riducendo le immagini latenti a metà, un quarto e un ottavo della risoluzione iniziale, ottenendo così una compressione superiore a 17 volte. Tuttavia, questa variante comporta un notevole degrado della qualità, in cui gli artefatti BC1 diventano visibili nelle normal map e nei canali di occlusione/rugosità ambientale. L’errore percettivo valutato da FLIP si attesta tra il 6% e il 7%, un valore che Intel ammette essere “sufficiente per essere percepito da un osservatore”.Di conseguenza, la variante B è più adatta per materiali distanti o secondari, dove la conservazione dei dettagli è meno critica.

Un grafico intitolato "Rapporto di compressione della variante A di TSNC" indica che TSNC raggiunge rapporti di compressione più elevati (da 9, 53 a 9, 59x) rispetto a BCx (da 4, 79 a 4, 80x) per risoluzioni di 1k, 2k e 4k.

Una diapositiva intitolata "Rapporti di compressione" confronta diversi formati di compressione, mostrando che TSNC raggiunge rapporti di compressione più elevati, da 17, 85x a 18, 05x, rispetto a BCx, che va da 4, 79x a 4, 80x, con un grafico che illustra i dati.

Fin dalla sua introduzione come prototipo di ricerca basato su PyTorch, Intel ha completamente riprogettato il compressore TSNC utilizzando gli shader di calcolo Slang. Questa nuova architettura consente agli sviluppatori di utilizzare lo stesso codice di decompressione su diverse piattaforme, tra cui Unreal Engine, motori grafici personalizzati e decompressione basata su CPU.

Sul fronte GPU, Intel ora supporta l’API DirectX 12 Cooperative Vectors di Microsoft, sfruttando i core di matrice XMX integrati nelle GPU delle serie A e B per facilitare l’inferenza di matrici con accelerazione hardware. Per i sistemi privi di supporto XMX, il framework ricorre a una tecnica FMA (moltiplicazione e somma fusa) standard, compatibile sia con architetture Intel che non Intel.

Nel corso della sua presentazione, Dubois ha illustrato quattro strategie di implementazione per la tecnologia TSNC, ognuna delle quali offre un diverso equilibrio tra utilizzo della memoria ed efficienza dello spazio su disco:

In fase di installazione : i file compressi vengono consegnati e decompressi localmente durante l’installazione, mantenendo le texture non compresse nella memoria dell’utente per un risparmio ottimale di larghezza di banda durante la distribuzione.
Al momento del caricamento, le texture rimangono compresse su disco e vengono decompresse nella VRAM durante la fase di caricamento del gioco. Questo metodo riduce al minimo sia le dimensioni dell’installazione che l’utilizzo della VRAM durante il processo di caricamento.
Al momento dello streaming : in concomitanza con lo streaming delle texture, queste vengono decompresse su richiesta, raggiungendo un equilibrio tra efficienza di archiviazione e memoria, pur aggiungendo un certo carico di inferenza in fase di esecuzione.
In fase di campionamento, le texture rimangono permanentemente compresse nella VRAM e vengono decodificate pixel per pixel all’interno dello shader, massimizzando il risparmio di VRAM pur comportando un costo di inferenza costante.

Ogni strategia di implementazione richiede un’attenta selezione da parte degli sviluppatori, in base alle loro specifiche esigenze e al motore sottostante utilizzato.

Una diapositiva di presentazione intitolata "Stime del tempo di inferenza sulla scheda grafica integrata Pantherlake B390" presenta un grafico a barre che indica "Nanosecondi medi per pixel (valore inferiore è migliore)", con l'algoritmo LinAlg che raggiunge un'accelerazione per pixel di circa 3, 4 volte rispetto a FMA.

I benchmark di Intel, eseguiti su un laptop con processore Panther Lake e scheda grafica integrata B390 durante un carico di lavoro completo con shader di calcolo a 1080p, hanno prodotto i seguenti risultati:

Percorso FMA: 0, 661 nanosecondi per pixel
Percorso di algebra lineare XMX: 0, 194 nanosecondi per pixel

Ciò dimostra un notevole incremento di velocità di 3, 4 volte, attribuibile ai calcoli matriciali accelerati dall’hardware. Le favorevoli metriche prestazionali osservate sui sistemi integrati suggeriscono che l’implementazione del tempo di campionamento per pixel potrebbe essere più fattibile di quanto previsto in precedenza. Per le GPU dedicate, ci si potrebbe aspettare un overhead ancora inferiore. Intel prevede di rilasciare una versione Alpha dell’SDK di compressione neurale del set di texture entro la fine dell’anno, seguita da test beta e da una versione pubblica, sebbene le tempistiche esatte non siano ancora state confermate.

Fonte e immagini

Intel lancia l’SDK di compressione neurale per i set di texture: ottieni texture fino a 18 volte più piccole

I due livelli delle piramidi di funzionalità

Microsoft rinnova il programma Windows Insider: introduce nuovi canali, flag di funzionalità e aggiornamenti sul posto.

Apple aumenta del 20% le scorte di iPhone Fold Display, con l'obiettivo di rilanciare le vendite di smartphone pieghevoli in calo.