Intel lance un kit de développement logiciel (SDK) de compression neuronale pour les textures : obtenez des textures jusqu’à 18 fois plus petites.

Lors de la GDC 2026, Marissa Dubois, ingénieure en graphisme chez Intel, a présenté l’approche novatrice d’Intel en matière de compression de textures neuronales, similaire à la technologie NTC de NVIDIA. Cette présentation a marqué une avancée significative par rapport au prototype de R&D présenté par Intel à la GDC 2025, révélant que la technologie est désormais disponible sous la forme d’un kit de développement logiciel (SDK) autonome et pleinement opérationnel.

Baptisée Compression Neurale d’Ensembles de Textures (TSNC), cette méthode représente une approche avancée du stockage des textures utilisées dans les jeux vidéo. Les techniques classiques de compression par blocs GPU, des formats BC1 à BC7, appliquent généralement des algorithmes fixes. Bien que rapides et largement répandues, ces méthodes n’exploitent souvent pas pleinement leur potentiel de compression.À l’inverse, la TSNC tire parti de la puissance de l’apprentissage automatique, en utilisant un petit réseau neuronal qui emploie la descente de gradient stochastique pour encoder et décoder efficacement des ensembles de textures spécifiques. Cette avancée majeure aboutit à une représentation compacte de l’espace latent, qu’un perceptron multicouche compact peut reconstruire à l’exécution, permettant ainsi la récupération des données de texture originales, notamment les attributs de diffusion, de normale, de rugosité, de métallisation, d’occlusion ambiante et d’émission.

L'image est un diagramme intitulé « Compression neuronale 101 » détaillant le processus de compression des données d'entrée via un « Encodeur » en « Valeurs de l'espace latent » et leur décompression avec un « Décodeur » pour produire des « Données de sortie », avec des informations sur la découverte des poids du modèle pour les réseaux d'encodeur et de décodeur.

Un aspect fondamental de TSNC réside dans la compréhension qu’un ensemble de textures, comprenant toutes les cartes PBR d’un matériau spécifique, contient souvent des données redondantes entre ses canaux. TSNC exploite intelligemment cette redondance, contrairement à la compression par blocs standard.

Les deux niveaux de pyramides de fonctionnalités

Au cœur de la méthodologie de compression de TSNC se trouve la pyramide de fonctionnalités, composée de quatre textures d’espace latent encodées en BC1 qui varient selon les configurations de résolution. Intel propose deux variantes distinctes, offrant chacune un compromis différent entre qualité et efficacité de compression :

La variante A utilise deux images latentes en pleine résolution et deux en demi-résolution. Pour les textures destinées à une entrée 4K, cela correspond à deux images latentes 4K et deux 2K, offrant ainsi une compression impressionnante de 9x et réduisant la taille du fichier de 256 Mo à environ 26, 8 Mo. La perte de qualité perçue, évaluée à l’aide de l’outil d’analyse FLIP de NVIDIA, se situe autour de 5 %, avec un impact mineur sur les cartes normales.
La variante B adopte une approche plus agressive, réduisant les images latentes à la moitié, au quart et au huitième de la résolution initiale, atteignant ainsi une compression supérieure à 17x. Cependant, cette variante entraîne une dégradation notable de la qualité : des artefacts BC1 apparaissent dans les cartes normales et les canaux d’occlusion ambiante/rugosité. L’erreur perceptive évaluée par FLIP se situe entre 6 et 7 %, ce qu’Intel considère comme « suffisant pour être perceptible par un utilisateur ».Par conséquent, la variante B est plus adaptée aux contenus distants ou secondaires où la préservation des détails est moins critique.

Un graphique intitulé « Taux de compression de la variante A de TSNC » indique que TSNC atteint des taux de compression plus élevés (9, 53 à 9, 59x) par rapport à BCx (4, 79 à 4, 80x) sur des résolutions de 1k, 2k et 4k.

Une diapositive intitulée « Taux de compression » compare différents formats de compression, montrant que TSNC atteint des taux de compression plus élevés, de 17, 85x à 18, 05x, contre 4, 79x à 4, 80x pour BCx, avec un graphique illustrant les données.

Depuis son lancement en tant que prototype de recherche basé sur PyTorch, Intel a entièrement repensé le compresseur TSNC en utilisant les shaders de calcul Slang. Cette nouvelle architecture permet aux développeurs d’utiliser le même code de décompression sur diverses plateformes, notamment Unreal Engine, des moteurs personnalisés et la décompression basée sur le processeur.

Côté GPU, Intel prend désormais en charge l’API DirectX 12 Cooperative Vectors de Microsoft, exploitant les cœurs matriciels XMX intégrés aux GPU des séries A et B pour faciliter l’inférence matricielle accélérée par le matériel. Pour les systèmes ne prenant pas en charge XMX, le framework utilise une technique FMA (fusion de multiplication et d’addition) standard, compatible avec les architectures Intel et non-Intel.

Lors de sa présentation, Dubois a exposé quatre stratégies de déploiement pour la technologie TSNC, chacune offrant un équilibre différent entre l’utilisation de la mémoire et l’efficacité de l’espace disque :

Lors de l’installation, les fichiers compressés sont livrés et décompressés localement, les textures non compressées étant conservées sur le stockage de l’utilisateur pour une économie de bande passante optimale lors de la distribution.
Au chargement, les textures restent compressées sur le disque et sont décompressées dans la VRAM pendant la phase de chargement du jeu. Cette méthode minimise la taille de l’installation et l’utilisation de la VRAM pendant le chargement.
Au moment du flux — En conjonction avec le flux de textures, les textures sont décompressées à la demande, atteignant un équilibre entre l’efficacité du stockage et de la mémoire tout en ajoutant une certaine charge d’inférence d’exécution.
Au moment de l’échantillonnage, les textures restent compressées en permanence dans la VRAM et sont décodées pixel par pixel au sein du shader, maximisant ainsi les économies de VRAM tout en engendrant un coût d’inférence constant.

Chaque stratégie de déploiement nécessite une sélection minutieuse de la part des développeurs en fonction de leurs exigences spécifiques et du moteur sous-jacent utilisé.

Une diapositive de présentation intitulée « Estimations du temps d'inférence sur la carte graphique intégrée Pantherlake B390 » présente un graphique à barres indiquant « Nanosecondes moyennes par pixel (plus bas est mieux) », l'algorithme LinAlg atteignant une accélération d'environ 3, 4x par pixel par rapport à FMA.

Les tests de performance d’Intel effectués sur un ordinateur portable Panther Lake utilisant une carte graphique intégrée B390 lors d’une charge de travail complète de calcul de shaders en 1080p ont donné les résultats suivants :

Trajet FMA : 0, 661 nanoseconde par pixel
Trajectoire d’algèbre linéaire XMX : 0, 194 nanosecondes par pixel

Ceci démontre une accélération substantielle de 3, 4x, attribuable à l’accélération matérielle des calculs matriciels. Les performances favorables observées sur les systèmes intégrés suggèrent que le déploiement au temps d’échantillonnage par pixel pourrait être plus réalisable qu’on ne le pensait. Pour les GPU dédiés, on peut s’attendre à des surcharges encore plus faibles. Intel prévoit de lancer une version alpha du kit de développement logiciel ( SDK) de compression neuronale pour ensembles de textures plus tard cette année, suivie de tests bêta et d’une version publique, bien que le calendrier précis reste à confirmer.

Source et images

Intel lance un kit de développement logiciel (SDK) de compression neuronale pour les textures : obtenez des textures jusqu’à 18 fois plus petites.

Les deux niveaux de pyramides de fonctionnalités

Microsoft repense le programme Windows Insider : introduction de nouveaux canaux, de fonctionnalités supplémentaires et de mises à niveau sur place

Apple Boosts iPhone Fold Display Inventory by 20%, Set to Revitalize Slow Foldable Smartphone Sales