Unigen a dévoilé sa dernière innovation, le module d’IA Amaretti, conçu pour s’intégrer dans un emplacement M.2 standard. Ce module compact offre des performances impressionnantes allant jusqu’à 60 TOPS et 32 Go de mémoire, le rendant compatible avec les grands modèles de langage (LLM) contenant jusqu’à 20 milliards de paramètres.
Module d’IA Unigen : Performances exceptionnelles et faible consommation d’énergie
Avec l’essor des agents d’IA locaux, une vague de produits d’IA innovants déferle sur le paysage technologique. Parmi eux, Unigen lance le module d’IA Amaretti E1. S, qui ressemble à un SSD classique mais offre des capacités de traitement d’IA remarquables.
Ce module est alimenté par l’ accélérateur d’IA SAKURA-II d’EdgeCortix. Initialement conçu pour les applications d’IA basse consommation, il offre des performances robustes aux appareils tels que le Raspberry Pi 5 et autres plateformes ARM. Le SAKURA-II intègre notamment un NPU capable de fournir 60 TOPS en INT8 et 30 TFLOPS en BF16. Il est équipé d’un contrôleur mémoire double LPDDR4x 64 bits et offre une mémoire cache SRAM intégrée de 20 Mo, le tout dans un boîtier BGA compact de 19 × 19 broches consommant environ 8 à 10 watts.

Unigen a intégré avec succès l’accélérateur d’IA SAKURA-II à la carte E1. S, améliorant considérablement ses fonctionnalités grâce à une capacité mémoire allant jusqu’à 32 Go. Ce module est disponible en deux versions (16 Go et 32 Go) et offre une bande passante remarquable pouvant atteindre 68 Go/s. Avec une consommation de seulement 10 watts, les utilisateurs bénéficient d’une efficacité énergétique impressionnante de 6 TOPS par watt.
Grâce à sa généreuse capacité de mémoire de 32 Go, ce module gère efficacement les modèles IA à grande échelle (LLM) comportant jusqu’à 20 milliards de paramètres, ce qui en fait un choix idéal pour les solutions d’IA basse consommation chargées d’exécuter des flux de travail d’IA générative et d’IA agentique. De plus, ces modules peuvent être empilés dans plusieurs emplacements M.2, augmentant ainsi leurs capacités de traitement globales. Pour les applications plus exigeantes, EdgeCortix propose également une configuration PCIe supérieure avec deux puces et des fonctionnalités étendues, mais la solution M.2 reste une option particulièrement intéressante.

De nombreux PC, ordinateurs de bureau et portables, disposent d’emplacements M.2 inutilisés qui pourraient être exploités pour des capacités d’IA améliorées. Pour ceux qui recherchent des solutions d’IA localisées afin d’optimiser leurs systèmes, les modules Amaretti AI constituent une option très avantageuse.
Selon Unigen, le module d’IA est compatible avec tous les principaux frameworks d’IA, notamment TensorFlow, PyTorch, ONNX et Hugging Face. Ses principales caractéristiques sont les suivantes :
- E1. S AI Module
- Accélérateur d’IA : SAKURA-II
- Performances d’inférence jusqu’à 1920 TOPS avec les serveurs à double processeur refroidis par air
- Efficacité énergétique avec seulement 20 % de la puissance consommée par les GPU d’entraînement
- Prise en charge des modèles linéaires logiques d’IA générative jusqu’à 20 milliards de paramètres
- Délais de livraison d’environ 14 semaines, réduisant considérablement l’attente associée aux serveurs GPU
- Options de mémoire jusqu’à 32 Go par module
Unigen livre le module Amaretti E1. S AI pré-équipé d’un dissipateur thermique pour garantir des performances optimales. Bien que le prix reste confidentiel, la capacité mémoire donne une bonne indication du coût potentiel.
Laisser un commentaire