
Intel は Arc Pro「Project Battlematrix」イニシアチブの重要なソフトウェア アップデートを開始し、注目すべき機能強化を備えたLLM Scaler v1.0 を導入しました。
Intel Arc Pro GPU が LLM Scaler v1.0 による重要なソフトウェア アップグレードを取得
Computex 2025において、Intelは新型Arc Pro GPUと合わせてProject Battlematrixを発表しました。この取り組みは、複数のArc Pro GPUを活用する推論ワークステーション・プラットフォーム向けの包括的なソリューションを提供することを目的としています。Intelは製品ロードマップにおいて、vLLMステージングや基本的なテレメトリサポートなどの機能を備えた最初のコンテナ・デプロイメントを第3四半期に提供すると約束しており、この度LLM Scaler v1.0のリリースによってそれが実現しました。

LLM Scaler コンテナー v1.0には、包括的な機能と最適化のセットが組み込まれています。
- vLLMの機能強化:
- 32B KPI モデルで 40K シーケンス長の場合、パフォーマンスが最大 1.8 倍向上し、70B KPI モデルでは 4.2 倍向上します。
- 8B-32B KPIモデルの出力スループットが以前のバージョンと比較して約10%向上
- GPUメモリ要件を削減するレイヤーごとのオンライン量子化
- vLLMにおけるパイプライン並列処理(PP)の実験的サポート
- torch.compile や投機的デコードなどの実験的な機能
- 埋め込みおよび再ランク付けモデルのサポート
- 強化されたマルチモーダルモデルの互換性
- 最大入力長の自動検出
- データ並列処理機能
- OneCCLベンチマークツールのアクティベーション
- XPUマネージャーの機能:
- GPU電力監視
- GPUファームウェアアップデート
- GPU診断
- GPUメモリ帯域幅分析
Intelは、アップデートされたソフトウェアスタックがユーザーフレンドリーな設計で、業界ベンチマークに準拠していることを強調しています。Linux環境向けにカスタマイズされたこのコンテナは、マルチGPUスケーリングとPCIe P2Pデータ転送により、最大80%のパフォーマンス向上を実現します。さらに、ECC、SR-IOV、テレメトリ、リモートファームウェアアップデートなど、エンタープライズグレードの信頼性と管理機能も備えています。
Intelのロードマップによると、このリリースに続き、今四半期後半には、パフォーマンス強化とvLLMサービスに重点を置いた、より堅牢なコンテナリリースが予定されています。さらに、包括的な機能セットは第4四半期に展開される予定です。
コメントを残す