英特尔 Battlematrix 项目:Arc Pro GPU 的重大软件更新引入了 LLM Scaler v1.0,通过改进的支持将性能提升高达 80%

英特尔 Battlematrix 项目:Arc Pro GPU 的重大软件更新引入了 LLM Scaler v1.0,通过改进的支持将性能提升高达 80%

英特尔为其 Arc Pro“Project Battlematrix”计划推出了重大软件更新,推出了具有显著增强功能的LLM Scaler v1.0

英特尔 Arc Pro GPU 迎来重要软件升级,LLM Scaler v1.0

在 2025 年台北国际电脑展 (Computex 2025) 上,英特尔推出了 Battlematrix 项目及其全新的 Arc Pro GPU。该项目旨在为使用多个 Arc Pro GPU 的推理工作站平台提供全面的解决方案。在其产品路线图中,英特尔承诺在第三季度提供首个具有 vLLM 暂存和基本遥测支持等功能的容器部署,而这一目标现已随着 LLM Scaler v1.0 的发布而实现。

英特尔面向 Arc Pro GPU 的 Battlematrix 项目获得首个重大软件更新:LLM Scaler v1.0

LLM Scaler 容器 v1.0包含一套全面的功能和优化:

  • vLLM 增强功能
    • 对于 32B KPI 模型,40K 序列长度的性能提升高达 1.8 倍,对于 70B KPI 模型,性能提升高达 4.2 倍
    • 8B-32B KPI 型号的输出吞吐量相对于上一版本增加了约 10%
    • 逐层在线量化以减少 GPU 内存需求
    • vLLM 中对流水线并行 (PP) 的实验性支持
    • 实验性功能包括 torch.compile 和推测解码
    • 支持嵌入和重新排序模型
    • 增强的多模态模型兼容性
    • 自动检测最大输入长度
    • 数据并行功能
  • OneCCL 基准测试工具激活
  • XPU 管理器功能
    • GPU功率监控
    • GPU 固件更新
    • GPU 诊断
    • GPU内存带宽分析

英特尔强调,更新后的软件堆栈旨在提高用户友好度,并遵循行业基准。该容器专为 Linux 环境量身定制,通过多 GPU 扩展和 PCIe P2P 数据传输,有望将性能提升高达 80%。此外,它还提供企业级可靠性和管理功能,包括 ECC、SR-IOV、遥测和远程固件更新。

根据英特尔的路线图,此版本将在本季度晚些时候推出更强大的容器版本,该版本将专注于增强性能和 vLLM 服务。最后,一套全面的功能集计划于第四季度推出。

来源和图片

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注