英特尔与 NVIDIA Blackwell 生态系统合作,打造混合机架规模 AI 平台,重振其 AI 芯片

英特尔与 NVIDIA Blackwell 生态系统合作,打造混合机架规模 AI 平台,重振其 AI 芯片

英特尔将其 Gaudi 3 机架级解决方案与 NVIDIA 的先进技术堆栈相集成,成为媒体关注的焦点。这一创新组合充分利用了英特尔自有的 AI 芯片和 NVIDIA 的 Blackwell GPU,有望为用户带来显著的性能提升。

英特尔推出搭载 NVIDIA Blackwell 技术的混合 AI 服务器

英特尔的 Gaudi 系列 AI 芯片在业界获得了显著的关注。然而,在蓬勃发展的 AI 领域,该公司面临着来自 NVIDIA 和 AMD 等巨头的激烈竞争。为了应对这一挑战,英特尔正在重新规划其 Gaudi 平台战略。据SemiAnalysis报道,这家科技巨头即将推出 Gaudi 3 机架式系统,该系统采用 NVIDIA 的 Blackwell B200 GPU 作为混合架构的一部分,并辅以 Connect-X 网络技术。

此次发布是近期 OCP 全球峰会的一大亮点,英特尔旨在在机架级 AI 市场中开辟出一个独特的利基市场。该系统独特地采用了英特尔 Gaudi 3 芯片来处理推理工作负载的“解码”环节,而 B200 GPU 则专注于要求更高的“预填充”阶段。Blackwell GPU 以其在大型矩阵乘法中的卓越性能而著称,使其成为处理预填充操作的最佳选择。

在一次技术活动中展示的带有计算托盘和交换托盘的英特尔 Gaudi 3 Rack Scale64 服务器具有 2 个 Xeon CPU 和 Gaudi3 AI 芯片。
图片来源:SemiAnalysis

在这种创新配置中,Gaudi 3 架构将优先考虑内存带宽和以以太网为中心的可扩展性。在连接方面,该配置利用安装在计算托盘上的 NVIDIA ConnectX-7 400 GbE 网卡,以及博通的 Tomahawk 5 交换机,拥有惊人的 51.2 Tb/s 吞吐量,可实现全机架连接。据 SemiAnalysis 称,每个计算托盘配备两个 Xeon CPU、四个 Gaudi 3 AI 芯片和四个网卡,以及一个 NVIDIA BlueField-3 DPU,每个机架共分配 16 个托盘。

计算机服务器主板上标有“Eight Bay Cuda Cores”的多个处理器。
英特尔的 Gaudi 2 机架

在NVIDIA主导的市场格局下,Gaudi平台的定位是一款经济高效的解码引擎。这一策略体现了英特尔务实的策略,即通过合作而非直接竞争来提升其市场地位。据称,与仅使用B200 GPU的基准模型相比,这种机架级架构在预填充任务中可将性能提升1.7倍;然而,这些结果仍有待独立验证。

虽然这种混合配置展现了乐观的未来,但挑战依然存在。Gaudi 平台仍然受到尚未开发的软件生态系统的阻碍,这可能会阻碍其更广泛的应用。此外,由于 Gaudi 架构计划在未来几个月内分阶段退役,因此尚不确定这种配置能否像竞争解决方案一样获得主流认可。

来源和图片

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注