
DeepSeek 對華為 AI 晶片的依賴並未取得預期效果,導致該公司轉向使用 NVIDIA 來訓練其 R2 車型。這一轉變凸顯了在技術緊張局勢不斷升級的背景下,中國 AI 產業在尋求自給自足的過程中所面臨的挑戰。
DeepSeek 採用 NVIDIA 的 AI 晶片進行 R2 AI 模型訓練
自人工智慧熱潮興起以來,中國人工智慧領域主要依賴英偉達及其先進的生態系統。鑑於美國近期的出口限制,中國政府加快了培育國內替代產品的腳步。華為等公司已努力提供包括昇騰910C AI晶片在內的解決方案,但初期的採用率並不理想。
根據《金融時報》報道,DeepSeek R2 的發布因中國 AI 晶片帶來的挑戰而被推遲,尤其是與 NVIDIA 的技術堆疊相比。該專案原定於 5 月發布,但由於華為晶片存在效能問題(包括不穩定和互連速度較慢),導致發布延期。 CUDA 程式設計模型缺乏可行的替代方案,這進一步加劇了問題的複雜性,使得專案不得不依賴 NVIDIA 的基礎設施來進行高品質的 AI 模型訓練。

目前,中國企業在華為的AI晶片方面面臨巨大障礙,迫使許多企業轉向NVIDIA的H100 AI晶片,無意中增加了亞洲市場對NVIDIA的需求。此外,針對NVIDIA晶片進入中國市場可能存在的安全漏洞的調查也加劇了這種情況。有報導稱,出於對追蹤能力的擔憂,中國政府已建議本土企業不要使用這些晶片。
DeepSeek 正準備在未來幾週內發布其 R2 AI 模型,關注其性能表現將會非常有趣。這項進展凸顯了中國在打造強大的 NVIDIA 產品替代產品方面仍存在巨大差距。
發佈留言