
請注意,本內容不構成投資建議。作者沒有持有本文討論的股票的部位。
DeepSeek的R1 AI模型:與全球巨頭競爭
DeepSeek作為國內領先的人工智慧實驗室,其R1模型的推出引起了廣泛關注,引起了業界的反響。據報道,這項尖端人工智慧技術可以使用數萬個 NVIDIA GPU 進行訓練,與 OpenAI 的 o1 和 Meta 的 Llama 等知名模型並駕齊驅。 Scale AI 執行長 Alexandr Wang 最近在接受 CNBC 的一次富有洞察力的採訪中強調了 DeepSeek 的成就。
NVIDIA 的高階 GPU 格局
Wang 透露,NVIDIA 的 Hopper 系列包括最新的 H100 和 H200 GPU,代表了其技術的當前狀態。隨著 NVIDIA 增加預期 Blackwell 晶片的出貨量,這些 Hopper GPU 仍在推動全球人工智慧進步方面發揮著重要作用。王先生表示,在他的組織進行的嚴格評估中,R1模型的性能不僅達到甚至超過了頂級人工智慧模型的性能。
《人類最後的考試》的見解
在與CNBC 的安德魯·羅斯·索金(Andrew Ross Sorkin) 交談時,王詳細闡述了一個被稱為“人類最後考試”的密集測試框架,旨在通過數學、物理、生物和化學等領域受人尊敬的教授提出的複雜查詢來評估人工智慧的能力。 Wang 指出,結果表明 DeepSeek 的 R1 要么是性能最好的,要么可以與 o1 等領先的美國模型相媲美。
中美人工智慧競爭:典範轉移
在談到中美之間持續不斷的人工智慧競爭時,王承認美國在該領域的歷史領先地位,但強調 DeepSeek 的進步標誌著格局的潛在轉變。他談到了 R1 發布的戰略時機,並指出它是在聖誕節這一天發布的,而聖誕節是西方通常慶祝節日的時期。

GPU 可用性爭論
隨後話題轉向 GPU 在中國的供應情況。 Wang 評論了全球對 NVIDIA 強大 GPU 的需求,該產品已成為美國出口法規的焦點。值得注意的是,拜登政府從 2022 年開始對向中國銷售這些高階晶片實施限制,導致 NVIDIA 開發了替代型號,包括 H800 和 A800,這些型號到 2023 年 10 月也面臨類似的限制。
DeepSeek的GPU快取與未來的挑戰
Wang 表示,雖然中國實驗室擁有強大的能力,但使用這些先進 GPU 的現實情況卻很微妙。他估計 DeepSeek 擁有大約 50, 000 台 H100,挑戰了對其資源限制的普遍看法。然而,王承認這些實驗室在現有出口管制下可能面臨迫在眉睫的限制,並表示:“從長遠來看,它們將受到晶片管制和我們現有的出口管制的限制。”
隨著全球人工智慧格局的演變,這些科技巨頭之間的競爭無疑將塑造人工智慧發展的未來。
發佈留言