以推理為中心的人工智慧的新興進展:Google和 OpenAI 推出新模型
9 月,OpenAI 透過推出創新的 o1 系列大語言模型 (LLM) 提高了標準。這些先進的模型在提供回應之前優先考慮徹底的推理,這使得它們對於科學、編碼和數學等領域的複雜任務非常有效。
快進到今天,Google推出了自己的以推理為中心的法學碩士,名為Gemini 2.0 Flash Thinking。這個實驗模型(標識為gemini-2.0-flash-thinking-exp-1219
)現在可供開發人員透過 Google AI Studio 存取。谷歌聲稱該模型在多模態理解、邏輯推理和編碼應用方面表現出色。
根據Google的公告,延長推理過程中的計算時間已經取得了令人鼓舞的結果。然而,具體的性能基準尚未發布來證實這些說法。儘管如此, Chatbot Arena的初步回饋表明,Gemini-2.0-Flash-Thinking 已經取得了驕人的排名,目前在所有評估類別中均排名第一。
來自 Chatbot Arena 的突發新聞⚡🤔 @GoogleDeepMind的 Gemini-2.0-Flash-Thinking 首次亮相,在所有類別中排名第一!從 Gemini-2.0-Flash 的飛躍: – 整體:#3 → #1 – 整體(風格控制):#4 → #1 – 數學:#2 → #1 – 創意寫作:#2 → #1 – 硬提示: #1 → #1… https://t.co/lO1DiTiOOj pic.twitter.com/cq2MRMbWZ1
– lmarena.ai(原 lmsys.org)(@lmarena_ai)2024 年 12 月 19 日
Gemini 2.0 Flash 思維的關鍵用例
Google 為有興趣嘗試 Gemini 2.0 Flash Thinking 模型的開發人員概述了幾個引人注目的用例:
- 用高階推理解決最複雜的問題
- 透明地展示模型的思考過程
- 解決具有挑戰性的編碼和數學查詢
這個尖端模型擁有超過 128k個代幣的上下文長度,知識截止時間延長至 2024 年 8 月。
想看看 Gemini 2.0 閃速思維的實際應用嗎?查看此演示,其中模型解決了物理問題並解釋了其推理。pic.twitter.com/Nl0hYj7ZFS
— 傑夫·迪恩 (@JeffDean) 2024 年 12 月 19 日
競爭優勢:OpenAI 的 o1 模型更新
本週早些時候,OpenAI 也宣布重大推出其 o1 推理模型,該模型現已可供 API 框架內的第 5 層使用的開發人員使用。 o1 模型的最新迭代在多個廣泛認可的人工智慧基準測試中報告了最先進的性能。開發者可以利用該模型來增強各種應用,包括改進的客戶服務機制、優化的供應鏈物流以及更準確的財務預測。
隨著 Google 和 OpenAI 推出以推理為重點的法學碩士,開發創新人工智慧應用程式的前景在多個行業中變得越來越活躍。
發佈留言