隨著企業努力維護自己的主導地位並探索創新能力,生成式人工智慧的競爭格局正在升溫。 OpenAI 透過技術升級不斷拓展視野,但其備受期待的影片製作智慧模型 Sora 仍無法提供給用戶。同時,Google在內容創作方面取得了重大進展,公開推出了其生成式人工智慧模型 Veo,目前處於私人預覽階段。
Google 透過 Veo 在私人預覽中處於領先地位
儘管 OpenAI 是 2 月與 Sora 合作推出生成式 AI 視訊模型的先驅,並展示了其根據文字輸入生成 60 秒影片的能力,但Google現在已經成為人們關注的焦點。這家科技巨頭已透過其 Vertex AI 平台正式推出 Veo 私人預覽版,標誌著生成視訊技術的重大進步。
該版本是在 OpenAI 在其 I/O 開發者大會上演示 Sora 幾個月後發布的。谷歌大力宣傳 Veo 的廣泛功能,聲稱它可以製作長度超過一分鐘的高品質影片。儘管有關生成影片的具體長度的詳細資訊仍然很少,但用戶可以選擇多種視覺和電影風格。最初的樣本顯示,新製作的內容非常真實,除非仔細檢查,否則通常與真實的鏡頭無法區分。
除了 Veo 之外,Google還將向Google雲端客戶推出 Imagen 3,這是一種先進的文本到圖像人工智慧生成器,作為其即將推出的功能的一部分。這項計劃將於下週推出,最初將向白名單上的選定用戶開放,提供各種自訂選項,包括基於提示的照片編輯以及修改生成圖像中的徽標和其他元素的功能。
Google強調,Veo 和 Imagen 3 都配備了強大的內建保護措施,以減少內容侵權並消除不當輸出。然而,初步測試顯示這些保障措施並非完全萬無一失。產生的內容包含由 DeepMind 的 SynthID 技術創建的不可見數位浮水印,有助於識別人工智慧產生的材料。
推出 Veo 後,OpenAI 面臨越來越大的發布 Sora 的壓力,自發布以來用戶一直熱切期待 Sora,預計將於 2024 年底交付。
發佈留言