Outbyte PC Repair

谷歌的新人工智慧工具「Whisk」允許基於圖像的提示帶來互動樂趣

谷歌的新人工智慧工具「Whisk」允許基於圖像的提示帶來互動樂趣

介紹 Whisk:Google 的新圖像生成工具

以其搜尋技術創新而聞名的谷歌,在其生成式人工智慧產品中推出了另一個令人印象深刻的新功能:Whisk。目前處於實驗階段,這個突破性的工具允許使用者透過輸入現有的視覺效果來創建圖像,而不需要詳細的文字提示。

攪拌器的工作原理

Whisk 使用戶能夠上傳多個圖像,這些圖像可用於各種目的,包括定義所需輸出的主題、風格和整體場景。在後台,該工具利用 Google 的 Gemini 生成文字描述,然後由高級圖像生成模型Imagen 3進行處理。

仔細觀察 Imagen 3

今年早些時候推出的 Imagen 3 被谷歌譽為該公司迄今為止最精緻的圖像模型。據谷歌稱,它生成的圖像具有卓越的細節、增強的照明,並最大限度地減少分散注意力的偽影,使其比之前的迭代有了顯著改進。

捕捉本質而不是複製品

在最近發布的一篇部落格文章中,Google詳細闡述了 Whisk 如何捕捉輸入影像的“本質”,而不必提供精確的複製品。這意味著生成的圖像可能在幾個方面有所不同,例如膚色、身高或髮型。

自訂生成的圖像

為了解決生成影像中的潛在差異,Whisk 包含一個選項,供使用者調整底層文字提示。谷歌承認某些功能可能對特定項目至關重要,因此他們確保用戶可以在創作過程的任何階段靈活地編輯這些提示。

不僅僅是圖像編輯器

雖然 Whisk 融合了傳統圖像編輯工具的功能,但谷歌強調它從根本上來說是一個「創意工具」。此外,用戶可以選擇下載其生成的圖像以供個人或專業用途。

攪拌器的可用性

目前,Whisk 可供已註冊 Google Labs 計畫的美國用戶使用,該計畫提供對一系列實驗性生成 AI 功能的存取。如果您有興趣嘗試 Whisk,可以透過此連結存取它。

來源&圖片

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *