Outbyte PC Repair

蘋果又一項突破,推出新的人工智慧模型,可以使用自然語言指令操縱圖像

蘋果又一項突破,推出新的人工智慧模型,可以使用自然語言指令操縱圖像

蘋果在許多方面都落後於 ChatGPT 和谷歌的 Gemini 等。然而,該公司在人工智慧方面投入了大量資金,因為它的目標是隨著iOS 18 的發布,在今年稍後將該技術引入iPhone 16 系列。據報道,蘋果研究人員已經發布了一種新的人工智慧模型,可以基於使用者的自然語言命令。該技術可能會在該公司 6 月的 WWDC 2024 活動上展示。

蘋果的新人工智慧模型可以解釋自然語言輸入並操縱圖像

Apple 的新 AI 模型稱為「MGIE」或MLLM 引導影像編輯,是一種多模態大語言模型,可在像素層級解釋和執行使用者命令(來自VentureBeat)。該工具可以操縱和編輯影像的多個區域,包括亮度、清晰度、對比度等等。它還可以操縱圖像以添加藝術效果。

除此之外,本地編輯可以改變照片中主體的形狀、顏色、大小和紋理。類似 Photoshop 的編輯包括調整影像大小或裁剪、旋轉和添加濾鏡。用戶還可以更改圖像的背景。蘋果的新人工智慧模型能夠理解上下文和常見推理。例如,您可以添加披薩的圖像和提示以使其更健康。 AI模型會自動將蔬菜加入圖像中,了解健康與食物中的蔬菜有關。

Apple AI 模型可以透過自然語言輸入來操縱影像

使用全域最佳化請求,該工具可以操縱影像的照明和對比度。此外,類似 Photoshop 的編輯還可以根據使用者的要求從背景中消除物件。您可以在下面新增的圖像中看到蘋果的人工智慧模型的運作情況。該公司已與加州大學研究人員合作創建 MGIE,一旦技術準備就緒,該公司將為其設備創建各種應用程式。該論文已在 2024 年國際學習表徵會議 (ICLR) 上發表。

Apple AI 模型可以透過自然語言輸入來操縱影像

如果您有興趣查看 AI 模型,可以在 GitHub 上取得預先訓練模型的程式碼和資料。蘋果在人工智慧方面已經投入了很長一段時間,儘管實施較晚,但其功能可能與行業有所不同。去年12月,該公司發明了快閃記憶體利用技術,允許大型語言模型在iPhone和其他蘋果產品上運作。

蘋果將在今年稍後宣布一些人工智慧功能,可能會在 WWDC 2024 活動上與 iOS 18 和其他軟體更新一起發布。先前有報導提到,蘋果將在今年稍後推出新 iPhone 機型時部署生成式人工智慧功能。 iOS 18 將使用人工智慧來增強Siri 的效能,因為它目前落後於 Google Assistant 和亞馬遜的 Alexa 等。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *