
OpenAI 透過 ChatGPT 實現影像生成革命
3 月,OpenAI 增強了 ChatGPT 中的影像生成功能,達到了一個重要的里程碑。 ChatGPT 的最新版本不再依賴 DALL·E 等外部模型,而是利用 GPT-4o 的固有功能,提高基於文字輸入的圖像創建的準確性和視覺吸引力。
GPT-4o 在視覺渲染方面的強大功能
先進的 GPT-4o 模型擅長透過有效地將其廣泛的知識庫與對話的持續背景相結合來準確地解釋文字並精確地遵守使用者提示。用戶現在可以靈活地編輯上傳的圖像或根據上傳的照片產生全新的視覺效果。影像生成能力的飛躍引起了廣泛關注,超過 1.3 億用戶在短短一周內生成了超過 7 億張圖片。
4o 影像生成現已上線!使用#MakeItWithCopilot讓您的創造力煥發生機並分享您的作品。以下是我能做的: ⚡呈現準確、可讀的文本 ⚡編輯你創建的內容 ⚡遵循複雜的指示 ⚡改變現有圖像的風格 ⚡製作… pic.twitter.com/3ZhXB19J5g
— Microsoft Copilot (@Copilot) 2025 年 5 月 15 日
微軟將圖像生成功能整合到 Copilot 中
繼 ChatGPT 的圖像功能取得巨大成功之後,微軟在近 50 天後宣布向 Copilot 用戶推出類似的功能。透過這種集成,Copilot 使用者能夠創建更精確的圖像、增強文字渲染、以及透過文字提示編輯生成的圖像等。
在快速發展的市場中保持競爭力
雖然微軟在推動 Copilot 方面的舉措值得稱讚,但該公司迫切需要加快開發步伐,以保持與 OpenAI 的 ChatGPT 和谷歌的 Gemini 等競爭對手的競爭力。在最近的 50 週年慶典活動中,微軟公佈了 Copilot 的幾項更新;然而,其中許多功能與 ChatGPT 和 Gemini 幾個月來提供的功能非常相似。
個人人工智慧的願景
微軟人工智慧執行長穆斯塔法·蘇萊曼向用戶保證,Copilot 將發展成為「深度個人化」的人工智慧助理。該公司在即將推出的更新中將如何有效地實現這一目標還有待觀察。
發佈留言 ▼