
OpenAI 通过 ChatGPT 实现图像生成革命
今年三月,OpenAI 增强了 ChatGPT 的图像生成能力,标志着其迈向了一个重要的里程碑。ChatGPT 的最新版本摆脱了对 DALL·E 等外部模型的依赖,利用 GPT-4o 的固有能力,提升了基于文本输入的图像生成的准确性和视觉吸引力。
GPT-4o 在视觉渲染方面的强大功能
先进的 GPT-4o 模型能够精准解读文本,并精准遵循用户提示,有效地将其丰富的知识库与当前的对话语境相结合。用户现在可以灵活地编辑已上传的图片,或根据上传的照片生成全新的视觉效果。这一图像生成能力的飞跃引起了广泛关注,超过 1.3 亿用户在短短一周内生成了超过 7 亿张图片。
4o 图像生成现已上线!使用#MakeItWithCopilot让你的创意焕发生机,分享你的作品。我可以做到以下几点: ⚡渲染精准易读的文本 ⚡编辑你创建的内容 ⚡遵循复杂的指令 ⚡改变现有图像的风格 ⚡制作…… pic.twitter.com/3ZhXB19J5g
— Microsoft Copilot (@Copilot) 2025 年 5 月 15 日
微软将图像生成功能集成到 Copilot 中
继 ChatGPT 的图像功能大获成功后,微软在近 50 天后宣布向 Copilot 用户推出类似功能。此次集成使 Copilot 用户能够创建更精确的图像,增强文本渲染,并能够通过文本提示编辑生成的图像,以及其他改进。
在快速发展的市场中保持竞争力
虽然微软在推进 Copilot 方面的举措值得称赞,但该公司迫切需要加快开发速度,以保持与 OpenAI 的 ChatGPT 和谷歌的 Gemini 等竞争对手的竞争力。在最近的 50 周年庆典活动上,微软发布了 Copilot 的多项更新;然而,其中许多功能与 ChatGPT 和 Gemini 几个月来推出的功能非常相似。
个人人工智能的愿景
微软人工智能首席执行官穆斯塔法·苏莱曼向用户保证,Copilot 将进化成为一位“深度个性化”的人工智能助手。该公司能否在接下来的更新中有效实现这一目标,还有待观察。
发表回复