在假期前夕,微软宣布对其搜索引擎必应中的AI图像编辑工具Bing Image Creator进行升级,计划采用OpenAI的DALL-E 3模型的新版本“PR16”。微软承诺新模型将能以更高的质量和更快的速度生成图像——据称速度是之前的两倍。然而,这一承诺并未完全实现。
用户反馈与问题显现
X平台和Reddit上的用户迅速表达了不满。一位Reddit用户表示:“我们曾经喜爱的DALL-E已经一去不复返了。”另一位用户则提到,“我现在改用ChatGPT了,因为必应对我来说已经没用了。”面对用户的强烈反响,微软决定暂时恢复旧版模型,即DALL-E 3的PR13版本,直到解决当前的问题。
微软的回应
微软搜索负责人Jordi Ribas在一篇帖子中解释说:“我们已经能够复现一些报告的问题,并计划恢复到[DALL-E 3] PR13版本,直到我们能够修复这些问题。不幸的是,部署过程非常缓慢。它从一周多前开始,还需要2-3周才能完成100%的覆盖。”
分析问题所在
从用户的反馈来看,尽管提示词没有标准化,但许多用户指出PR16生成的图像不够真实,甚至“缺乏生气”。撰稿人Mayank Parmar为Windows Latest撰文指出,PR16生成的图像缺乏细节和精致感,显得奇怪地卡通化。
这不是首次出现内部检查通过的模型未能获得公众好评的情况。今年2月,谷歌因用户抱怨其AI聊天机器人Gemini生成的历史人物图像不准确而被迫暂停该功能。
现实世界的挑战
这些情况揭示了在现实世界中衡量模型改进的难度有多大。根据Ribas的说法,微软的基准测试发现,PR16的质量平均略优于之前的Bing Image Creator模型。然而,这显然与大多数用户的偏好并不一致。
评论0