OpenAI联合创始人兼CEO萨姆·奥尔特曼公开承认昨日发布的旗舰大语言模型GPT-5存在重大缺陷——尽管该模型被宣传为公司迄今最强大的AI系统。
在Reddit AMA问答和今日X平台的推文中,奥尔特曼坦承GPT-5发布过程中暴露出模型切换故障、性能低下及用户困惑等问题,这迫使OpenAI部分撤回平台更新,并重新开放GPT-4o等旧版模型的访问权限。
"这次发布比我们预期的更坎坷",奥尔特曼在回复Reddit用户关于GPT-5发布的提问时写道。
针对GPT-5直播演示中出现的性能图表错误,奥尔特曼解释:"团队成员熬夜工作极度疲惫,导致人为失误。直播前最后时刻需要协调大量工作。"
尽管他强调配套技术文档准确无误,这些失误仍为本就备受早期用户审视的发布蒙上阴影。
新型自动模型路由器的故障
奥尔特曼指出,问题的核心在于OpenAI新开发的自动"路由器"系统——该系统本应将用户指令分配给GPT-5的四个变体(标准版/mini/nano/pro),并为复杂任务提供可选的"思考模式"。
在X平台上,奥尔特曼披露该系统的关键组件"自动切换器"曾"宕机数小时",导致GPT-5表现"比预期迟钝许多"。
OpenAI表示正改进模型决策边界机制,并将明确显示响应查询的具体模型版本。界面更新也将允许用户手动启用思考模式。
鉴于用户对GPT-5性能不稳定的投诉激增,奥尔特曼确认ChatGPT Plus订阅者可继续使用原默认模型GPT-4o。他在Reddit表示公司"正收集新旧模型效能对比数据"以确定旧版模型的保留期限。
但包括沃顿商学院教授Ethan Mollick在内的测试者批评OpenAI单方面将用户ChatGPT体验升级至GPT-5并初期禁用旧版模型的做法。
实际表现与宣传存在落差
虽然OpenAI内部测试显示GPT-5领先同类大模型,但用户实测反馈截然不同。
自发布以来,大量案例显示GPT-5在数学运算、逻辑推理和编程任务中出现基础错误。数据科学家Colin Fraser晒出GPT-5错误判定"8.888循环等于9"的截图,另有用户演示其连"5.9=x+5.11"的简单代数题都未能解决。
开发者社区同样反映,GPT-5在"单提示"编程任务中的表现逊色于竞争对手Anthropic新发布的Claude Opus 4.1模型。安全公司SPLX则发现GPT-5仍存在提示注入攻击和逻辑混淆漏洞。
聚光灯下的OpenAI
凭借ChatGPT周活用户达7亿,OpenAI仍是生成式AI领域的龙头。但规模扩张带来阵痛——奥尔特曼透露GPT-5发布后24小时内API流量翻倍,加剧了平台不稳定。
OpenAI宣布将ChatGPT Plus用户的速率限制提升一倍,并持续优化基础设施。但这次高调发布暴露的缺陷,加上令人困惑的UX改动,为竞争对手提供了赶超契机。
OpenAI亟需证明GPT-5不仅是迭代更新,而是真正的技术突破。就初期表现而言,许多用户尚未被说服。