这里有个类比:美国直到1956年艾森豪威尔政府规划后才建成高速公路网,但保时捷、宝马、捷豹、法拉利等超高速性能汽车早已存在数十年。
可以说AI正处于相同转折点:虽然模型能力、性能和复杂度不断提升,但支撑现实世界真正创新的关键基础设施尚未完全建成。
"我们只是造出了性能优异的汽车引擎,却兴奋得像已经建成了完整的高速公路系统,"Gartner杰出副总裁分析师Arun Chandrasekaran告诉VentureBeat。
这导致OpenAI的GPT-5等模型能力进入某种平台期:虽是重要进步,但仅闪现出真正自主AI的微弱曙光。
"它是能力很强、用途广泛的模型,在特定领域取得了显著进展,"Chandrasekaran说,"但考虑到OpenAI过去设定的超高预期,我认为这更多是渐进式而非革命性进步。"
GPT-5三大关键进步
据Gartner观察,GPT-5确实在编码任务和多模态能力等方面取得突破。
Chandrasekaran指出,OpenAI明显嗅到生成式AI在企业软件工程领域的巨大机遇,转而让GPT-5在编码方面"非常出色",直接挑战竞争对手Anthropic在该领域的优势。
同时,GPT-5在文本之外的模态(特别是语音和图像)进展为企业提供了新的集成可能。
借助改进的工具调用能力,GPT-5确实在AI智能体与编排设计方面取得微妙进步——该模型能调用第三方API和工具,并实现并行工具调用(同时处理多任务)。但Chandrasekaran提醒,这意味着企业系统必须具备单会话并发API请求处理能力。
GPT-5的多步规划能力让更多业务逻辑可内置于模型,减少对外部工作流引擎的依赖。其更大的上下文窗口(免费用户8K/20美元月费Plus用户32K/200美元月费Pro用户128K)将"重塑企业AI架构模式"。
以往依赖复杂RAG管道绕过上下文限制的应用,现在可直接向模型传递更大数据集并简化工作流。但Chandrasekaran强调RAG仍具价值:"检索最相关数据仍比持续发送海量输入更快速经济。"
Gartner观察到混合方案趋势:开发者用GPT-5处理"更庞大混乱的上下文"时采用宽松检索策略以提升效率。
成本方面,GPT-5"显著"降低API费用——顶级费率输入token每百万1.25美元/输出token每百万10美元,与Gemini 2.5相当但远低于Claude Opus。不过Chandrasekaran提醒,GPT-5输入输出价格比高于早期模型,高token用量场景需特别注意。
告别旧版GPT(某种程度上)
最终GPT-5将取代GPT-4o及o系列(OpenAI最初停用后又因用户反对部分恢复)。Gartner指出,三种模型规格(pro/mini/nano)让架构师能根据成本和延迟需求分级服务——简单查询由小模型处理,复杂任务交给完整模型。
但输出格式、记忆和函数调用行为的差异可能需要代码审查调整,且GPT-5可能使某些旧解决方案失效,开发者应检查提示模板和系统指令。
"OpenAI试图帮用户屏蔽这种复杂度,"Chandrasekaran说,"我们往往不擅长做这些决定,甚至可能犯错。"
淘汰旧版背后还有算力考量:"众所周知OpenAI存在算力瓶颈",因此与微软、Oracle(星际之门计划)、谷歌等建立合作。同时运行多代模型需要多代基础设施,将产生新成本问题和物理限制。
采用GPT-5的新风险与建议
OpenAI宣称GPT-5将幻觉率较前代降低65%,这有助于降低合规风险,使其更适合企业场景,其思维链(CoT)解释功能支持审计与监管对齐。
但更低的幻觉率配合GPT-5的先进推理与多模态处理能力,可能加剧高级骗局和钓鱼攻击等滥用。分析师建议关键工作流仍需人工审核(可减少抽样比例)。
Gartner对企业领导者的建议:
智能体不仅需要算力,更需要基础设施
自主AI无疑是"当今超级热点",位列Gartner 2025生成式AI技术成熟度曲线投资榜首。但该技术已进入"过高期望峰值期",早期成功案例引发不切实际的预期。
按照Gartner规律,接下来将进入"泡沫化低谷期"——当实验和应用难以兑现承诺时,兴趣、热情和投资就会降温(1980年代后已出现过两次AI寒冬)。
"许多厂商的宣传远超产品实际能力,"Chandrasekaran说,"他们几乎把产品包装成即刻就能投产、快速创造商业价值的状态。"
但现实中产品与预期的鸿沟巨大。Gartner尚未看到企业级自主AI部署案例,现有应用仅存在于软件工程或采购等"狭窄领域"。
"这些工作流也非完全自主,本质仍是人工驱动或半自主状态。"
关键制约因素是基础设施缺失:智能体需要访问大量企业工具,必须具备与数据存储和SaaS应用通信的能力。同时需建立完备的身份与访问管理系统,以控制智能体行为、访问权限及可接触数据类型(排除个人身份信息等敏感数据)。
最后,企业必须确保智能体产出信息可信——无偏见、不含幻觉或虚假内容。
要实现这点,厂商需协作制定更开放的智能体与企业/智能体间工具通信标准。
"虽然智能体及其底层技术在进步,但要让它们蓬勃发展,这套编排、治理和数据层架构仍有待建设——这正是当前主要摩擦点。"
AI推理能力确实在进步,但让AI理解物理世界运作规律仍是难题。当前AI主要活跃在数字世界,尽管空间机器人技术有所突破,但与物理世界的强接口仍然匮乏。
"这类环境的应用还处于非常、非常早期的阶段。"
要取得重大突破需要模型架构或推理能力的"革命性进化"。"沿着当前曲线,仅靠更多数据、更多算力永远无法达到AGI。"
备受期待的GPT-5发布印证了这点:虽然OpenAI将AGI设为终极目标,"但显然我们还遥不可及——距离AGI仍然非常、非常遥远。"