AGI进展2026:OpenAI vs DeepMind vs 智谱,通用人工智能走到哪了?
未来趋势

AGI进展2026:OpenAI vs DeepMind vs 智谱,通用人工智能走到哪了?

AGI(通用人工智能)是AI研究的终极目标——一个能像人类一样理解、学习、执行任何智力任务的系统。2026年,OpenAI、DeepMind和智谱AI三家公司都声称自己”离AGI更近了”。我们梳理了它们的技术路线和最新进展,看看谁更接近终点。

AGI的三条路线

OpenAI走的是”大力出奇迹+强化学习”路线。从GPT-3到o1,OpenAI的核心策略是用更大的模型、更多的数据、更长的推理链来逼近通用能力。o1的推出标志着OpenAI正式进入”推理时代”——模型在回答前会先进行内部推理(Chain-of-Thought),然后在最终输出中只呈现结论。这种方式让数学、编程、逻辑推理能力大幅提升,但也带来了”黑盒化”问题——我们看不到模型的推理过程。

DeepMind的路线是”多模态融合+世界模型”。Gemini 2.0已经能同时处理文本、图像、音频、视频和代码,而且是在同一个模型内(而非多个专用模型拼接)。DeepMind认为AGI的关键不是”更大的语言模型”,而是”能理解物理世界的多模态系统”。2026年,DeepMind在机器人控制(RT-2模型)和气候模拟(GraphCast)两个非NLP领域都取得了突破。

智谱AI走的是”认知架构”路线。ChatGLM-5引入了”系统1/系统2″双系统架构——系统1负责快速直觉反应(日常对话),系统2负责慢速深度推理(数学证明、代码生成)。这种架构更接近人类的认知模式。而且智谱是三家中最开放的——ChatGLM-5的模型权重开源,研究者可以本地部署和研究。

AGI能力测评对比

用三个维度评估当前进展:

  • 推理能力:OpenAI o1最强。在数学竞赛题(AIME 2024)上得分86%,远超Gemini 2.0的62%和ChatGLM-5的58%。但o1的推理过程不透明,无法验证。
  • 多模态理解:DeepMind Gemini 2.0最强。在视频理解(Video-MME基准)上得分85%,能理解30分钟以上的长视频并回答细粒度问题。
  • 代码生成:三者接近。HumanEval基准上,o1得分92%,Gemini 2.0得分89%,ChatGLM-5得分87%。实际编程任务中,o1的生成质量更稳定。

AGI的时间表预测

OpenAI CEO Sam Altman在2026年1月表示”AGI可能在2027-2028年实现”。但这个预测被很多研究者认为过于乐观。DeepMind CEO Demis Hassabis的预测更保守:”2030年前看到初步的AGI能力,真正可靠的AGI需要到2035年。”智谱AI创始人唐杰的预测是”2029-2032年出现可验证的AGI原型”。

一个关键分歧是”AGI的定义”。OpenAI倾向于把”在多数任务上超越人类”作为AGI标准,而DeepMind和智谱更倾向于”能像人类一样持续学习和迁移”——后者要难得多。

投资与风险

2026年AGI相关融资超过300亿美元。OpenAI估值达到2000亿美元,DeepMind(谷歌旗下)年度研发预算超过50亿美元,智谱AI完成D轮融资后估值达到50亿美元。

但AGI的风险也在积累。2026年3月,一封由图灵奖得主Yoshua Bengio牵头的公开信呼吁”在AGI安全框架完善之前,暂停超过GPT-5量级的模型训练”。已有超过1000名AI研究员签署。

AGI不再是科幻概念。无论你相信2027年还是2035年,它正在从研究论文走向现实。唯一确定的是:当它到来时,世界不会和现在一样。

l

lifeclass

LifeClass Tech · 科技编辑

相关推荐