原始标题: Google Gemini 3 DeepThink Is Now the Smartest AI In The World

发布日期: 2026-02-14 | 来源频道: @TheAiGrid

📝 深度摘要

对话背景与核心主题

Google发布了Gemini 3 DeepThink升级版,这是目前世界上最强大的AI推理模型。该模型专注于科学研究的深度推理能力,在多个权威基准测试中刷新纪录,性能远超竞争对手Claude Opus 4.6。Google此次更新非常低调,没有大规模宣传,但实际上这是一次革命性的AI突破。

核心逻辑拆解

DeepThink采用扩展思维推理(Chain of Thought)技术,通过多轮迭代同时探索多个假设,然后生成答案。与传统模型不同,它不追求速度,而是将大量计算资源投入到深度思考中,这就是为什么它只提供每月200美元的高级版本。在推理过程中,如果发现小错误会发送给修正器修复,如果完全错误则会推倒重来,这个循环可以执行数百次直到得到正确答案。

方法论与工具箱

模型在多个基准测试中表现惊人:Humanity’s Last Exam超越Claude Opus,Code Forces达到3455分(相当于世界第8强程序员),ARC AGI 2从基础模型的30%跃升至84.6%(人类平均仅60%)。更令人震惊的是,仅6个月时间,模型在IMO数学竞赛题上的得分就从65%提升到90%,这个进步速度远超预期。

关键洞察与辩论

更值得关注的是Google同期发布的Althia研究代理,它基于DeepThink构建,能自主解决专业级数学、物理和计算机科学问题。Althia已成功解决700个Erdos未解数学问题中的4个,其独立完成的算术几何论文已被提交至学术期刊。在PhD级别数学问题上,Althia达到46%准确率,超越纯DeepThink的38%。这标志着AI从"帮助研究"进化到"独立研究"。

金句

  • “AI从帮助你的研究变成了可以做研究——这本质上是完全不同的事。”
  • “从65%到90%的数学奥赛题,6个月——这种进步速度应该让你持续关注这个领域。”
  • “我们正在见证AI在0到2级的阶梯上攀升,问题不是它能否达到3或4级,而是何时到达。”

📺 视频原片


视频时长: 22 分钟 | 视频ID: OFb3f3RnxRk