原始标题: Google Gemini 3 DeepThink Is Now the Smartest AI In The World
发布日期: 2026-02-14 | 来源频道: @TheAiGrid
📝 深度摘要
对话背景与核心主题
Google发布了Gemini 3 DeepThink升级版,这是目前世界上最强大的AI推理模型。该模型专注于科学研究的深度推理能力,在多个权威基准测试中刷新纪录,性能远超竞争对手Claude Opus 4.6。Google此次更新非常低调,没有大规模宣传,但实际上这是一次革命性的AI突破。
核心逻辑拆解
DeepThink采用扩展思维推理(Chain of Thought)技术,通过多轮迭代同时探索多个假设,然后生成答案。与传统模型不同,它不追求速度,而是将大量计算资源投入到深度思考中,这就是为什么它只提供每月200美元的高级版本。在推理过程中,如果发现小错误会发送给修正器修复,如果完全错误则会推倒重来,这个循环可以执行数百次直到得到正确答案。
方法论与工具箱
模型在多个基准测试中表现惊人:Humanity’s Last Exam超越Claude Opus,Code Forces达到3455分(相当于世界第8强程序员),ARC AGI 2从基础模型的30%跃升至84.6%(人类平均仅60%)。更令人震惊的是,仅6个月时间,模型在IMO数学竞赛题上的得分就从65%提升到90%,这个进步速度远超预期。
关键洞察与辩论
更值得关注的是Google同期发布的Althia研究代理,它基于DeepThink构建,能自主解决专业级数学、物理和计算机科学问题。Althia已成功解决700个Erdos未解数学问题中的4个,其独立完成的算术几何论文已被提交至学术期刊。在PhD级别数学问题上,Althia达到46%准确率,超越纯DeepThink的38%。这标志着AI从"帮助研究"进化到"独立研究"。
金句
- “AI从帮助你的研究变成了可以做研究——这本质上是完全不同的事。”
- “从65%到90%的数学奥赛题,6个月——这种进步速度应该让你持续关注这个领域。”
- “我们正在见证AI在0到2级的阶梯上攀升,问题不是它能否达到3或4级,而是何时到达。”
📺 视频原片
视频时长: 22 分钟 | 视频ID: OFb3f3RnxRk