原始标题: Demis Hassabis: Future of AI, Simulating Reality, Physics and Video Games | Lex Fridman Podcast #475
发布日期: 2026-02-01 | 来源频道: @lexfridman
📝 深度摘要
对话背景与核心主题
这是Demis Hassabis第二次登上Lex Fridman播客舞台。作为Google DeepMind的领导者,他在2024年因AlphaFold蛋白质结构预测方面的突破性成就与John Jumper共同获得诺贝尔化学奖。本次对话是一次跨越近三个小时的深度思想碰撞,涵盖了对AI未来的展望、意识的本质、自然系统的可学习性、AGI可能带来的变革,以及从量子物理到视频游戏的多重主题。
Hassabis在诺贝尔奖演讲中提出了一个大胆的猜想:任何可以在自然界生成或发现的模式,都可以被经典学习算法高效发现和建模。这一观点将自然界的选择过程与机器学习联系在一起,认为进化不仅创造了生命,还创造了可被高效建模的结构。
核心逻辑拆解
自然是高效的搜索过程
Hassabis的核心论点是:自然界本身就是一个极其高效的搜索过程。蛋白质折叠在生物体内毫秒级完成,这一过程如果用暴力计算可能需要宇宙年龄的时间。然而,物理世界解决了这个问题——通过数十亿年的进化,自然界找到了高效的路径。
关键洞察在于:任何经历进化或自然选择过程的事物,都具有可学习的结构。这包括:
- 蛋白质结构:AlphaFold已解决蛋白质折叠问题,这是生物学长达50年的重大挑战
- 围棋棋局:AlphaGo击败了世界冠军李世石和柯洁
- 流体动力学和天气系统:GraphCast已能够进行准确的天气预报
- 视频生成中的物理规律:Veo/V3已经能够建模液体、光照、材质等直观物理
Hassabis提出"生存最稳者"(survival of the stablest)的概念——不仅是生命,整个自然界都经历了类似的选择过程。山脉的形状、行星的轨道、小行星的外形,都是长期自然过程塑造的结果,因此也具有可学习的模式。
P=NP作为物理问题
将宇宙视为信息系统后,P=NP问题变成了一个物理问题。Hassabis认为,如果信息是宇宙最基本的存在形式(比能量和物质更基本),那么计算复杂性的边界就是物理定律的一部分。
他乐观地认为,经典图灵机能够做到的比人们想象的更多。AlphaFold已经证明,传统上被认为需要量子计算机才能解决的蛋白质折叠问题,完全可以在经典系统上解决。
视频生成模型对物理学的学习
一个令人惊讶的发现是:视频生成模型Veo/V3通过被动观看YouTube视频就学会了直观物理学——液体如何流动、物体如何碰撞、光照如何反射。这挑战了传统的"具身智能"假说,即必须通过与物理世界交互才能理解物理规律。
Hassabis曾经编写过物理引擎和图形引擎,他深知手动编程这些物理行为有多么困难。然而,这些AI系统通过观看视频就自动提取了underlying structure,学习了材料的行为方式。这暗示了现实世界本身的某种深层结构——信息在宇宙中的组织方式可能比预期的更易于学习。
方法论与工具箱
Alpha系列的迭代方法
DeepMind的方法论是模块化、可叠加的,每个项目都为下一个更宏大的目标奠定基础:
- AlphaGo:解决确定性、规则明确的博弈问题,使用蒙特卡洛树搜索和深度学习
- AlphaFold:解决蛋白质结构预测问题,改变了生物学研究范式
- AlphaFold 3:扩展到蛋白质、RNA、DNA的相互作用建模
- AlphaGenome:预测基因突变如何影响功能
- AlphaEvolve:用LLM引导的进化算法发现新算法
- GraphCast:天气预报系统
- Veo/V3:视频生成,理解直观物理
Hassabis的终极梦想是"虚拟细胞"——在计算机中模拟完整的细胞,使得生物学实验可以在硅基环境中进行,大幅加速研究进程。建模整个细胞需要处理不同时间尺度的过程,从快速的蛋白质折叠到慢速的细胞分裂,这需要层次化的系统来建模。
搜索+模型的组合
核心方法论是:将问题分解为"模型"(对环境dynamics的理解)和"搜索"(在解空间中寻找最优解)。模型使搜索变得高效,使原本指数级的问题变得可解。
搜索方法包括:
- 蒙特卡洛树搜索(AlphaGo):在博弈树中进行智能搜索
- 进化计算(AlphaEvolve):通过迭代选择和变异优化解
- LLM引导的创意生成:结合大语言模型的创造力和传统搜索算法的系统性
AlphaEvolve结合了LLM的"创意"和进化计算的"搜索"能力。传统进化计算的问题是无法产生真正的创新——它只能组合已有特征。但当LLM提供创意建议时,进化算法可以探索更广阔的可能性空间,找到人类工程师从未想过的解决方案。
关键洞察与辩论
通用人工智能的时间线
Hassabis估计,到2030年有50%的概率实现AGI。他的AGI定义很高:必须具备大脑的所有认知能力,包括真正的创造力和发明能力,而不仅仅是某些领域的专家。
验证AGI的方式可能是构建包含数万个认知任务的全面测试套件,涵盖人类能做的所有事情。这需要一个类似于"星际迷航"中Data的测试——一个全面的智能测试,而不是仅仅在特定任务上超越人类。
计算资源的 Scaling
关于是否能够持续扩展计算资源,Hassabis持乐观态度。AI系统现在被数十亿人使用,需要大量的推理计算。新的"思考系统"范式(过去一年的新发展)使得模型能够在回答问题前进行更长时间的思考,这进一步增加了计算需求。
能源是一个关键约束。Hassabis提到核聚变可能是未来能源解决方案的一部分。训练最大的模型需要数据中心之间的带宽约束等额外限制。
从游戏到AGI
Hassabis谈到了电子游戏对他和DeepMind的影响。游戏不仅是测试AI系统的完美环境,也是灵感的来源。他喜欢像《Stanley Parable》这样的元游戏,它们探讨选择和自由意志的哲学概念。《Daggerfall》的程序化生成给他留下了深刻印象——每次玩家进入地牢时,都会生成一个独特的世界。
他提到,《GTAS 6》的发布和Gemini 3的发布是人们热切期待的两个东西。虽然他不能透露具体的时间表,但他强调了持续改进的重要性——从Gemini 2.5到3.0的转变可能意味着全新的体验,而不仅仅是性能的提升。
历史的启示
对话还涉及了约翰·冯·诺依曼和曼哈顿计划。Hassabis认为冯·诺依曼会对今天的发展感到兴奋,因为他早在1950年代就预见了学习机器系统的潜力。冯·诺依曼帮助发明了现代计算机所基于的冯·诺依曼架构,他对游戏理论也有贡献。
关于曼哈顿计划,Hassabis认为可能有足够的电话沟通——与被称为"敌人"的人交谈。这是对当前地缘政治紧张局势的微妙暗示。
金句
“任何可以进化的东西,也可以被高效建模。”
“我认为信息是宇宙最基本的存在形式,比能量和物质更基本。”
“自然界在做的事情本质上是一种搜索过程,而我们正在用AI模仿这种搜索。”
“我们可能持续惊讶于经典计算机能被建模的范围。”
“构建AGI是为了帮助我们回答这些基本的科学问题——比如P=NP。”
“真正让我印象深刻的是V3对物理行为的理解——液体、光照、材质——这表明它至少具有某种直观物理学概念。”
“我认为我们甚至还没有真正触及古典系统的表面。”
“我仍然相信我们在这个美好的混乱中是一体的。”
📺 视频原片
视频时长: 148 分钟 | 视频ID: OHfXyHfNTe8