原始标题: Ex-OpenAI Researcher Says They’re ALL Wrong About AI

发布日期: 2026-02-06 | 来源频道: @TheAiGrid

📝 深度摘要

对话背景与核心主题

一位前OpenAI研究员正在创办一家新AI公司,计划融资5亿到10亿美元。这不是一家普通的AI创业公司——他们正在探索一条与当前主流大语言模型完全不同的道路。该公司致力于开发能够从现实世界中持续学习的AI模型,即"持续学习"(Continual Learning)技术。这一动向引发了业界对AI未来发展方向的广泛讨论。

核心逻辑拆解

当前AI模型的核心问题是"静态"——模型在训练完成后就无法再学习新知识。当你告诉大语言模型新信息时,它只是在当前对话中临时理解这些内容,对话结束后就完全忘记。这就像一个学生在考试中表现优异,但不被允许记下任何东西供下次使用。与人类不同,人类可以学棋、下棋、输了就调整、然后变得更强;但LLM学会棋局策略后,它表现好仅仅是因为它已经熟悉了这些模式,无法真正改进。

方法论与工具箱

这家新公司计划采用以下创新方法:

  1. 超越Transformer架构:当前主流模型都基于Transformer,但他们打算开发全新的模型架构
  2. 持续学习:让模型能够从现实经验中实时学习,而不是一次性训练完就静态
  3. 减少数据依赖:目标是比当前最先进模型少用100倍的数据进行训练
  4. 重新思考梯度下降:梯度下降是训练神经网络的标准方法,他们认为可能需要全新的优化方法
  5. 嵌套学习:借鉴Google的思路,将神经网络视为多个相互嵌套的学习气泡,每个气泡学习任务的一部分,以不同速度独立更新

关键洞察与辩论

亚马逊AI研究负责人David Luan在NeurIPS大会上明确表示:“我保证,我们今天训练模型的方式不会持续下去。“这一观点得到了与会研究者的广泛认同。

视频指出,当前AI发展路径存在严重局限:虽然生成式AI仍然有效,但它本质上只是根据训练数据中的模式进行预测,而非真正理解和推理。要实现通用人工智能(AGI),可能需要全新的开发技术。

前OpenAI研究员的宏伟愿景包括:工业自动化、自复制工厂、甚至改造行星。这些目标听起来像是科幻小说,但如果成功,将彻底改变AI的经济格局——目前训练一个前沿模型需要数十亿美元。

金句

  • “静态是杀手”——当前模型最大的问题在于训练后无法学习
  • “聪明人已经尝试过替代方案,梯度下降自1960年代就存在,我们至今仍在使用它是有原因的”
  • “有时候外行才能赢——Transformer本身就来自一个’完全不同的尝试'”
  • “智力真的没有极限”

📺 视频原片


视频时长: 10 分钟 | 视频ID: IfqAkTm4X_I