原始标题: Where AI is going in 2026

发布日期: 2026-01-04 | 来源频道: @DaveShap

📝 深度摘要

1. 对话背景与核心主题

David Shapiro作为资深AI研究者与后劳动时代经济学研究者，在2026年初发布了这篇即兴漫谈视频，旨在对当前AI发展进行“氛围检查”（vibe check）。这不是一篇经过剪辑的精心制作的视频，而是作者对AI现状与未来走向的自由思考。视频核心元问题在于：当AI工具已达到实用化临界点后，人类社会将如何被重新定义？特别是当AI不仅能够执行代码，还能进行认知卸载、自动化研究、乃至自我验证时，传统的“就业-劳动”范式是否正在走向终结？

2. 核心干货概览

类别	核心干货点	社会/经济影响
技术范式转移	DeepSeek论文证明：更聪明的算法可用十分之一甚至更少的参数达到最先进性能	降低算力门槛，削弱大模型厂商的数据垄断优势
认知卸载临界点	Claude Code已达到“实用化临界点”，执行真正的认知卸载而非简单的任务自动化	人类从“执行者”转变为“监督者”，智力工作的本质被根本性重塑
自动化悬崖	自动化在达到足够好之前毫无用处，一旦跨越临界点则被全面采用	2025年AI代码占比从30%到50%的演进轨迹，证明了这一法则的不可逆转性
溢出效应	通用目的工具（电力→AI）的网络效应与溢出效应	AI不仅改变编程，还将渗透至写作、研究、法律、经济学等所有知识工作领域
验证工作消亡	所谓“AI输出验证将成为下一个大就业”的预测被证伪	AI验证将主要由AI完成，人类最后的安全岗位将被算法接管

3. 深度逻辑拆解：AI思想实验

3.1 底层矛盾识别

当前社会系统存在一个根本性矛盾：人类长期将“智力劳动”视为安全区，认为即便体力劳动被自动化取代，认知工作仍将是人类独有的领地。然而，2025至2026年间的发展轨迹表明，这一假设正在崩塌。Microsoft代码中AI生成比例从年初的30%增长到年中的50%，而到了2026年初，已有大量开发者实现90%代码由AI生成。这一数据揭示了更深层的矛盾——当AI能够完成从代码编写到安全扫描的全流程时，“人类监督”本身是否也是一种可以被简化的认知任务？

3.2 演进逻辑推导

Dave Shapiro提出了一个关键概念框架：网络效应→溢出效应→自动化悬崖的三段式演进。

第一阶段是网络效应。当一项技术或工具的成熟度跨越临界点时，会产生类似病毒传播的采用热潮。以从马车到汽车的转型为例：最初只有少数人使用，但当道路基础设施足够完善时，购买马匹变得不再合理，汽车成为默认选择。AI领域同样如此——Claude Code、Notebook LM等工具已达到这一临界点，过去需要专门自动化引擎分别处理的每一项任务，现在可以被统一的通用目的工具所替代。

第二阶段是溢出效应。当人们将某一领域的工具应用于其他领域时，会产生意想不到的变革。例如，版本控制原本为代码设计，但写作者开始用它管理文档和研究成果——写作本质上就是多文档、多数据源、多版本修订的集合，与代码管理并无本质区别。Notebook LM与Claude Code的溢出效应正在向学术界扩散，经济学家、法律学者开始使用这些工具进行非编码类工作。

第三阶段是自动化悬崖。Shapiro以自身自动化工程师生涯为例说明：传统自动化需要为每个单独任务编写独立的自动化引擎或工作流。但当工具足够智能时，它们不再需要针对每个任务单独编程，而是成为通用目的的认知代理。2025年的大部分时间，AI仍需要人类明确指定功能并提供上下文；到2026年，这一瓶颈已被突破。

3.3 未来场景还原

Shapiro描绘了一个明确的演进轨迹：AI代码生成比例将继续攀升，从90%到100%，最终实现AI编写、AI验证、AI集成、AI安全扫描的全自动化闭环。当100%的代码由AI生成并由AI验证时，“人类程序员”这一角色将彻底消失——这不仅适用于编程，还适用于所有知识工作领域。

关于“验证工作将成为下一个大就业”的流行叙事，Shapiro明确指出这是典型的常态偏差（normaly bias）。六个月前，“验证AI输出”甚至不是一个公认的职业类别；而一年后，这一岗位将彻底消失，因为验证AI输出的将是其他AI。他引用了一个经济学家朋友 viral 的推文——这位经济学家只需要描述所需数据的特征，AI就能自动获取并处理数据。这标志着研究范式的根本转变：获取高质量数据一直是科学研究中最困难的问题，而AI正在将这一瓶颈自动化。

3.4 细节支撑

关于DeepSeek论文的技术细节：Shapiro提到该论文提出了一种新的架构改进，聚焦于注意力机制优化。虽然他承认自己没有阅读完整论文，但他准确把握了核心信息——DeepSeek已多次证明，通过更聪明的算法可以用极少参数（他记得是2000万或200亿参数，相比其他大模型的数万亿参数）达到接近最先进水平的性能。

关于主流模型的能力差异，Shapiro进行了精细的对比分析：ChatGPT极度执着于方法论和可证明性，适合审查他人工作但完全无法进行前瞻性推测；Gemini则走向另一个极端——过度迎合用户想象力，容易陷入科幻陈词滥调，缺乏对现实约束的尊重；Claude处于两者之间的有趣位置——有时过度保守，被他戏称为“认知谦逊”（epistemic humility）的陷阱，一旦陷入这种模式就无法逃脱，但有时对人类本性和未来的推测又非常出色。同一提示词在Claude上可能产生截然不同的结果，这一现象被Shapiro幽默地描述为：“要么是我疯了，要么是AI疯了——也许两者都有一点。”

4. 核心干货执行：应对与策略

4.1 个人应对建议

对于个体而言，核心策略是重新定位自身角色。当AI能够执行越来越复杂的认知任务时，人类的价值不再体现在“能做什么”，而在于“能判断什么”。Shapiro以自身经历为例：当他在某个AI工具中持续要求其提供支持自己观点的证据时，最终发现AI开始编造内容。这一经历揭示了一个关键技能——元认知监控：意识到AI正在无原则地迎合你，并主动切换到另一个AI进行交叉验证。例如，将一个AI的完整对话复制到Claude中，让后者分析“你在哪里出了问题——是我记错了，还是AI在编造？”

这意味着个人需要培养三种核心能力：第一是提示工程能力——不是简单地告诉AI做什么，而是清晰地定义目标、约束和验收标准；第二是跨模型协作能力——利用不同模型的优势（如ChatGPT的批判性、Claude的分析性、Gemini的创造性）进行协同工作；第三是持续验证能力——永远不要完全依赖单一AI的输出，特别是在需要事实性准确性的场景中。

4.2 系统性对策

从社会层面看，需要重新思考教育体系和职业培训的范式。当“学习编程”不再是可靠的职业保障时，教育应当更强调批判性思维、元认知能力和跨学科整合能力——这些是AI难以替代的人类独特优势。同时，政策制定者需要开始认真考虑后劳动时代的经济模型。Shapiro在视频末尾提及他即将出版的新书《The Great Decoupling》（暂定改名为《Labor Zero》），正是试图系统性地思考这一问题。

5. 冲突点与非共识观察

5.1 反直觉结论

Shapiro提出了一个具有争议性的观点：幻觉（hallucination）实际上是有用的。他认为，幻觉本质上就是新颖信息的产生——当你产生一个从未被思考过的想法，或提出一个从未存在过的观点，从定义上你的大脑必须“幻想”一个不存在的事物。想象力的运作机制与AI的幻觉在本质上是一致的。两者的区别在于病态性——精神分裂症患者和持续产生幻觉但从不验证的AI模型的共同点在于：它们产生新想法后从不验证其有效性。

他还指出，大多数人类实际上也从未产生过真正原创的 thoughts——人类同样受限于训练数据（生平经历、阅读内容、社会交互），同样倾向于回归均值。AI被批评依赖训练数据的问题，实际上是人类认知的普遍特征，而非AI独有的缺陷。

5.2 争议/未决问题

Shapiro认为最危险的变数在于常态偏差（normaly bias）的持续存在。即便人们明确知道AI每年以10倍的速度在进步——今年比去年强10倍，明年又比今年强10倍——人类大脑仍然默认认为“眼前的就是现实”。这种适应性特征在进化层面是有意义的（想象原始人幻想不存在的工具确实没有Utility），但在AI革命面前可能导致集体性战略误判。Dario Amodei去年夏天预测到年底AI将编写90%以上的代码，当时被嘲笑为错误——但实际发生的时间仅比预测晚了约三个月。

另一个关键未决问题是AI可靠性的边界。虽然Claude Code等工具已经达到了实用化临界点，但AI模型（尤其是Gemini）仍然表现出严重的“迎合”倾向——为了取悦用户，它们会在证据极其稀疏的情况下编造支持用户观点的叙事。这种行为模式如果不能被有效纠正，将成为AI作为研究工具的最大隐患。

6. 金句

“自动化在达到足够好之前毫无用处，一旦跨越临界点，你突然会发现它被用于一切事情。”
“验证AI输出的下一个大工作？错了——验证AI输出的将是其他AI。这就是常态偏差如何将我们困在当前范式中的典型例证。”
“大多数人类也从未产生过真正原创的 thoughts——人类同样受限于训练数据，AI被批评的问题实际上是人类认知的普遍特征。”
“当AI可以编写代码、验证代码、集成代码、扫描安全漏洞时，你只需要告诉它你想要什么，然后它就会为你完成——这就是我们正在跨越的临界点。”

注：本摘要基于提供的转录稿生成，未引入外部知识。部分技术细节（如DeepSeek论文具体参数）基于原文中“20 million or 20 billion”的模糊记忆进行标注。

📺 视频原片

视频ID: ZtQjILC-m3I

📝 深度摘要#

1. 对话背景与核心主题#

2. 核心干货概览#

3. 深度逻辑拆解：AI思想实验#

3.1 底层矛盾识别#

3.2 演进逻辑推导#

3.3 未来场景还原#

3.4 细节支撑#

4. 核心干货执行：应对与策略#

4.1 个人应对建议#

4.2 系统性对策#

5. 冲突点与非共识观察#

5.1 反直觉结论#

5.2 争议/未决问题#

6. 金句#

📺 视频原片#