原始标题: Anthropic Is Mad That China Did What They Did

发布日期: 2026-02-25 | 来源频道: @mreflow

📝 深度摘要

对话背景与核心主题

2026年2月23日,Anthropic发布博客文章,指控三家中国AI公司——DeepSeek、Moonshot和Minimax——以"协调行动"的方式,通过模型蒸馏(Model Distillation)技术窃取其Claude模型的能力。Anthropic声称这是"工业规模"的攻击,涉及24,000个虚假账户和超过1,600万次交互,并将其上升为国家安全问题。本视频深入解析这一事件的来龙去脉,并揭示Anthropic在此事上的"双标"立场。

核心逻辑拆解

什么是模型蒸馏? 简而言之,模型蒸馏是一种"以小博大"的训练技术。假设Anthropic训练了一个强大的"教师模型"(如Claude Opus),学生模型通过向教师模型提问并获取回答(包括思维链),反复数十万至数百万次,从而"学到"教师模型的推理方式。这种方法比从头训练省时省钱——从数月、数亿美元降到几天。

Anthropic自身就是蒸馏的践行者:从Opus蒸馏出Sonnet,再蒸馏出Haiku;OpenAI从GPT-5.2蒸馏出Mini和Nano版本。但这次被指控的是:这三家中国公司未经Anthropic许可,用其模型来训练自己的竞争产品。

方法论与工具箱

  • 蒸馏技术:学生模型获取教师模型的"思维链"(Chain of Thought)+ 最终回答
  • 检测手段:IP关联、请求元数据、基础设施标记、行业伙伴协作
  • 攻击规模
    • DeepSeek:150,000+次交互,专门针对推理能力
    • Moonshot:340万+次交互,针对智能体推理、代码、数据分析、计算机视觉
    • Minimax:1300万次交互(最大),并在Anthropic发布新模型后24小时内转向获取最新能力

关键洞察与辩论

  1. Anthropic的"双标"困境

    • Anthropic曾未经许可抓取整个互联网数据训练模型(包括Reddit等平台),因此被起诉
    • 2025年9月:与作者群体达成15亿美元和解(50万本书,每本约$3,000)
    • 2025年6月:Reddit起诉Anthropic非法使用其数据
    • 讽刺点:当别人用它的模型输出时,它却怒了
  2. 全行业都在"先拿后问"

    • OpenAI:被曝转录100万小时YouTube视频训练GPT-4;与《纽约时报》版权诉讼缠身
    • Meta:非法抓取大量图书训练模型,内部聊天记录显示其明知不可为而为之
    • Google/XAI:因抓取盗版图书用于AI训练被起诉
  3. 为何你应该关心?

    • 安全护栏流失:蒸馏后的模型往往保留较少的安全限制,多层蒸馏后风险累积
    • 地缘政治:Anthropic试图以此证明美国应对中国实施更严格的芯片出口管制
    • 法律空白:AI输出物是否受版权保护尚无定论,蒸馏是否算"盗窃"仍是灰色地带

金句

“整个AI行业建立在『先拿走、再问』的基石之上——从不请求许可。”

“唯一的区别在于:谁有权力和法律资源来抱怨并采取行动。”

“AI行业一直有版权问题。问题在于:我们是否要在某处划线,还是这就是新常态——人人互相抄袭?”


📺 视频原片


视频时长: 13分钟 | 视频ID: sNCPV-Og9A8