原始标题: Anthropic Is Mad That China Did What They Did
发布日期: 2026-02-25 | 来源频道: @mreflow
📝 深度摘要
对话背景与核心主题
2026年2月23日,Anthropic发布博客文章,指控三家中国AI公司——DeepSeek、Moonshot和Minimax——以"协调行动"的方式,通过模型蒸馏(Model Distillation)技术窃取其Claude模型的能力。Anthropic声称这是"工业规模"的攻击,涉及24,000个虚假账户和超过1,600万次交互,并将其上升为国家安全问题。本视频深入解析这一事件的来龙去脉,并揭示Anthropic在此事上的"双标"立场。
核心逻辑拆解
什么是模型蒸馏? 简而言之,模型蒸馏是一种"以小博大"的训练技术。假设Anthropic训练了一个强大的"教师模型"(如Claude Opus),学生模型通过向教师模型提问并获取回答(包括思维链),反复数十万至数百万次,从而"学到"教师模型的推理方式。这种方法比从头训练省时省钱——从数月、数亿美元降到几天。
Anthropic自身就是蒸馏的践行者:从Opus蒸馏出Sonnet,再蒸馏出Haiku;OpenAI从GPT-5.2蒸馏出Mini和Nano版本。但这次被指控的是:这三家中国公司未经Anthropic许可,用其模型来训练自己的竞争产品。
方法论与工具箱
- 蒸馏技术:学生模型获取教师模型的"思维链"(Chain of Thought)+ 最终回答
- 检测手段:IP关联、请求元数据、基础设施标记、行业伙伴协作
- 攻击规模:
- DeepSeek:150,000+次交互,专门针对推理能力
- Moonshot:340万+次交互,针对智能体推理、代码、数据分析、计算机视觉
- Minimax:1300万次交互(最大),并在Anthropic发布新模型后24小时内转向获取最新能力
关键洞察与辩论
Anthropic的"双标"困境
- Anthropic曾未经许可抓取整个互联网数据训练模型(包括Reddit等平台),因此被起诉
- 2025年9月:与作者群体达成15亿美元和解(50万本书,每本约$3,000)
- 2025年6月:Reddit起诉Anthropic非法使用其数据
- 讽刺点:当别人用它的模型输出时,它却怒了
全行业都在"先拿后问"
- OpenAI:被曝转录100万小时YouTube视频训练GPT-4;与《纽约时报》版权诉讼缠身
- Meta:非法抓取大量图书训练模型,内部聊天记录显示其明知不可为而为之
- Google/XAI:因抓取盗版图书用于AI训练被起诉
为何你应该关心?
- 安全护栏流失:蒸馏后的模型往往保留较少的安全限制,多层蒸馏后风险累积
- 地缘政治:Anthropic试图以此证明美国应对中国实施更严格的芯片出口管制
- 法律空白:AI输出物是否受版权保护尚无定论,蒸馏是否算"盗窃"仍是灰色地带
金句
“整个AI行业建立在『先拿走、再问』的基石之上——从不请求许可。”
“唯一的区别在于:谁有权力和法律资源来抱怨并采取行动。”
“AI行业一直有版权问题。问题在于:我们是否要在某处划线,还是这就是新常态——人人互相抄袭?”
📺 视频原片
视频时长: 13分钟 | 视频ID: sNCPV-Og9A8