Dario_Amodei_AI规模定律与安全未来
Anthropic CEO Dario Amodei与Lex Fridman深度对话,探讨AI规模定律、Claude模型发展与AI安全未来。Dario预测到2026或2027年,AI可能在某些任务上达到甚至超越人类专家水平,真正的障碍正在快速减少。他详细解释了Scaling Laws背后的科学原理:语言中存在递进的层次结构模式,小型网络只能学习最常见模式,大型网络则能处理更复杂细微的模式。Anthropic采用诗歌命名策略——Haiku代表快速小型模型,Sonnet代表中等规模,Opus代表最强大版本。团队在可解释性研究方面取得突破,发现神经网络内部存在可理解结构,一个著名例子是「金门大桥Claude」现象。Dario提出AI安全分级体系RSP:ASL 3可能在2026或2027年达到,这对非国家行为者构成风险。他强调AI增加了世界上的权力,集中这些权力并滥用可能造成不可估量的损害。