原始标题: Anthropic just dropped Opus 4.6

发布日期: 2026-02-05 | 来源频道: @matthew_berman

📝 深度摘要

对话背景与核心主题

Anthropic 发布了 Claude Opus 4.6,这是一次重大升级。视频发布于2026年2月5日,作者提前获得了访问权限并进行了深入测试。Opus 4.6在多个方面实现了显著提升,包括更长的任务执行时间、更大的上下文窗口以及更强大的代码能力。这标志着AI模型正朝着更加智能体化(agentic)的方向发展,能够处理更复杂、更长时间跨度的任务。

核心逻辑拆解

百万token上下文窗口:Opus 4.6 是除Google Gemini外唯一提供100万token上下文窗口的模型(测试版),平均水平仍维持在20万左右。更大的上下文窗口配合高质量输出是关键,Anthropic声称在百万token下仍能保持高准确性,减少"上下文衰减"问题。

Agent Teams功能:允许协调多个Claude Code实例协同工作。与子代理不同,Agent Teams中的每个实例拥有独立上下文窗口,可直接相互通信,实现并行探索,适用于研究审查、调试和跨层协调等场景。

自适应思考:模型可根据任务上下文动态调整思考深度,在简单任务上减少推理,在复杂问题上加深思考,用户可通过/effort参数控制。

方法论与工具箱

作者展示了多个基准测试结果。BoxAI复杂工作评估显示:报告撰写提升10%,尽职调查从45%升至51%,公共部门68%升至75%,金融服务66%升至71%,生命科学医疗从39%飙升至64%,法律从45%升至51%。

SWE-bench Lite:Opus 4.6得分1662,领先GPT-5.2达150分。BrowseComp得分84,提升20分。Terminal Bench得分65.4%。人类终极考试中,使用工具达53%对40%。

关键洞察与辩论

SaaS大崩盘:视频发布前一天,SaaS行业蒸发3000亿美元市值。分析师认为Anthropic发布的Excel和PowerPoint插件是诱因——当AI能通过对话界面自主完成工作时,传统SaaS软件面临根本性威胁。Opus 4.6的发布使这一趋势更加明显。

成本考量:Agent Teams会显著增加Token消耗和GPU成本。定价与4.5相同:20万token以内输入$5/百万,输出$25/百万;超过20万token输入$10,输出$37.50。使用prompt caching可获折扣。

金句

“这就是行业的方向所在。”

“现在正是智能体自主性的时代。”

“整个行业正朝着更智能体化、更长执行时间、能够委派子任务的方向演进。”


📺 视频原片


视频时长: 14 分钟 | 视频ID: ORW9FumLGBo