berman_Anthropic刚刚发布了Opus4_6

原始标题: Anthropic just dropped Opus 4.6

发布日期: 2026-02-05 | 来源频道: @matthew_berman

📝 深度摘要

对话背景与核心主题

Anthropic 发布了 Claude Opus 4.6，这是一次重大升级。视频发布于2026年2月5日，作者提前获得了访问权限并进行了深入测试。Opus 4.6在多个方面实现了显著提升，包括更长的任务执行时间、更大的上下文窗口以及更强大的代码能力。这标志着AI模型正朝着更加智能体化（agentic）的方向发展，能够处理更复杂、更长时间跨度的任务。

核心逻辑拆解

百万token上下文窗口：Opus 4.6 是除Google Gemini外唯一提供100万token上下文窗口的模型（测试版），平均水平仍维持在20万左右。更大的上下文窗口配合高质量输出是关键，Anthropic声称在百万token下仍能保持高准确性，减少"上下文衰减"问题。

Agent Teams功能：允许协调多个Claude Code实例协同工作。与子代理不同，Agent Teams中的每个实例拥有独立上下文窗口，可直接相互通信，实现并行探索，适用于研究审查、调试和跨层协调等场景。

自适应思考：模型可根据任务上下文动态调整思考深度，在简单任务上减少推理，在复杂问题上加深思考，用户可通过/effort参数控制。

方法论与工具箱

作者展示了多个基准测试结果。BoxAI复杂工作评估显示：报告撰写提升10%，尽职调查从45%升至51%，公共部门68%升至75%，金融服务66%升至71%，生命科学医疗从39%飙升至64%，法律从45%升至51%。

SWE-bench Lite：Opus 4.6得分1662，领先GPT-5.2达150分。BrowseComp得分84，提升20分。Terminal Bench得分65.4%。人类终极考试中，使用工具达53%对40%。

关键洞察与辩论

SaaS大崩盘：视频发布前一天，SaaS行业蒸发3000亿美元市值。分析师认为Anthropic发布的Excel和PowerPoint插件是诱因——当AI能通过对话界面自主完成工作时，传统SaaS软件面临根本性威胁。Opus 4.6的发布使这一趋势更加明显。

成本考量：Agent Teams会显著增加Token消耗和GPU成本。定价与4.5相同：20万token以内输入$5/百万，输出$25/百万；超过20万token输入$10，输出$37.50。使用prompt caching可获折扣。

金句

“这就是行业的方向所在。”

“现在正是智能体自主性的时代。”

“整个行业正朝着更智能体化、更长执行时间、能够委派子任务的方向演进。”

📺 视频原片

视频时长: 14 分钟 | 视频ID: ORW9FumLGBo

对话背景与核心主题#

核心逻辑拆解#

方法论与工具箱#

关键洞察与辩论#

金句#

对话背景与核心主题

核心逻辑拆解

方法论与工具箱

关键洞察与辩论

金句