原始标题: I got a private lesson on Claude Cowork & Claude Code

发布日期: 2026-01-23 | 来源频道: @GregIsenberg

📝 深度摘要

Anthropic推出全新桌面AI协作应用Claude Co-work，将强大的AI代理能力普惠至普通用户。该应用可在独立虚拟机中安全运行，支持浏览器自动化操作Gmail、Google Sheets等工具，并能通过MCP协议连接各类第三方服务。Anthropic工程师Boris分享了他100%由Claude Code编写的开发经验，建议日常同时运行5-10个Claude实例并行处理不同任务，采用"计划模式+自动执行"工作流，并用CLAUDE.md知识库持续积累团队使用心得。Boris强调Sonnet 4.5 with Thinking虽更大更慢，但因足够智能无需过度引导，反而更高效。当前AI代理正如2007年的iPhone时代，99%的使用方法尚未被发明，非工程师群体的采用速度甚至超过技术人员。

核心干货概览 (Key Takeaways)

维度	核心内容 / 动态	价值意义 / 影响程度
技术/工具	Claude Co-work：Anthropic推出的桌面端AI协作应用，Mac OS专属（Windows即将支持），基于Claude Code底层能力，提供可视化界面让非技术用户也能使用AI代理能力	将AI代理能力普及到普通用户，降低使用门槛，使每个人都能像指挥员工一样指挥AI完成复杂任务
技术/工具	Claude Code（Clad）：Anthropic的AI编程代理，最初为终端工具，现已扩展到移动端App、Web、IDE、Slack、GitHub等多平台	Boris在最近两个月100%的代码由Claude Code编写，实现了"人类只需做计划，AI执行"的全新编程范式
技术/工具	MCP（Model Context Protocol）：Anthropic推出的模型上下文协议，允许AI代理与任何工具进行交互	Co-work可以通过MCP连接各种第三方工具，实现真正的"AI操作系统"能力
技术/工具	Skills（技能）：用户可自定义的AI能力扩展包，可让AI学习特定工具或文件格式的操作方式	通过预装技能（如Excel技能），Co-work能直接操作复杂软件；用户也可为AutoCAD、Salesforce等工具创建自定义技能
战略/逻辑	从"单任务深度"到"多任务并行"的范式转变：Boris建议同时运行5-10个Claude实例并行处理不同任务	充分利用AI的并行能力，将人类从"执行者"转变为"AI管理者"，实现效率指数级提升
战略/逻辑	“计划模式+自动接受"工作流：先用Plan模式与AI来回讨论直到计划完美，然后切换到auto-accept-edits模式让AI执行	这是Boris从Sonnet 4.5中发现的最佳实践——计划一旦确认，代码几乎总能一次完成，大幅减少迭代次数
战略/逻辑	团队知识库累积策略：Anthropic团队将CLAUDE.md文件纳入Git版本控制，全员每周多次贡献，持续优化AI对团队代码风格和偏好的理解	将个人AI使用经验转化为团队资产，实现"复利工程”——每次Code Review发现的问题都写入知识库，AI永不犯同类错误
量化指标	99,000+：Boris关于Claude Code使用技巧的Twitter帖子收藏数	证明市场对AI代理最佳实践的强烈需求
量化指标	100%：Boris过去两个月编写的代码中，由Claude Code完成的比例	展示AI代理已达到生产级可用性
量化指标	5-10个：Boris日常同时运行的Claude实例数量	多代理并行工作模式的实证
量化指标	2-300个PR/月：Boris每月通过Claude Code提交的Pull Request数量	AI代理在大规模工程协作中的实际产出

深度逻辑与实操拆解 (Implementation Deep Dive)

核心痛点：Claude Code虽然功能强大，但最初只能在终端中使用，对普通用户和技术恐惧者极不友好。尽管Anthropic内部数据显示大量非工程师（如销售团队、市场团队、设计师、产品经理）已开始使用Claude Code，但其学习曲线仍然陡峭。

市场背景：2026年1月，AI Agent（代理）概念已被炒热，但大多数产品并非真正的"代理"——它们只能对话，无法真正操作计算机。Boris指出，Agent的明确定义是"能够使用工具、与世界交互、而不仅仅是文本对话的AI"。

产品演进：Claude Code最初并非作为产品开发，而是内部实验。当团队发现人们用它做各种非编程任务时，才开始认真考虑产品化。Co-work正是这一思路的产物——让AI代理能力通过简单UI普惠所有人。

核心策略推导

第一步：重新定义"代理"概念

Boris在演示中强调，Co-work本质上是"你的数字队友"而非"更聪明的聊天机器人"。它可以：

读取和生成文件
控制浏览器执行操作
使用任何支持MCP协议的工具
在虚拟机环境中安全运行（防止误操作影响主系统）

第二步：安全机制的递进设计

Anthropic从AI Safety Lab起步，安全是其核心DNA。Boris详细解释了多层安全架构：

模型层对齐：通过Alignment（对齐）和Mechanistic Interpretability（机械可解释性）研究神经元层面确保模型行为安全
虚拟隔离：Co-work在独立虚拟机中运行，任何操作不影响主机系统
删除保护（上周新增）：尝试删除文件前必须获得用户确认
权限控制：默认无任何权限，用户手动授权特定文件夹访问权
提示注入防护：针对互联网交互的特殊安全加固

第三步：演示"反向引导"机制

演示中，Boris让Co-work重命名收据文件。当AI不确定某个收据的日期时，它没有猜测，而是主动询问用户确认——这被称为"反向引导"（Reverse Elicitation），是Anthropic刻意训练模型的能力。

执行SOP/操作步骤

Co-work入门三步法

安装与配置
- 从Co-work官网下载Mac OS桌面应用
- 安装Chrome扩展（用于浏览器控制）
- 首次启动时选择授权访问的文件夹（默认无法访问任何文件）
基础任务执行
- 直接用自然语言描述任务（如"把这些收据重命名为日期格式"）
- AI分析任务、制定计划、请求确认
- 执行并展示结果
进阶：浏览器控制
- 授予Chrome扩展权限
- 可以要求AI帮你操作Gmail、Google Sheets、Slack等
- 支持"总是允许"、“仅一次”、“拒绝"三种权限模式

Claude Code专业用户工作流

Boris的日常使用流程（约10条核心习惯）：

多任务并行：同时启动5-10个Claude实例，分别处理不同任务
多平台切换：Mac终端（主要）、iOS/Android移动App（随时查看进度）、Web版本（终端标签不够时overflow）
计划模式启动：任何PR任务先用Plan模式来回讨论，确认计划后再执行
auto-accept-edits模式：计划确认后切换到此模式，Sonnet 4.5通常能一次完成
CLAUDE.md持续维护：团队共享的纯文本知识库，任何人发现AI犯错立即写入
GitHub集成：安装Claude GitHub App，在PR中@Claude让它修改代码
复合工程实践：Code Review时发现问题→直接让Claude更新CLAUDE.md→下次同类问题自动避免
验证即一切：构建应用时必须让Claude用Chrome扩展自己测试自己——“如果AI能验证自己的输出，结果会好得多”

细节支撑

演示案例1：收据整理任务

场景：Boris有一个杂乱的收据文件夹
操作：对Co-work说"把这些收据文件名改成收据上的日期”
过程：AI发现4个收据→其中一个日期不确定→主动询问用户→用户确认后执行
结果：文件按日期成功重命名

演示案例2：自动生成Google Sheets

场景：将收据信息整理成表格
操作：Co-work自动打开Chrome→访问Google Sheets→创建新表格→填入数据
细节：AI展示了完整的浏览器控制能力，包括读取屏幕内容、点击、输入

演示案例3：Gmail发送

场景：将表格发送给同事Amy
操作：Co-work打开Gmail→自动搜索联系人Amy→填写主题和正文→点击发送
验证：Boris设置了"总是允许"权限，演示了完整的邮件自动化流程

Boris的Twitter病毒帖核心内容（10条使用技巧）

并行任务策略：不要深度做一个任务，而是同时做一堆任务
多平台使用：终端+iOS+Web组合使用，同时运行5-10个实例
Sonnet 4.5 with Thinking：最佳编程模型，比Sonnet更大但因更智能反而总token消耗更少、更便宜
团队CLAUDE.md：共享的纯文本知识库，纳入Git版本控制，全员维护
GitHub集成：在PR中@Claude让它直接修改代码
计划模式启动：任何任务先Plan确认再执行
持续验证：让AI通过浏览器扩展自己测试自己的代码
移动端场景：早晨醒来躺床上用手机启动几个任务，白天查看进度
无固定格式：CLAUDE.md就是普通文本文件，无需特定格式
复合工程：Code Review发现的问题立即写入CLAUDE.md，实现自动化

核心执行资产 (Tactical Assets)

Prompt/指令集还原

Co-work基础任务指令模板

"请帮我[具体任务描述]，完成后[验证方式]"
例如：
- "请把这些收据照片的文件名改成收据上的日期格式"
- "帮我打开Google Sheets，创建一个支出记录表格"
- "给Amy发一封邮件，包含这个月的支出汇总"

Claude Code计划模式指令

/plan
[描述你想要完成的任务]

# 等待AI制定计划，来回讨论修改

/auto-accept-edits
[确认计划完美后执行]

CLAUDE.md团队知识库示例结构

# 项目注意事项

## 代码风格
- 使用TypeScript strict模式
- 函数长度不超过50行

## 测试要求
- 所有API端点必须编写集成测试
- 提交前运行npm test

## 常见陷阱
- 不要使用var，必须用const/let
- 异步函数必须try-catch
- 日期处理使用date-fns而非原生Date

GitHub Code Review自动化指令

@claude 
请检查这个PR的代码风格是否符合CLAUDE.md中的规范，
如果不符合，请直接修改。

工具链配置

Co-work必备组件

Co-work桌面应用：Mac OS专用
Chrome扩展：用于浏览器自动化
MCP服务器（可选）：连接第三方工具

Claude Code多平台入口

平台	适用场景	访问方式
Mac终端	深度编码工作	本地安装
iOS/Android App	移动中查看和管理任务	应用商店下载
Web版本	终端标签溢出时	claude.ai
IDE插件	VS Code/IntelliJ	IDE扩展市场
Slack集成	团队协作	Slack App目录
GitHub集成	Code Review自动化	GitHub App

性能优化三要素（Boris亲测）

始终使用Sonnet 4.5 with Thinking：“它是最棒的编程模型，虽然更大更慢，但因为足够聪明，不需要过度引导，最终反而比小模型更快更便宜”
投资CLAUDE.md：“这是最重要的，没有之一”
给AI验证能力：“让它用Chrome扩展自己测试自己”

专家洞察与风险边界 (Insights & Boundaries)

反直觉/非共识结论

1. “更大的模型反而更便宜”

Boris指出一个反直觉事实：Sonnet 4.5虽然per-token价格更高，但因更智能、需要的引导token更少，总成本往往低于使用Sonnet等小模型。“这很反直觉，但用最聪明的就对了。”

2. “AI不会取代工程师，而是改变工程师角色”

“我现在的工作就是在标签页之间跳来跳去，照看我的Claude们，确保它们没有被卡住，回答它们的问题。这就像一个全新工种——AI运维工程师。”

3. “非工程师比工程师更早大规模采用AI代理”

Anthropic内部数据显示，销售团队、市场团队、设计师、产品经理使用Claude Code的比例异常高。“我们最初以为工程师会先用，但实际上非技术人员的采用速度更惊人。”

4. “计划是最被低估的功能”

“几乎所有session都应该从Plan模式开始。一个好的计划几乎能保证一次成功。这是我最想推广的理念。”

5. “2026年初的AI代理阶段类似2007年的iPhone”

“就像App Store最初只有喝啤酒应用，没人能预测到Uber和TikTok的出现。现在AI代理的使用方式，我们99%还没想到。”

局限性与避坑指南

当前局限

速度问题：Boris坦承当前操作速度比人工慢，“如果你想快自己做”。但他认为速度会随模型进化飞速提升。
格式化错误：演示中Google Sheets的数据粘贴有小错误，AI自己发现并尝试修复。“这还是早期产品，不是所有事都完美。”
Mac only：Co-work目前仅支持Mac OS，Windows版本"即将推出"。
安全限制：严格的安全机制有时会导致某些操作需要反复确认。

避坑指南

不要一上来就定制：Co-work开箱即用效果已经很好，先用再根据需求调整。
不要跳过计划阶段：直接让AI执行往往导致反复修改，Plan模式虽然看似慢实际更快。
CLAUDE.md不是一次性任务：它是活的知识库，需要持续维护——每次AI犯错都是更新它的机会。
别让AI蒙眼工作：如果AI无法验证自己的输出（无法运行代码、看不到网站），结果质量会大打折扣。
小心提示注入：互联网交互存在提示注入风险，Anthropic已内置防护但并非绝对。

金句 (Golden Quotes)

“Co-work本质上就是你的数字队友，你可以让它做任何事，就像指挥一个同事一样。”
“AI代理的定义就是能使用工具、与世界交互，而不仅仅是文本对话。”
“我最近两个月100%的代码都是Claude Code写的，我一个字都没手动写。”
“计划一旦确认，代码几乎总能一次完成。一个好的计划比什么都重要。”
“用Sonnet 4.5吧，虽然更大更慢，但它足够聪明，不需要你过度引导，最终反而更快更便宜。”
“CLAUDE.md是核心——没有之一。每次AI犯错就写进去，这是团队最宝贵的知识资产。”
“如果你让AI无法验证自己的输出，就像让画家蒙着眼画画，结果不可能好。”
“我们正处于AI代理的iPhone时代——现在能想到的用法连1%都不到。”
“我同时运行5-10个Claude实例，我的工作就是在它们之间跳来跳去，确保它们没卡住。”
“永远不要重复解释同一件事——发现AI犯错就写进CLAUDE.md，下次它自动避免。”

📺 视频原片

视频ID: DW4a1Cm8nG4

📝 深度摘要#

核心干货概览 (Key Takeaways)#

深度逻辑与实操拆解 (Implementation Deep Dive)#

核心策略推导#

第一步：重新定义"代理"概念#

第二步：安全机制的递进设计#

第三步：演示"反向引导"机制#

执行SOP/操作步骤#

Co-work入门三步法#

Claude Code专业用户工作流#

细节支撑#

演示案例1：收据整理任务#

演示案例2：自动生成Google Sheets#

演示案例3：Gmail发送#

Boris的Twitter病毒帖核心内容（10条使用技巧）#

核心执行资产 (Tactical Assets)#

Prompt/指令集还原#

Co-work基础任务指令模板#

Claude Code计划模式指令#

CLAUDE.md团队知识库示例结构#

GitHub Code Review自动化指令#

工具链配置#

Co-work必备组件#

Claude Code多平台入口#

性能优化三要素（Boris亲测）#

专家洞察与风险边界 (Insights & Boundaries)#

反直觉/非共识结论#

1. “更大的模型反而更便宜”#

2. “AI不会取代工程师，而是改变工程师角色”#

3. “非工程师比工程师更早大规模采用AI代理”#

4. “计划是最被低估的功能”#

5. “2026年初的AI代理阶段类似2007年的iPhone”#

局限性与避坑指南#

当前局限#

避坑指南#

金句 (Golden Quotes)#

📺 视频原片#