原始标题: I got a private lesson on Claude Cowork & Claude Code

发布日期: 2026-01-23 | 来源频道: @GregIsenberg

📝 深度摘要

Anthropic推出全新桌面AI协作应用Claude Co-work,将强大的AI代理能力普惠至普通用户。该应用可在独立虚拟机中安全运行,支持浏览器自动化操作Gmail、Google Sheets等工具,并能通过MCP协议连接各类第三方服务。Anthropic工程师Boris分享了他100%由Claude Code编写的开发经验,建议日常同时运行5-10个Claude实例并行处理不同任务,采用"计划模式+自动执行"工作流,并用CLAUDE.md知识库持续积累团队使用心得。Boris强调Sonnet 4.5 with Thinking虽更大更慢,但因足够智能无需过度引导,反而更高效。当前AI代理正如2007年的iPhone时代,99%的使用方法尚未被发明,非工程师群体的采用速度甚至超过技术人员。

核心干货概览 (Key Takeaways)

维度 核心内容 / 动态 价值意义 / 影响程度
技术/工具 Claude Co-work:Anthropic推出的桌面端AI协作应用,Mac OS专属(Windows即将支持),基于Claude Code底层能力,提供可视化界面让非技术用户也能使用AI代理能力 将AI代理能力普及到普通用户,降低使用门槛,使每个人都能像指挥员工一样指挥AI完成复杂任务
技术/工具 Claude Code(Clad):Anthropic的AI编程代理,最初为终端工具,现已扩展到移动端App、Web、IDE、Slack、GitHub等多平台 Boris在最近两个月100%的代码由Claude Code编写,实现了"人类只需做计划,AI执行"的全新编程范式
技术/工具 MCP(Model Context Protocol):Anthropic推出的模型上下文协议,允许AI代理与任何工具进行交互 Co-work可以通过MCP连接各种第三方工具,实现真正的"AI操作系统"能力
技术/工具 Skills(技能):用户可自定义的AI能力扩展包,可让AI学习特定工具或文件格式的操作方式 通过预装技能(如Excel技能),Co-work能直接操作复杂软件;用户也可为AutoCAD、Salesforce等工具创建自定义技能
战略/逻辑 从"单任务深度"到"多任务并行"的范式转变:Boris建议同时运行5-10个Claude实例并行处理不同任务 充分利用AI的并行能力,将人类从"执行者"转变为"AI管理者",实现效率指数级提升
战略/逻辑 “计划模式+自动接受"工作流:先用Plan模式与AI来回讨论直到计划完美,然后切换到auto-accept-edits模式让AI执行 这是Boris从Sonnet 4.5中发现的最佳实践——计划一旦确认,代码几乎总能一次完成,大幅减少迭代次数
战略/逻辑 团队知识库累积策略:Anthropic团队将CLAUDE.md文件纳入Git版本控制,全员每周多次贡献,持续优化AI对团队代码风格和偏好的理解 将个人AI使用经验转化为团队资产,实现"复利工程”——每次Code Review发现的问题都写入知识库,AI永不犯同类错误
量化指标 99,000+:Boris关于Claude Code使用技巧的Twitter帖子收藏数 证明市场对AI代理最佳实践的强烈需求
量化指标 100%:Boris过去两个月编写的代码中,由Claude Code完成的比例 展示AI代理已达到生产级可用性
量化指标 5-10个:Boris日常同时运行的Claude实例数量 多代理并行工作模式的实证
量化指标 2-300个PR/月:Boris每月通过Claude Code提交的Pull Request数量 AI代理在大规模工程协作中的实际产出

深度逻辑与实操拆解 (Implementation Deep Dive)

核心痛点:Claude Code虽然功能强大,但最初只能在终端中使用,对普通用户和技术恐惧者极不友好。尽管Anthropic内部数据显示大量非工程师(如销售团队、市场团队、设计师、产品经理)已开始使用Claude Code,但其学习曲线仍然陡峭。

市场背景:2026年1月,AI Agent(代理)概念已被炒热,但大多数产品并非真正的"代理"——它们只能对话,无法真正操作计算机。Boris指出,Agent的明确定义是"能够使用工具、与世界交互、而不仅仅是文本对话的AI"。

产品演进:Claude Code最初并非作为产品开发,而是内部实验。当团队发现人们用它做各种非编程任务时,才开始认真考虑产品化。Co-work正是这一思路的产物——让AI代理能力通过简单UI普惠所有人。

核心策略推导

第一步:重新定义"代理"概念

Boris在演示中强调,Co-work本质上是"你的数字队友"而非"更聪明的聊天机器人"。它可以:

  • 读取和生成文件
  • 控制浏览器执行操作
  • 使用任何支持MCP协议的工具
  • 在虚拟机环境中安全运行(防止误操作影响主系统)

第二步:安全机制的递进设计

Anthropic从AI Safety Lab起步,安全是其核心DNA。Boris详细解释了多层安全架构:

  1. 模型层对齐:通过Alignment(对齐)和Mechanistic Interpretability(机械可解释性)研究神经元层面确保模型行为安全
  2. 虚拟隔离:Co-work在独立虚拟机中运行,任何操作不影响主机系统
  3. 删除保护(上周新增):尝试删除文件前必须获得用户确认
  4. 权限控制:默认无任何权限,用户手动授权特定文件夹访问权
  5. 提示注入防护:针对互联网交互的特殊安全加固

第三步:演示"反向引导"机制

演示中,Boris让Co-work重命名收据文件。当AI不确定某个收据的日期时,它没有猜测,而是主动询问用户确认——这被称为"反向引导"(Reverse Elicitation),是Anthropic刻意训练模型的能力。

执行SOP/操作步骤

Co-work入门三步法

  1. 安装与配置

    • 从Co-work官网下载Mac OS桌面应用
    • 安装Chrome扩展(用于浏览器控制)
    • 首次启动时选择授权访问的文件夹(默认无法访问任何文件)
  2. 基础任务执行

    • 直接用自然语言描述任务(如"把这些收据重命名为日期格式")
    • AI分析任务、制定计划、请求确认
    • 执行并展示结果
  3. 进阶:浏览器控制

    • 授予Chrome扩展权限
    • 可以要求AI帮你操作Gmail、Google Sheets、Slack等
    • 支持"总是允许"、“仅一次”、“拒绝"三种权限模式

Claude Code专业用户工作流

Boris的日常使用流程(约10条核心习惯):

  1. 多任务并行:同时启动5-10个Claude实例,分别处理不同任务
  2. 多平台切换:Mac终端(主要)、iOS/Android移动App(随时查看进度)、Web版本(终端标签不够时overflow)
  3. 计划模式启动:任何PR任务先用Plan模式来回讨论,确认计划后再执行
  4. auto-accept-edits模式:计划确认后切换到此模式,Sonnet 4.5通常能一次完成
  5. CLAUDE.md持续维护:团队共享的纯文本知识库,任何人发现AI犯错立即写入
  6. GitHub集成:安装Claude GitHub App,在PR中@Claude让它修改代码
  7. 复合工程实践:Code Review时发现问题→直接让Claude更新CLAUDE.md→下次同类问题自动避免
  8. 验证即一切:构建应用时必须让Claude用Chrome扩展自己测试自己——“如果AI能验证自己的输出,结果会好得多”

细节支撑

演示案例1:收据整理任务

  • 场景:Boris有一个杂乱的收据文件夹
  • 操作:对Co-work说"把这些收据文件名改成收据上的日期”
  • 过程:AI发现4个收据→其中一个日期不确定→主动询问用户→用户确认后执行
  • 结果:文件按日期成功重命名

演示案例2:自动生成Google Sheets

  • 场景:将收据信息整理成表格
  • 操作:Co-work自动打开Chrome→访问Google Sheets→创建新表格→填入数据
  • 细节:AI展示了完整的浏览器控制能力,包括读取屏幕内容、点击、输入

演示案例3:Gmail发送

  • 场景:将表格发送给同事Amy
  • 操作:Co-work打开Gmail→自动搜索联系人Amy→填写主题和正文→点击发送
  • 验证:Boris设置了"总是允许"权限,演示了完整的邮件自动化流程

Boris的Twitter病毒帖核心内容(10条使用技巧)

  1. 并行任务策略:不要深度做一个任务,而是同时做一堆任务
  2. 多平台使用:终端+iOS+Web组合使用,同时运行5-10个实例
  3. Sonnet 4.5 with Thinking:最佳编程模型,比Sonnet更大但因更智能反而总token消耗更少、更便宜
  4. 团队CLAUDE.md:共享的纯文本知识库,纳入Git版本控制,全员维护
  5. GitHub集成:在PR中@Claude让它直接修改代码
  6. 计划模式启动:任何任务先Plan确认再执行
  7. 持续验证:让AI通过浏览器扩展自己测试自己的代码
  8. 移动端场景:早晨醒来躺床上用手机启动几个任务,白天查看进度
  9. 无固定格式:CLAUDE.md就是普通文本文件,无需特定格式
  10. 复合工程:Code Review发现的问题立即写入CLAUDE.md,实现自动化

核心执行资产 (Tactical Assets)

Prompt/指令集还原

Co-work基础任务指令模板

"请帮我[具体任务描述],完成后[验证方式]"
例如:
- "请把这些收据照片的文件名改成收据上的日期格式"
- "帮我打开Google Sheets,创建一个支出记录表格"
- "给Amy发一封邮件,包含这个月的支出汇总"

Claude Code计划模式指令

/plan
[描述你想要完成的任务]

# 等待AI制定计划,来回讨论修改

/auto-accept-edits
[确认计划完美后执行]

CLAUDE.md团队知识库示例结构

# 项目注意事项

## 代码风格
- 使用TypeScript strict模式
- 函数长度不超过50行

## 测试要求
- 所有API端点必须编写集成测试
- 提交前运行npm test

## 常见陷阱
- 不要使用var,必须用const/let
- 异步函数必须try-catch
- 日期处理使用date-fns而非原生Date

GitHub Code Review自动化指令

@claude 
请检查这个PR的代码风格是否符合CLAUDE.md中的规范,
如果不符合,请直接修改。

工具链配置

Co-work必备组件

  1. Co-work桌面应用:Mac OS专用
  2. Chrome扩展:用于浏览器自动化
  3. MCP服务器(可选):连接第三方工具

Claude Code多平台入口

平台 适用场景 访问方式
Mac终端 深度编码工作 本地安装
iOS/Android App 移动中查看和管理任务 应用商店下载
Web版本 终端标签溢出时 claude.ai
IDE插件 VS Code/IntelliJ IDE扩展市场
Slack集成 团队协作 Slack App目录
GitHub集成 Code Review自动化 GitHub App

性能优化三要素(Boris亲测)

  1. 始终使用Sonnet 4.5 with Thinking:“它是最棒的编程模型,虽然更大更慢,但因为足够聪明,不需要过度引导,最终反而比小模型更快更便宜”
  2. 投资CLAUDE.md:“这是最重要的,没有之一”
  3. 给AI验证能力:“让它用Chrome扩展自己测试自己”

专家洞察与风险边界 (Insights & Boundaries)

反直觉/非共识结论

1. “更大的模型反而更便宜”

Boris指出一个反直觉事实:Sonnet 4.5虽然per-token价格更高,但因更智能、需要的引导token更少,总成本往往低于使用Sonnet等小模型。“这很反直觉,但用最聪明的就对了。”

2. “AI不会取代工程师,而是改变工程师角色”

“我现在的工作就是在标签页之间跳来跳去,照看我的Claude们,确保它们没有被卡住,回答它们的问题。这就像一个全新工种——AI运维工程师。”

3. “非工程师比工程师更早大规模采用AI代理”

Anthropic内部数据显示,销售团队、市场团队、设计师、产品经理使用Claude Code的比例异常高。“我们最初以为工程师会先用,但实际上非技术人员的采用速度更惊人。”

4. “计划是最被低估的功能”

“几乎所有session都应该从Plan模式开始。一个好的计划几乎能保证一次成功。这是我最想推广的理念。”

5. “2026年初的AI代理阶段类似2007年的iPhone”

“就像App Store最初只有喝啤酒应用,没人能预测到Uber和TikTok的出现。现在AI代理的使用方式,我们99%还没想到。”

局限性与避坑指南

当前局限

  1. 速度问题:Boris坦承当前操作速度比人工慢,“如果你想快自己做”。但他认为速度会随模型进化飞速提升。

  2. 格式化错误:演示中Google Sheets的数据粘贴有小错误,AI自己发现并尝试修复。“这还是早期产品,不是所有事都完美。”

  3. Mac only:Co-work目前仅支持Mac OS,Windows版本"即将推出"。

  4. 安全限制:严格的安全机制有时会导致某些操作需要反复确认。

避坑指南

  1. 不要一上来就定制:Co-work开箱即用效果已经很好,先用再根据需求调整。

  2. 不要跳过计划阶段:直接让AI执行往往导致反复修改,Plan模式虽然看似慢实际更快。

  3. CLAUDE.md不是一次性任务:它是活的知识库,需要持续维护——每次AI犯错都是更新它的机会。

  4. 别让AI蒙眼工作:如果AI无法验证自己的输出(无法运行代码、看不到网站),结果质量会大打折扣。

  5. 小心提示注入:互联网交互存在提示注入风险,Anthropic已内置防护但并非绝对。


金句 (Golden Quotes)

  1. “Co-work本质上就是你的数字队友,你可以让它做任何事,就像指挥一个同事一样。”

  2. “AI代理的定义就是能使用工具、与世界交互,而不仅仅是文本对话。”

  3. “我最近两个月100%的代码都是Claude Code写的,我一个字都没手动写。”

  4. “计划一旦确认,代码几乎总能一次完成。一个好的计划比什么都重要。”

  5. “用Sonnet 4.5吧,虽然更大更慢,但它足够聪明,不需要你过度引导,最终反而更快更便宜。”

  6. “CLAUDE.md是核心——没有之一。每次AI犯错就写进去,这是团队最宝贵的知识资产。”

  7. “如果你让AI无法验证自己的输出,就像让画家蒙着眼画画,结果不可能好。”

  8. “我们正处于AI代理的iPhone时代——现在能想到的用法连1%都不到。”

  9. “我同时运行5-10个Claude实例,我的工作就是在它们之间跳来跳去,确保它们没卡住。”

  10. “永远不要重复解释同一件事——发现AI犯错就写进CLAUDE.md,下次它自动避免。”


📺 视频原片


视频ID: DW4a1Cm8nG4