原始标题: How To Train Your AI Agent’s Skills (Claude Code / OpenClaw)
发布日期: 2026-02-01 | 来源频道: @AllAboutAI
📝 深度摘要
1. 讨论背景与核心主题
本视频的主理人是一位专注于 AI 智能体开发的工程师,他展示了一套系统性的方法来训练 Claude Code/OpenClaw 智能体掌握新技能。核心元问题是:如何让 AI 智能体通过"迭代式训练"的方式,将探索出的工作流固化下来,从而在后续任务中实现"首次尝试即成功"的高效执行。主理人使用一台专用的 Mac Mini 运行智能体,所有技能以 Markdown 文件形式存储在本地,供智能体随时调用。
2. 核心干货概览 (Agentic Stack & Assets)
| 类别 | 名称 | 核心用途 / 技术意义 |
|---|---|---|
| 核心 AI 代理 | Claude Code / OpenClaw | 承担任务执行者角色,通过自然语言指令驱动浏览器、文件系统和其他工具 |
| 自动化/触发工具 | 浏览器 CDP (Chrome DevTools Protocol) | 通过 JavaScript 注入实现对 LinkedIn 等 Web 应用的精准操控 |
| 集成技能/MCP | skills.sh / browserjs | 将可复用的工作流封装为 Markdown 文件,供智能体在后续任务中直接调用 |
| 运行环境 | Mac Mini (专用主机) | 确保智能体可以持续运行,登录状态持久化,无需每次重新认证 |
3. 智能体架构与 SOP
环境搭建与初始化
智能体运行在专用 Mac Mini 上,通过 Cursor 编辑器作为前端交互界面。技能文件存储在 ~/.nvm/versions/node/v24.13.1/lib/node_modules/openclaw/skills/ 目录下,每个技能对应一个 skill.md 文件。主理人展示了已有的技能库,包括 X (Twitter)、Gmail、YouTube、视频编辑等多个领域的技能文件。
自主运行逻辑链
整个训练流程遵循以下闭环逻辑:
- 创建空技能文件:使用
claude.skills.create /skills/LinkedIn skill.md命令创建空的技能文件 - 任务执行与探索:向智能体下达具体任务(如"在 LinkedIn 上创建帖子"),智能体自主尝试各种方法
- 浏览器操控:智能体调用 Chrome CDP,通过 JavaScript 注入的方式与页面元素交互
- 工作流固化:任务成功后,指示智能体将成功的工作流写入 skill.md 文件
- 技能复用:下次执行相同任务时,智能体直接加载已保存的技能,实现"首次尝试即成功"
实战案例还原
案例一:LinkedIn 发帖
- 初始状态:智能体对 LinkedIn 发帖流程一无所知
- 探索过程:智能体尝试使用
document.querySelector查找元素,发现 LinkedIn 编辑器使用非标准属性,历经约 6 分钟探索 - 解决方案:智能体编写自定义 JavaScript 文件,通过 CDP 注入文本到帖子编辑器
- 结果:成功创建帖子草稿
- 技能保存:将该工作流写入
LinkedIn.skill.md
案例二:技能复用验证
- 指令:
go to linkedin.com and compose a draft post on LinkedIn about AI agents learning to your skills - 加载技能:智能体成功加载
LinkedIn.skill - 执行时间:约 40 秒(相比首次的 6 分钟,效率提升约 9 倍)
案例三:搜索并连接 Anthropic 员工
- 指令:
find five employees from Anthropic that we maybe connect to later - 执行:智能体使用搜索功能定位 Anthropic 公司员工,返回人员列表(包含 Tyler Quinn 等)
- 技能扩展:将"查找联系人"工作流添加到 skill.md
案例四:发送 LinkedIn 私信
- 指令:
check who you are following if any, send them a message hello how are you - 执行:智能体打开消息界面,识别发送按钮,注入文本并发送
- 验证:再次发送感谢消息,验证技能已固化
细节支撑
- 元素定位挑战:LinkedIn 使用非标准 HTML 属性,标准
querySelector无法直接定位,智能体通过多次尝试 JavaScript 注入方案解决 - 状态保持:专用主机方案确保浏览器登录状态持久化,避免重复认证
- 迭代式改进:每次成功操作后立即更新 skill.md,形成持续迭代的技能库
4. 核心执行资产 (CLI Commands & Prompts)
指令集还原
# 创建新技能文件
claude.skills.create /skills/LinkedIn skill.md
# 触发智能体执行任务
# 通过自然语言指令,如:
# "go to linkedin.com and compose a draft post"
# "find five employees from Anthropic"
# "send them a message hello how are you"
# 技能更新指令
# "Now update this LinkedIn skill.md file with the workflow that led to us creating a post with success"
系统提示词策略
主理人采用"渐进式披露"策略:
- 初始状态:仅提供目标指令,不提供具体步骤
- 探索阶段:智能体自主尝试,调用浏览器工具和 CDP
- 固化阶段:明确指示"将成功的工作流写入 skill.md"
- 复用阶段:智能体自动加载已保存技能,直接执行
这种策略的核心思想是:让智能体先自己探索最优解,再将答案固化,避免每次都重新探索。
5. 开发者进阶洞察
Vibe Coding 核心心法
主理人将这种方法称为"训练智能体"(Training单纯 Agents),而非编程。其核心心法是:
- 写指令而非写代码:通过自然语言描述任务,让智能体自行探索解决方案
- 迭代式学习:不期望一次性给出完美方案,而是通过"尝试→失败→调整→成功→固化"的循环逐步完善
- 技能资产化:将成功的工作流沉淀为可复用技能,实现"一次探索,无限复用"
自主性风险预警
- 死循环风险:智能体在探索阶段可能反复尝试相同失败方案,需设置超时或干预机制
- Token 消耗:首次探索消耗大量 Token(6 分钟探索 vs 40 秒执行),高频任务需注意成本控制
- UI 变更风险:目标网站 UI 变化可能导致已保存的技能失效,需要定期维护
- 账号风险:自动化操作可能触发平台风控(如 LinkedIn 限制频繁操作)
实战陷阱
- 非标准属性:LinkedIn 等 SPA 应用使用非标准 HTML 属性,标准 DOM API 可能失效
- 登录状态管理:需确保专用设备登录状态持久化,否则每次都需要重新认证
- 技能粒度:技能文件应保持适度粒度,过细导致碎片化,过粗导致复用性下降
6. 金句
- “我们保存的不是每一次的尝试,而是那个最终成功的工作流——下次执行时,智能体只需照搬答案,而非重新考试。”
- “这就是为什么我称之为’训练智能体’——尽管它最终能自己摸索出来,但把精确的工作流写进 skill.md 文件,能省下的不仅是时间,还有白花花的 Token。”
- “当我告诉智能体’去研究视频、制作视频、发布到 YouTube、顺便去 X 发个帖子’,它一次性全做了——这就是自主性的终极形态。”
📺 视频原片
视频ID: KkJZY5Klymw