原始标题: How To Train Your AI Agent’s Skills (Claude Code / OpenClaw)

发布日期: 2026-02-01 | 来源频道: @AllAboutAI

📝 深度摘要

1. 讨论背景与核心主题

本视频的主理人是一位专注于 AI 智能体开发的工程师,他展示了一套系统性的方法来训练 Claude Code/OpenClaw 智能体掌握新技能。核心元问题是:如何让 AI 智能体通过"迭代式训练"的方式,将探索出的工作流固化下来,从而在后续任务中实现"首次尝试即成功"的高效执行。主理人使用一台专用的 Mac Mini 运行智能体,所有技能以 Markdown 文件形式存储在本地,供智能体随时调用。

2. 核心干货概览 (Agentic Stack & Assets)

类别 名称 核心用途 / 技术意义
核心 AI 代理 Claude Code / OpenClaw 承担任务执行者角色,通过自然语言指令驱动浏览器、文件系统和其他工具
自动化/触发工具 浏览器 CDP (Chrome DevTools Protocol) 通过 JavaScript 注入实现对 LinkedIn 等 Web 应用的精准操控
集成技能/MCP skills.sh / browserjs 将可复用的工作流封装为 Markdown 文件,供智能体在后续任务中直接调用
运行环境 Mac Mini (专用主机) 确保智能体可以持续运行,登录状态持久化,无需每次重新认证

3. 智能体架构与 SOP

环境搭建与初始化

智能体运行在专用 Mac Mini 上,通过 Cursor 编辑器作为前端交互界面。技能文件存储在 ~/.nvm/versions/node/v24.13.1/lib/node_modules/openclaw/skills/ 目录下,每个技能对应一个 skill.md 文件。主理人展示了已有的技能库,包括 X (Twitter)、Gmail、YouTube、视频编辑等多个领域的技能文件。

自主运行逻辑链

整个训练流程遵循以下闭环逻辑:

  1. 创建空技能文件:使用 claude.skills.create /skills/LinkedIn skill.md 命令创建空的技能文件
  2. 任务执行与探索:向智能体下达具体任务(如"在 LinkedIn 上创建帖子"),智能体自主尝试各种方法
  3. 浏览器操控:智能体调用 Chrome CDP,通过 JavaScript 注入的方式与页面元素交互
  4. 工作流固化:任务成功后,指示智能体将成功的工作流写入 skill.md 文件
  5. 技能复用:下次执行相同任务时,智能体直接加载已保存的技能,实现"首次尝试即成功"

实战案例还原

案例一:LinkedIn 发帖

  • 初始状态:智能体对 LinkedIn 发帖流程一无所知
  • 探索过程:智能体尝试使用 document.querySelector 查找元素,发现 LinkedIn 编辑器使用非标准属性,历经约 6 分钟探索
  • 解决方案:智能体编写自定义 JavaScript 文件,通过 CDP 注入文本到帖子编辑器
  • 结果:成功创建帖子草稿
  • 技能保存:将该工作流写入 LinkedIn.skill.md

案例二:技能复用验证

  • 指令:go to linkedin.com and compose a draft post on LinkedIn about AI agents learning to your skills
  • 加载技能:智能体成功加载 LinkedIn.skill
  • 执行时间:约 40 秒(相比首次的 6 分钟,效率提升约 9 倍)

案例三:搜索并连接 Anthropic 员工

  • 指令:find five employees from Anthropic that we maybe connect to later
  • 执行:智能体使用搜索功能定位 Anthropic 公司员工,返回人员列表(包含 Tyler Quinn 等)
  • 技能扩展:将"查找联系人"工作流添加到 skill.md

案例四:发送 LinkedIn 私信

  • 指令:check who you are following if any, send them a message hello how are you
  • 执行:智能体打开消息界面,识别发送按钮,注入文本并发送
  • 验证:再次发送感谢消息,验证技能已固化

细节支撑

  • 元素定位挑战:LinkedIn 使用非标准 HTML 属性,标准 querySelector 无法直接定位,智能体通过多次尝试 JavaScript 注入方案解决
  • 状态保持:专用主机方案确保浏览器登录状态持久化,避免重复认证
  • 迭代式改进:每次成功操作后立即更新 skill.md,形成持续迭代的技能库

4. 核心执行资产 (CLI Commands & Prompts)

指令集还原

# 创建新技能文件
claude.skills.create /skills/LinkedIn skill.md

# 触发智能体执行任务
# 通过自然语言指令,如:
# "go to linkedin.com and compose a draft post"
# "find five employees from Anthropic"
# "send them a message hello how are you"

# 技能更新指令
# "Now update this LinkedIn skill.md file with the workflow that led to us creating a post with success"

系统提示词策略

主理人采用"渐进式披露"策略:

  • 初始状态:仅提供目标指令,不提供具体步骤
  • 探索阶段:智能体自主尝试,调用浏览器工具和 CDP
  • 固化阶段:明确指示"将成功的工作流写入 skill.md"
  • 复用阶段:智能体自动加载已保存技能,直接执行

这种策略的核心思想是:让智能体先自己探索最优解,再将答案固化,避免每次都重新探索

5. 开发者进阶洞察

Vibe Coding 核心心法

主理人将这种方法称为"训练智能体"(Training单纯 Agents),而非编程。其核心心法是:

  • 写指令而非写代码:通过自然语言描述任务,让智能体自行探索解决方案
  • 迭代式学习:不期望一次性给出完美方案,而是通过"尝试→失败→调整→成功→固化"的循环逐步完善
  • 技能资产化:将成功的工作流沉淀为可复用技能,实现"一次探索,无限复用"

自主性风险预警

  • 死循环风险:智能体在探索阶段可能反复尝试相同失败方案,需设置超时或干预机制
  • Token 消耗:首次探索消耗大量 Token(6 分钟探索 vs 40 秒执行),高频任务需注意成本控制
  • UI 变更风险:目标网站 UI 变化可能导致已保存的技能失效,需要定期维护
  • 账号风险:自动化操作可能触发平台风控(如 LinkedIn 限制频繁操作)

实战陷阱

  • 非标准属性:LinkedIn 等 SPA 应用使用非标准 HTML 属性,标准 DOM API 可能失效
  • 登录状态管理:需确保专用设备登录状态持久化,否则每次都需要重新认证
  • 技能粒度:技能文件应保持适度粒度,过细导致碎片化,过粗导致复用性下降

6. 金句

  • “我们保存的不是每一次的尝试,而是那个最终成功的工作流——下次执行时,智能体只需照搬答案,而非重新考试。”
  • “这就是为什么我称之为’训练智能体’——尽管它最终能自己摸索出来,但把精确的工作流写进 skill.md 文件,能省下的不仅是时间,还有白花花的 Token。”
  • “当我告诉智能体’去研究视频、制作视频、发布到 YouTube、顺便去 X 发个帖子’,它一次性全做了——这就是自主性的终极形态。”

📺 视频原片


视频ID: KkJZY5Klymw