如何训练你的AI智能体掌握新技能（Claude Code / OpenClaw）

原始标题: How To Train Your AI Agent’s Skills (Claude Code / OpenClaw)

发布日期: 2026-02-01 | 来源频道: @AllAboutAI

📝 深度摘要

1. 讨论背景与核心主题

本视频的主理人是一位专注于 AI 智能体开发的工程师，他展示了一套系统性的方法来训练 Claude Code/OpenClaw 智能体掌握新技能。核心元问题是：如何让 AI 智能体通过"迭代式训练"的方式，将探索出的工作流固化下来，从而在后续任务中实现"首次尝试即成功"的高效执行。主理人使用一台专用的 Mac Mini 运行智能体，所有技能以 Markdown 文件形式存储在本地，供智能体随时调用。

2. 核心干货概览 (Agentic Stack & Assets)

类别	名称	核心用途 / 技术意义
核心 AI 代理	Claude Code / OpenClaw	承担任务执行者角色，通过自然语言指令驱动浏览器、文件系统和其他工具
自动化/触发工具	浏览器 CDP (Chrome DevTools Protocol)	通过 JavaScript 注入实现对 LinkedIn 等 Web 应用的精准操控
集成技能/MCP	skills.sh / browserjs	将可复用的工作流封装为 Markdown 文件，供智能体在后续任务中直接调用
运行环境	Mac Mini (专用主机)	确保智能体可以持续运行，登录状态持久化，无需每次重新认证

3. 智能体架构与 SOP

环境搭建与初始化

智能体运行在专用 Mac Mini 上，通过 Cursor 编辑器作为前端交互界面。技能文件存储在 ~/.nvm/versions/node/v24.13.1/lib/node_modules/openclaw/skills/ 目录下，每个技能对应一个 skill.md 文件。主理人展示了已有的技能库，包括 X (Twitter)、Gmail、YouTube、视频编辑等多个领域的技能文件。

自主运行逻辑链

整个训练流程遵循以下闭环逻辑：

创建空技能文件：使用 claude.skills.create /skills/LinkedIn skill.md 命令创建空的技能文件
任务执行与探索：向智能体下达具体任务（如"在 LinkedIn 上创建帖子"），智能体自主尝试各种方法
浏览器操控：智能体调用 Chrome CDP，通过 JavaScript 注入的方式与页面元素交互
工作流固化：任务成功后，指示智能体将成功的工作流写入 skill.md 文件
技能复用：下次执行相同任务时，智能体直接加载已保存的技能，实现"首次尝试即成功"

实战案例还原

案例一：LinkedIn 发帖

初始状态：智能体对 LinkedIn 发帖流程一无所知
探索过程：智能体尝试使用 document.querySelector 查找元素，发现 LinkedIn 编辑器使用非标准属性，历经约 6 分钟探索
解决方案：智能体编写自定义 JavaScript 文件，通过 CDP 注入文本到帖子编辑器
结果：成功创建帖子草稿
技能保存：将该工作流写入 LinkedIn.skill.md

案例二：技能复用验证

指令：go to linkedin.com and compose a draft post on LinkedIn about AI agents learning to your skills
加载技能：智能体成功加载 LinkedIn.skill
执行时间：约 40 秒（相比首次的 6 分钟，效率提升约 9 倍）

案例三：搜索并连接 Anthropic 员工

指令：find five employees from Anthropic that we maybe connect to later
执行：智能体使用搜索功能定位 Anthropic 公司员工，返回人员列表（包含 Tyler Quinn 等）
技能扩展：将"查找联系人"工作流添加到 skill.md

案例四：发送 LinkedIn 私信

指令：check who you are following if any, send them a message hello how are you
执行：智能体打开消息界面，识别发送按钮，注入文本并发送
验证：再次发送感谢消息，验证技能已固化

细节支撑

元素定位挑战：LinkedIn 使用非标准 HTML 属性，标准 querySelector 无法直接定位，智能体通过多次尝试 JavaScript 注入方案解决
状态保持：专用主机方案确保浏览器登录状态持久化，避免重复认证
迭代式改进：每次成功操作后立即更新 skill.md，形成持续迭代的技能库

4. 核心执行资产 (CLI Commands & Prompts)

指令集还原

# 创建新技能文件
claude.skills.create /skills/LinkedIn skill.md

# 触发智能体执行任务
# 通过自然语言指令，如：
# "go to linkedin.com and compose a draft post"
# "find five employees from Anthropic"
# "send them a message hello how are you"

# 技能更新指令
# "Now update this LinkedIn skill.md file with the workflow that led to us creating a post with success"

系统提示词策略

主理人采用"渐进式披露"策略：

初始状态：仅提供目标指令，不提供具体步骤
探索阶段：智能体自主尝试，调用浏览器工具和 CDP
固化阶段：明确指示"将成功的工作流写入 skill.md"
复用阶段：智能体自动加载已保存技能，直接执行

这种策略的核心思想是：让智能体先自己探索最优解，再将答案固化，避免每次都重新探索。

5. 开发者进阶洞察

Vibe Coding 核心心法

主理人将这种方法称为"训练智能体"（Training单纯 Agents），而非编程。其核心心法是：

写指令而非写代码：通过自然语言描述任务，让智能体自行探索解决方案
迭代式学习：不期望一次性给出完美方案，而是通过"尝试→失败→调整→成功→固化"的循环逐步完善
技能资产化：将成功的工作流沉淀为可复用技能，实现"一次探索，无限复用"

自主性风险预警

死循环风险：智能体在探索阶段可能反复尝试相同失败方案，需设置超时或干预机制
Token 消耗：首次探索消耗大量 Token（6 分钟探索 vs 40 秒执行），高频任务需注意成本控制
UI 变更风险：目标网站 UI 变化可能导致已保存的技能失效，需要定期维护
账号风险：自动化操作可能触发平台风控（如 LinkedIn 限制频繁操作）

实战陷阱

非标准属性：LinkedIn 等 SPA 应用使用非标准 HTML 属性，标准 DOM API 可能失效
登录状态管理：需确保专用设备登录状态持久化，否则每次都需要重新认证
技能粒度：技能文件应保持适度粒度，过细导致碎片化，过粗导致复用性下降

6. 金句

“我们保存的不是每一次的尝试，而是那个最终成功的工作流——下次执行时，智能体只需照搬答案，而非重新考试。”
“这就是为什么我称之为’训练智能体’——尽管它最终能自己摸索出来，但把精确的工作流写进 skill.md 文件，能省下的不仅是时间，还有白花花的 Token。”
“当我告诉智能体’去研究视频、制作视频、发布到 YouTube、顺便去 X 发个帖子’，它一次性全做了——这就是自主性的终极形态。”

📺 视频原片

视频ID: KkJZY5Klymw

📝 深度摘要#

1. 讨论背景与核心主题#

2. 核心干货概览 (Agentic Stack & Assets)#

3. 智能体架构与 SOP#

环境搭建与初始化#

自主运行逻辑链#

实战案例还原#

细节支撑#

4. 核心执行资产 (CLI Commands & Prompts)#

指令集还原#

系统提示词策略#

5. 开发者进阶洞察#

Vibe Coding 核心心法#

自主性风险预警#

实战陷阱#

6. 金句#

📺 视频原片#