原始标题: How to 10x your productivity as a PM with AI tools

发布日期: 2026-02-04 | 来源频道: @growproduct

📝 深度摘要

这场对话来自专注于产品成长的频道@growproduct，邀请了具有AI工具实践经验的资深产品经理作为嘉宾。视频聚焦于一个核心元问题：产品经理如何在日常工作中利用AI工具实现生产力的量级提升。内容涵盖提示词工程、高上下文LLM应用、自动化Agent搭建、编程式Agent实操以及AI原型工具等多个维度，并提供具体可落地的行动清单，帮助产品经理在AI时代构建差异化竞争优势。

AI 实战技术复盘笔记：产品经理的 10 倍生产力提升之道

2. 核心干货概览

类别	名称	核心用途 / 战略意义
提示词框架	RTF 框架 (Role-Task-Format)	结构化提示词，确保 AI 输出符合预期格式
提示词工具	Custom Instructions (自定义指令)	预设 AI 角色定位和行为模式，获取更真实的反馈
高上下文 LLM	Claude Projects / ChatGPT Projects	注入绩效评审、会议记录、产品策略，构建「最懂你」的 AI 助手
桌面上下文助手	Cluey	实时追踪会议内容，解答关于桌面文档的问题
独享上下文 LLM	NotebookLM	客户访谈合成，避免大模型幻觉，99% 降低虚构低代码 Agent内容
构建器	Lindy / Relay.app / Make.com	构建自动化工作流，如邮件分类回复、竞品监控
编程式 Agent	Claude Code / Cursor	AI 原型开发、代码生成、技术文档编写
AI 原型工具	Lovable / Magic Patterns / Bolt	快速生成可交互原型，验证产品想法
客户洞察工具	Dovetail / Unwrap / Interpret	整合全渠道用户反馈，量化功能需求 revenue impact
氛围实验工具	Chameleon / Amplitude	无代码配置 A/B 测试，PM 独立启动实验

关键指标

提示词库迭代版本：部分提示词已迭代至 v11、v12
客户访谈洞察提升：10-20% 更深度发现
竞品监控自动化：仅在重大变化时触发通知（如价格调整）
实验覆盖：从 5% ideation 阶段扩展至 100% 全流程

2. 深度逻辑拆解

核心挑战

产品经理面临的核心困境是：如何从繁琐的重复性工作中解脱，将有限时间聚焦于真正创造价值的任务。传统 PM 工作流充满低效环节——手动撰写 PRD、逐条回复邮件、频繁切换上下文准备高风险会议、依赖工程师进行小实验验证。AI 技术的成熟使得这些问题有了系统性解决方案。

步进 SOP

Step 1: 提示词工程基础建设

具体动作：

启用 ChatGPT/Claude 的「自定义指令」功能
预设核心原则：「目标是实现模型过时（即用户不再需要你的帮助就能完成任务）」
建立个人提示词库，记录常用的 80-100 个提示词模板
每次获得不佳回复后，反向优化提示词并更新版本
使用语音输入工具（如 Super Whisper）以 2 倍速度构建复杂提示词

Step 2: 构建三层 AI 协作体系

高上下文 LLM（Claude Projects）：

注入个人绩效评审文档
导入关键会议纪要（与老板的 1:1、与设计师/工程经理的协作会议）
录入口述思考（当前季度的担忧、期待的功能、即将发布的内容）
接入产品愿景、战略、路线图文档
典型项目示例：LinkedIn 写手、播客准备、产品 scrapbook（产品灵感库）

桌面上下文助手（Cluey）：

实时追踪会议内容，记忆所有讨论要点
截屏会议 PPT 并提问：「这页图表是什么意思？」
撰写邮件时主动建议：「根据当前会议内容，这封邮件还应补充什么？」

独享上下文 LLM（NotebookLM）：

导入所有 PRD、历史功能复盘、客户访谈 transcript
下达指令：「识别我们声称的战略、实际构建的功能与用户真实需求之间的差距。诚实指出我们在自欺欺人的地方。」

Step 3: Agent 自动化工作流

典型案例：邮件自动分类回复系统

使用 Gemini Flash（低成本模型）进行邮件分类：折扣请求、赞助咨询、播客嘉宾邀请、订阅用户问候
根据分类触发不同的系统提示词和 RAG 数据库
例如赞助类：调取历史合作记录、费率卡，生成个性化回复
每次回复后评估质量，不佳则反向优化系统提示词

竞品监控 Agent：

设定监控阈值：「仅当竞品发生重大变化时通知我（如定价调整、主要功能上线）」
自动抓取公开信息
符合条件的重大变化才发送邮件，避免信息过载

案例细节

案例一：高上下文 LLM 生成周报

场景：为 ChatGPT 5.5 发布撰写每周状态更新，发送给 CPO Sam Altman
痛点：常规 LLM 生成的周报「一切正常，进展顺利」，领导真正想看的是「风险点在哪里」
解决方案：高上下文项目注入了：(1) 绩效评审——领导曾批评「你总是掩盖重点」；(2) 与 Sam 的会议记录——Sam 说「我不关心功能完整性，我只关心模型是否感觉『神奇』，必要时可以砍范围」；(3) 口述思考——「担心推理功能半成品，领导很兴奋」；(4) 路线图——18 天后 TechCrunch Disrupt 发布，必须上线，需提升 10 点 NPS
结果：高上下文 LLM 生成版本直接以「Status: YELLOW」开头，引用了「magical leap」原话，并主动建议决策而非仅「建议开会讨论」

案例二：Thread Up 搜索栏文案实验

背景：二手服装平台，拥有超过 10 万个品牌
原文案：「你想买什么？」（What do you want to buy?）
新文案：「你最喜欢的服装品牌是什么？」（What are your favorite clothing brands?）
效果：新用户输入「Lululemon」后，看到平台提供 18 美元的 Lululemon 瑜伽裤（原价 120 美元），大幅提升转化
意义：此实验由 PM 通过氛围实验平台独立完成，零工程师、零设计师资源，3 年内最成功的功能

3. 核心干货运用

提示词模板还原

自定义指令模板（ChatGPT/Claude）

你是一位资深产品副总裁。你的沟通风格直接、务实，不绕弯子。
核心原则：
- 目标是实现模型过时（让用户最终不需要你的帮助）
- 给出具体建议，不要只问问题
- 如果数据不足，明确指出需要什么
- 使用「结论先行」结构，重要信息放第一句

PRD 评审提示词（RTF 框架应用）

Role: 我的 VP of Product
Task: 评审这份 PRD，指出逻辑漏洞、缺失的用户场景、技术风险
Format: 
1. 核心问题（3 条最严重）
2. 改进建议
3. 优先级排序
[附上 PRD 内容]

客户访谈指南优化提示词

Review my interview guide and identify all common PM mistakes:
- Leading questions
- The Mom Test violations (ask about past behavior, not hypotheticals)
- Future-tense bias
- Lack of open-endedness
- Missing chronological story extraction
For each problem: quote the question, explain what's wrong, provide rewritten alternative.

逻辑注释

为什么自定义指令必须强调「模型过时」？ 因为默认模式下，AI 倾向于给出「让你感觉良好」的回答以维持对话。设定此目标后，AI 会更具批判性，提供真正有价值的反馈而非敷衍。

为什么 NotebookLM 适合访谈合成？ 标准 LLM（ChatGPT/Claude）在合成过程中容易产生幻觉——将未说的话归功于受访者。NotebookLM 作为独享上下文 LLM，仅基于输入内容生成回答，幻觉率降低 99%。

为什么用低成本模型做分类？ 邮件分类是简单的判断任务，无需 GPT-4 能力。使用 Gemini Flash 等低成本模型可大幅降低运营成本，同时保持 95% 准确率。

4. PM 避坑与实战洞察

反直觉结论

AI 写的提示词比人类更好
- 研究显示 AI 生成的提示词效果优于人类手写版本
- 实操：将手写提示词丢给 AI，让其优化
提示词框架不需要背下来
- 技巧：直接告诉 AI「帮我写一个执行 X 任务的完美提示词」
PM 不需要学代码就能做实验
- 氛围实验（Vibe Experimentation）让 PM 可在无工程师情况下启动 A/B 测试
- 工具：Chameleon、Amplitude 支持自然语言配置实验
AI 原型可以比工程师做得更快
- Magic Patterns 生成前端原型速度是 Lovable 的 10 倍
- 原因：不构建后端，仅生成可交互前端用于验证
Anthropic 的 PM 不写 PRD
- 做法：PM 用 Claude Code 直接构建功能初版
- 全员内部测试数周后才启动正式实验

适用边界

高上下文 LLM：仅在需要个性化、记忆特定背景时使用；简单查询无需浪费 token
AI Agent 自动化：仅适用于重复性、高频、规则明确的工作流；一次性任务手动处理更快
氛围实验：仅适用于前端 UI 层面修改；涉及后端架构变化的实验仍需工程师
AI 原型：仅用于验证想法；最终上线产品仍需工程重构

实战陷阱

不要用 ChatGPT Agent 做简单任务
- Agent 模式耗时远超手动：1-2 分钟手动可完成的任务，Agent 可能需 10 分钟
不要跳过原型迭代
- 首版通常只达 50% 完整度
- 建议投入 30 分钟迭代循环而非 5 分钟快速生成
不要在未提供视觉上下文的情况下生成原型
- 必须提供 Figma 设计截图、产品截图或手绘草图
- 缺少视觉上下文会导致 AI 假设离谱的 UI 布局
不要在合成访谈时使用标准 LLM
- 幻觉问题严重，必须使用 NotebookLM 等独享上下文工具
不要期望 AI Eval 达到 100% 准确率
- 80-90% 即为优秀
- 需持续监控 eval 指标波动，如从 80% 骤降至 20% 需立即排查

5. 金句

「设定目标是实现模型过时（model obsolescence via user self-sufficiency），这样 AI 才会给你真正诚实的反馈，而不是一直迎合你。」
「不要问 AI『你觉得这个产品怎么样』，要问『帮我写一个完美的提示词来完成这个任务』——研究显示 AI 写提示词比人类写得更好。」
「用语音输入写提示词吧，我们说话的速度是打字的两倍。Super Whisper 会在你说话后自动格式化，添加 bullet points 和编号。」
「Claude Projects 就是你的『肚里蛔虫』——它知道你上次跟老板说了什么、领导最近关心什么、公司的战略方向，生成的回复精准无比。」
「别再用标准 LLM 合成客户访谈了，NotebookLM 能消除 99% 的幻觉——它只基于你输入的内容回答，不会编造受访者没说过的话。」
「花 2000 美元雇一个执行助理？不如花 50 美元订阅 Lindy，它能完成 80% 的工作，而且 24/7 不休息。」
「Anthropic 的 PM 不写 PRD，他们直接用 Claude Code 把功能写出来，全员内测几个月后才 launch 实验。」
「我在 Thread Up 最成功的功能改动——改了一句搜索栏的占位文案——零工程师、零设计师资源，3 年内最具影响力的增长实验。」
「AI 产品管理（APM）现在占 LinkedIn 上 20% 的 PM 职位空缺。传统公司在裁员，但 AI 公司在疯狂招人。」
「不要问用户『你会想要这个功能吗？』——这是最蠢的问题。要问『上次遇到这个问题时，你是怎么解决的？』过去行为比未来承诺可信 100 倍。」

6. 行动清单（立即可执行）

今天：打开 ChatGPT/Claude 自定义指令，粘贴「目标是实现模型过时」原则
本周：创建第一个 Claude Project，导入最近的绩效评审和 3 次关键会议记录
本月：用 Lovable 或 Magic Patterns 生成一个产品想法的交互原型
本季度：搭建一个邮件自动分类回复 Agent（使用 Lindy 或 Make.com）
每年：完成 Tailwind 迁移和微服务架构重构，让代码库对 AI 友好——这是 Anthropic 正在做的事

📺 视频原片

视频ID: YKYQ-z6A9Fs

📝 深度摘要#

AI 实战技术复盘笔记：产品经理的 10 倍生产力提升之道#

2. 核心干货概览#

2. 深度逻辑拆解#

核心挑战#

步进 SOP#

Step 1: 提示词工程基础建设#

Step 2: 构建三层 AI 协作体系#

Step 3: Agent 自动化工作流#

案例细节#

3. 核心干货运用#

提示词模板还原#

逻辑注释#

4. PM 避坑与实战洞察#

反直觉结论#

适用边界#

实战陷阱#

5. 金句#

6. 行动清单（立即可执行）#

📺 视频原片#