原始标题: How to 10x your productivity as a PM with AI tools

发布日期: 2026-02-04 | 来源频道: @growproduct

📝 深度摘要

这场对话来自专注于产品成长的频道@growproduct,邀请了具有AI工具实践经验的资深产品经理作为嘉宾。视频聚焦于一个核心元问题:产品经理如何在日常工作中利用AI工具实现生产力的量级提升。内容涵盖提示词工程、高上下文LLM应用、自动化Agent搭建、编程式Agent实操以及AI原型工具等多个维度,并提供具体可落地的行动清单,帮助产品经理在AI时代构建差异化竞争优势。

AI 实战技术复盘笔记:产品经理的 10 倍生产力提升之道

2. 核心干货概览

类别 名称 核心用途 / 战略意义
提示词框架 RTF 框架 (Role-Task-Format) 结构化提示词,确保 AI 输出符合预期格式
提示词工具 Custom Instructions (自定义指令) 预设 AI 角色定位和行为模式,获取更真实的反馈
高上下文 LLM Claude Projects / ChatGPT Projects 注入绩效评审、会议记录、产品策略,构建「最懂你」的 AI 助手
桌面上下文助手 Cluey 实时追踪会议内容,解答关于桌面文档的问题
独享上下文 LLM NotebookLM 客户访谈合成,避免大模型幻觉,99% 降低虚构低代码 Agent内容
** 构建器** Lindy / Relay.app / Make.com 构建自动化工作流,如邮件分类回复、竞品监控
编程式 Agent Claude Code / Cursor AI 原型开发、代码生成、技术文档编写
AI 原型工具 Lovable / Magic Patterns / Bolt 快速生成可交互原型,验证产品想法
客户洞察工具 Dovetail / Unwrap / Interpret 整合全渠道用户反馈,量化功能需求 revenue impact
氛围实验工具 Chameleon / Amplitude 无代码配置 A/B 测试,PM 独立启动实验

关键指标

  • 提示词库迭代版本:部分提示词已迭代至 v11、v12
  • 客户访谈洞察提升:10-20% 更深度发现
  • 竞品监控自动化:仅在重大变化时触发通知(如价格调整)
  • 实验覆盖:从 5% ideation 阶段扩展至 100% 全流程

2. 深度逻辑拆解

核心挑战

产品经理面临的核心困境是:如何从繁琐的重复性工作中解脱,将有限时间聚焦于真正创造价值的任务。传统 PM 工作流充满低效环节——手动撰写 PRD、逐条回复邮件、频繁切换上下文准备高风险会议、依赖工程师进行小实验验证。AI 技术的成熟使得这些问题有了系统性解决方案。

步进 SOP

Step 1: 提示词工程基础建设

具体动作

  1. 启用 ChatGPT/Claude 的「自定义指令」功能
  2. 预设核心原则:「目标是实现模型过时(即用户不再需要你的帮助就能完成任务)」
  3. 建立个人提示词库,记录常用的 80-100 个提示词模板
  4. 每次获得不佳回复后,反向优化提示词并更新版本
  5. 使用语音输入工具(如 Super Whisper)以 2 倍速度构建复杂提示词

Step 2: 构建三层 AI 协作体系

高上下文 LLM(Claude Projects)

  • 注入个人绩效评审文档
  • 导入关键会议纪要(与老板的 1:1、与设计师/工程经理的协作会议)
  • 录入口述思考(当前季度的担忧、期待的功能、即将发布的内容)
  • 接入产品愿景、战略、路线图文档
  • 典型项目示例:LinkedIn 写手、播客准备、产品 scrapbook(产品灵感库)

桌面上下文助手(Cluey)

  • 实时追踪会议内容,记忆所有讨论要点
  • 截屏会议 PPT 并提问:「这页图表是什么意思?」
  • 撰写邮件时主动建议:「根据当前会议内容,这封邮件还应补充什么?」

独享上下文 LLM(NotebookLM)

  • 导入所有 PRD、历史功能复盘、客户访谈 transcript
  • 下达指令:「识别我们声称的战略、实际构建的功能与用户真实需求之间的差距。诚实指出我们在自欺欺人的地方。」

Step 3: Agent 自动化工作流

典型案例:邮件自动分类回复系统

  1. 使用 Gemini Flash(低成本模型)进行邮件分类:折扣请求、赞助咨询、播客嘉宾邀请、订阅用户问候
  2. 根据分类触发不同的系统提示词和 RAG 数据库
  3. 例如赞助类:调取历史合作记录、费率卡,生成个性化回复
  4. 每次回复后评估质量,不佳则反向优化系统提示词

竞品监控 Agent

  1. 设定监控阈值:「仅当竞品发生重大变化时通知我(如定价调整、主要功能上线)」
  2. 自动抓取公开信息
  3. 符合条件的重大变化才发送邮件,避免信息过载

案例细节

案例一:高上下文 LLM 生成周报

  • 场景:为 ChatGPT 5.5 发布撰写每周状态更新,发送给 CPO Sam Altman
  • 痛点:常规 LLM 生成的周报「一切正常,进展顺利」,领导真正想看的是「风险点在哪里」
  • 解决方案:高上下文项目注入了:(1) 绩效评审——领导曾批评「你总是掩盖重点」;(2) 与 Sam 的会议记录——Sam 说「我不关心功能完整性,我只关心模型是否感觉『神奇』,必要时可以砍范围」;(3) 口述思考——「担心推理功能半成品,领导很兴奋」;(4) 路线图——18 天后 TechCrunch Disrupt 发布,必须上线,需提升 10 点 NPS
  • 结果:高上下文 LLM 生成版本直接以「Status: YELLOW」开头,引用了「magical leap」原话,并主动建议决策而非仅「建议开会讨论」

案例二:Thread Up 搜索栏文案实验

  • 背景:二手服装平台,拥有超过 10 万个品牌
  • 原文案:「你想买什么?」(What do you want to buy?)
  • 新文案:「你最喜欢的服装品牌是什么?」(What are your favorite clothing brands?)
  • 效果:新用户输入「Lululemon」后,看到平台提供 18 美元的 Lululemon 瑜伽裤(原价 120 美元),大幅提升转化
  • 意义:此实验由 PM 通过氛围实验平台独立完成,零工程师、零设计师资源,3 年内最成功的功能

3. 核心干货运用

提示词模板还原

自定义指令模板(ChatGPT/Claude)

你是一位资深产品副总裁。你的沟通风格直接、务实,不绕弯子。
核心原则:
- 目标是实现模型过时(让用户最终不需要你的帮助)
- 给出具体建议,不要只问问题
- 如果数据不足,明确指出需要什么
- 使用「结论先行」结构,重要信息放第一句

PRD 评审提示词(RTF 框架应用)

Role: 我的 VP of Product
Task: 评审这份 PRD,指出逻辑漏洞、缺失的用户场景、技术风险
Format: 
1. 核心问题(3 条最严重)
2. 改进建议
3. 优先级排序
[附上 PRD 内容]

客户访谈指南优化提示词

Review my interview guide and identify all common PM mistakes:
- Leading questions
- The Mom Test violations (ask about past behavior, not hypotheticals)
- Future-tense bias
- Lack of open-endedness
- Missing chronological story extraction
For each problem: quote the question, explain what's wrong, provide rewritten alternative.

逻辑注释

为什么自定义指令必须强调「模型过时」? 因为默认模式下,AI 倾向于给出「让你感觉良好」的回答以维持对话。设定此目标后,AI 会更具批判性,提供真正有价值的反馈而非敷衍。

为什么 NotebookLM 适合访谈合成? 标准 LLM(ChatGPT/Claude)在合成过程中容易产生幻觉——将未说的话归功于受访者。NotebookLM 作为独享上下文 LLM,仅基于输入内容生成回答,幻觉率降低 99%。

为什么用低成本模型做分类? 邮件分类是简单的判断任务,无需 GPT-4 能力。使用 Gemini Flash 等低成本模型可大幅降低运营成本,同时保持 95% 准确率。


4. PM 避坑与实战洞察

反直觉结论

  1. AI 写的提示词比人类更好

    • 研究显示 AI 生成的提示词效果优于人类手写版本
    • 实操:将手写提示词丢给 AI,让其优化
  2. 提示词框架不需要背下来

    • 技巧:直接告诉 AI「帮我写一个执行 X 任务的完美提示词」
  3. PM 不需要学代码就能做实验

    • 氛围实验(Vibe Experimentation)让 PM 可在无工程师情况下启动 A/B 测试
    • 工具:Chameleon、Amplitude 支持自然语言配置实验
  4. AI 原型可以比工程师做得更快

    • Magic Patterns 生成前端原型速度是 Lovable 的 10 倍
    • 原因:不构建后端,仅生成可交互前端用于验证
  5. Anthropic 的 PM 不写 PRD

    • 做法:PM 用 Claude Code 直接构建功能初版
    • 全员内部测试数周后才启动正式实验

适用边界

  • 高上下文 LLM:仅在需要个性化、记忆特定背景时使用;简单查询无需浪费 token
  • AI Agent 自动化:仅适用于重复性、高频、规则明确的工作流;一次性任务手动处理更快
  • 氛围实验:仅适用于前端 UI 层面修改;涉及后端架构变化的实验仍需工程师
  • AI 原型:仅用于验证想法;最终上线产品仍需工程重构

实战陷阱

  1. 不要用 ChatGPT Agent 做简单任务

    • Agent 模式耗时远超手动:1-2 分钟手动可完成的任务,Agent 可能需 10 分钟
  2. 不要跳过原型迭代

    • 首版通常只达 50% 完整度
    • 建议投入 30 分钟迭代循环而非 5 分钟快速生成
  3. 不要在未提供视觉上下文的情况下生成原型

    • 必须提供 Figma 设计截图、产品截图或手绘草图
    • 缺少视觉上下文会导致 AI 假设离谱的 UI 布局
  4. 不要在合成访谈时使用标准 LLM

    • 幻觉问题严重,必须使用 NotebookLM 等独享上下文工具
  5. 不要期望 AI Eval 达到 100% 准确率

    • 80-90% 即为优秀
    • 需持续监控 eval 指标波动,如从 80% 骤降至 20% 需立即排查

5. 金句

  • 「设定目标是实现模型过时(model obsolescence via user self-sufficiency),这样 AI 才会给你真正诚实的反馈,而不是一直迎合你。」

  • 「不要问 AI『你觉得这个产品怎么样』,要问『帮我写一个完美的提示词来完成这个任务』——研究显示 AI 写提示词比人类写得更好。」

  • 「用语音输入写提示词吧,我们说话的速度是打字的两倍。Super Whisper 会在你说话后自动格式化,添加 bullet points 和编号。」

  • 「Claude Projects 就是你的『肚里蛔虫』——它知道你上次跟老板说了什么、领导最近关心什么、公司的战略方向,生成的回复精准无比。」

  • 「别再用标准 LLM 合成客户访谈了,NotebookLM 能消除 99% 的幻觉——它只基于你输入的内容回答,不会编造受访者没说过的话。」

  • 「花 2000 美元雇一个执行助理?不如花 50 美元订阅 Lindy,它能完成 80% 的工作,而且 24/7 不休息。」

  • 「Anthropic 的 PM 不写 PRD,他们直接用 Claude Code 把功能写出来,全员内测几个月后才 launch 实验。」

  • 「我在 Thread Up 最成功的功能改动——改了一句搜索栏的占位文案——零工程师、零设计师资源,3 年内最具影响力的增长实验。」

  • 「AI 产品管理(APM)现在占 LinkedIn 上 20% 的 PM 职位空缺。传统公司在裁员,但 AI 公司在疯狂招人。」

  • 「不要问用户『你会想要这个功能吗?』——这是最蠢的问题。要问『上次遇到这个问题时,你是怎么解决的?』过去行为比未来承诺可信 100 倍。」


6. 行动清单(立即可执行)

  1. 今天:打开 ChatGPT/Claude 自定义指令,粘贴「目标是实现模型过时」原则
  2. 本周:创建第一个 Claude Project,导入最近的绩效评审和 3 次关键会议记录
  3. 本月:用 Lovable 或 Magic Patterns 生成一个产品想法的交互原型
  4. 本季度:搭建一个邮件自动分类回复 Agent(使用 Lindy 或 Make.com)
  5. 每年:完成 Tailwind 迁移和微服务架构重构,让代码库对 AI 友好——这是 Anthropic 正在做的事

📺 视频原片


视频ID: YKYQ-z6A9Fs