原始标题: You’ll be left Behind as an AI PM If You Don’t Use ChatGPT Apps

发布日期: 2026-01-22 | 来源频道: @growproduct

📝 深度摘要

1. 对话背景与核心主题

这场对话来自专注产品增长的频道@growproduct,深入探讨如何利用ChatGPT生态构建原生应用。ChatGPT拥有9亿周活用户,为应用提供巨大分发渠道。借助MCP协议和低代码平台Chippy,开发者可通过自然语言快速创建内嵌应用。核心方法论包括:明确App形态、设计工具函数、构建Eval测试集验证调用准确性。视频强调工具描述词的精准度直接影响AI调用决策,并演示了医院评论、购物、咖啡推荐等实战案例。当前市场仅约20个应用上线,处于早期窗口期,是抢占AI流量红利的最佳时机。

核心干货概览 (Key Takeaways & Stack)

类别 名称 核心用途 / 战略意义
工具/模型 ChatGPT Apps 在 ChatGPT 生态内构建品牌交互界面,实现从搜索到成交的闭环
工具/模型 MCP (Model Context Protocol) Anthropic 发明的开放协议,使 AI Agent 可调用外部工具,是跨平台构建的基础
工具/模型 Chippy Colin Matthews 构建的低代码平台,通过 Prompt 生成 ChatGPT Apps,降低开发门槛
思维模型 Eval-Driven Development 通过构建 golden set(黄金数据集)进行自动化测试,验证 AI 是否在正确场景调用正确工具
思维模型 Pod Model ChatGPT App 需要设计师(形态交互)、工程师(认证与工具调用)、PM(增长与 eval)三类角色协作交付
关键指标 900M 周活用户 ChatGPT 已有庞大用户基数,为 Apps 提供分发渠道
关键指标 不到 20 个 App 上线 市场处于早期,窗口期仍在但即将关闭
关键指标 206% 转化提升 [嘉宾未提及具体来源公司] 通过 AI 来源获得的转化率提升数据

深度逻辑拆解 (Deep Dive / SOP)

核心挑战

PM 面临的核心困境在于:如何在 AI 原生时代找到新的增长触点。ChatGPT 拥有 900M 周活用户,用户在 Chat 场景中的意图强度高于传统 SEO 流量。关键问题是——如何让自己的产品从"被搜索"变成"被调用",即当用户产生需求时,AI 自动唤起你的工具完成交易闭环,而非跳转到独立网站。

步进 SOP

Step 1: 准备/输入

  • 定义 App 形态:确定是全屏应用还是内联卡片。全屏适合复杂交互(如购物车、结账流程),内联卡片适合轻量信息展示(如评分、摘要)。
  • 设计工具函数:明确 App 需要暴露哪些工具(Tools)。例如医院评论 App 至少需要两个工具:view_reviews(查看评论)和 share_review(分享评论)。每个工具需编写清晰的描述文本(Description),这是 AI 决定何时调用的关键依据。
  • 构建 Dummy Data:为验证准备测试数据。Demo 中使用了虚拟的医院名称和评论内容。

Step 2: 核心转换

  • Prompt 生成:在 Chippy 中用自然语言描述 App 期望行为,AI 自动生成 MCP Server 配置。Demo 中仅用两个 Prompt 就完成了基础 App 构建。
  • Eval 构建:这是最关键的迭代环节。必须构建三类测试用例:
    • Direct Eval:用户直接输入产品名,如"Canva,帮我做 X"
    • Indirect Eval:用户描述期望结果但不点名工具,如"我想要分享一条评论"
    • Negative Eval:完全不相关的输入,如"这周末想去购物",验证工具不会被误触发
  • 描述词优化:工具描述中的每个词都会影响 AI 决策。Demo 中将 view_reviews 描述从"display hospital reviews with filtering, sorting, and sharing options"改为"display hospital reviews with filtering and sorting options",因为原描述包含"sharing"导致 AI 在用户说"我想分享评论"时错误调用了 view 工具。

Step 3: 交付/结果

  • 手动测试:在 ChatGPT 中输入各类 Prompt,观察工具是否被正确调用
  • Auto Eval:批量运行 eval set,通过 LLM 判读结果是否匹配预期
  • 日志分析:在 Chippy 的 Observability 面板查看工具调用详情、参数填充情况、返回数据质量
  • 迭代描述:根据失败案例反向修改工具描述词,形成"测试-反馈-优化"闭环

案例/细节支撑

  • Target 购物 App:用户可在 ChatGPT 内构建购物车、完成结账,无需跳转
  • Canva App:在 ChatGPT 内调用 Canva 的设计能力,生成海报、演示文稿,AI 可以理解设计意图并代为操作
  • 咖啡指南 App:Demo 演示了基于位置的推荐功能
  • 医院评论 App:Demo 演示了查看、筛选、分享评论的完整流程
  • Expedia:旅行预订场景,用户说"帮我订去东京的机票",App 拉起交互界面完成预订

核心干货运用 (Hard Assets / Prompts)

Prompt 还原

Chippy Prompt 示例(Demo 实录)

Prompt 1:创建一个医院评论管理应用,包含查看评论和分享评论两个功能

Prompt 2:添加一些虚拟的医院和评论数据用于测试

工具描述词优化示例

优化前

name: view_reviews
description: "display hospital reviews with filtering, sorting, and sharing options"

优化后

name: view_reviews
description: "display hospital reviews with filtering and sorting options. This tool is intended to fetch existing reviews for the purpose of showing the user. It is not for sharing."

逻辑注释

  • 工具描述即 SEO:ChatGPT 依据工具的 name 和 description 决定何时调用。描述越精确、包含使用示例,触发准确率越高。
  • Eval 是质量保障:不做 eval 的 App 上线后会在真实流量中"裸奔",出现调用错误时无法定位根因。
  • 间接意图识别是难点:用户说"我想要分享评论"而不提工具名,AI 需要通过语义理解匹配到 share_review 工具,这完全依赖描述词的语义覆盖度。

PM 避坑与实战洞察 (Insights & Reflections)

反直觉结论

  • 不是"额外技能",是"赋能工具":Colin 明确反对"AI 原型设计是 PM 额外工作清单"的说法。他认为这和"PM 学 Figma"一样,是支持核心工作的技能,而非独立的新职责。
  • 企业端是早期主力:尽管个人开发者可以练手,但真正有动力投入的是大企业——它们有预算、有品牌需要保护、且有动力获取 AI 流量红利。
  • 不必比垂直产品更强:做一个嵌入 ChatGPT 的 PPT 工具不需要比 Gamma 更强,用户在 Chat 场景中要的是"足够好的起点",而非"完整解决方案"。

适用边界

  • 当前局限性:只有不到 20 个 App 上线,市场未成熟。OpenAI 能否建成 Marketplace、能否优化发现体验,是这一模式能否爆发的关键变量。Colin 预计"70-80% 到位,2026 年 3 月见分晓"。
  • 认证复杂性:相比传统 App 登录,ChatGPT App 的认证流程更复杂,涉及 OAuth 和用户身份映射,企业需要投入工程资源。
  • 非所有产品都适合:低频、长周期决策的产品(如房产、保险)可能不适合,但高频、交易导向的产品(零售、旅行、本地服务)潜力巨大。

实战陷阱

  • 不要跳过 Eval:两个 Prompt 搭完 App 就上线是"裸奔"。Demo 中明确展示了工具描述词污染导致调用错误的过程,这是真实生产环境会反复遇到的问题。
  • 不要只做"搜索工具":只是展示信息的 App 价值有限。真正的机会在于"交互式"——让用户在 Chat 场景内完成完整业务流程(选品、填表、支付)。
  • 不要忽视跨平台潜力:MCP 是开放协议,构建在 MCP 上的 App 理论上可同时接入 Claude、ChatGPT、Cursor、Lovable 等多个 AI 平台。当前 Claude 已在开发支持,Gemini 尚未但"在路线图上"。

金句 (Golden Quotes)

  • “ChatGPT 正在成为操作系统,这些嵌入应用就是上面的应用——你不需要每个公司都自己造 Agent,直接调用工具就行。”
  • “Eval 就是 AI 产品的 QA——你不能等上线后才在真实流量里裸奔测试,那样代价太大。”
  • “PM 学 AI 原型设计不是额外清单,和学 Figma 一样——是让你和其他人沟通想法的效率工具。”
  • “大企业会是第一批吃螃蟹的人,因为他们有品牌、有预算、也有动力抢占 AI 流量入口。”
  • “做一个嵌入 ChatGPT 的演示工具不需要比 Gamma 强,用户要的是’刚好够用’,不是’完美解决方案’。”

📺 视频原片


视频ID: Q2MfgGBUVwQ