原始标题: Why most AI products fail: Lessons from 50+ AI deployments at OpenAI, Google & Amazon 发布日期: 2026-01-11 | 来源频道: @LennysPodcast
📝 深度摘要
对话背景与核心主题
本期节目邀请了Aishwaria Raanti(Ash)和Kiriti两位嘉宾,他们曾在OpenAI、Google和Amazon等公司主导AI产品开发,并帮助了超过50家公司部署AI产品。他们共同开发了一门关于成功构建企业AI产品的课程,并在咨询实践中积累了丰富的一线经验。
对话围绕一个核心问题展开:为什么大多数AI产品最终都失败了? 嘉宾们从技术、产品、组织三个维度剖析了AI产品开发的独特挑战,并提供了可操作的框架和方法论。
核心逻辑拆解
一、AI产品与传统软件的本质差异
1. 非确定性(Non-determinism)
与传统软件不同,AI产品运行在一个“非确定性API”之上。你无法准确预测用户会如何与产品交互,也无法确定大语言模型会给出怎样的回应。这种不确定性从根本上改变了软件的构建方式。
传统软件就像Booking.com——用户意图可以转化为特定的点击操作流程。但AI产品需要处理更模糊的输入、更复杂的上下文,以及模型输出的多变性。
2. 代理控制权衡(Agency-Control Tradeoff)
每当你将决策能力交给代理系统时,实际上在放弃部分控制权。给予AI的自主权越多,你需要构建的保障机制就越复杂。这是一个持续的张力,而非一次性决策。
二、失败的根源:忽视迭代与反馈
大多数AI产品失败的核心原因不是技术,而是产品方法论。
- 过度关注工具而非问题:团队急于使用最新的AI模型或框架,却忽略了深入理解要解决的业务问题。
- 忽视反馈循环:没有建立持续改进的飞轮(flywheel),产品上线后无法有效迭代。
- 低估用户行为变化:用户与AI系统的交互方式往往与预期不同,需要持续观察和调整。
三、领导力的转变
成功部署AI产品的公司,领导者都表现出独特的特质:
- 保持动手实践:领导者需要亲自使用产品,理解AI的行为模式,而非完全依赖团队汇报。
- 接受不确定性:承认自己的直觉可能出错,愿意向团队中的每个人学习。
- 跨职能协作:PM、工程师、数据团队的的传统分工被打破,需要更紧密地合作。
正如一位CEO每天早上4点到6点专注学习AI一样,领导者必须沉浸在AI的实践中。
方法论与工具箱
1. 渐进式自主权框架(Progressive Autonomy)
不要试图一次性构建完全自主的AI系统。相反,应该从高度受控的版本开始,逐步增加AI的自主权:
- 第一阶段:AI只提供建议,人类决策
- 第二阶段:AI处理简单任务,人类审核复杂情况
- 第三阶段:AI处理大多数任务,人类处理例外
- 第四阶段:完全自主,但持续监控
每个阶段都需要通过评估(evals)来验证性能,确保系统行为符合预期后再进入下一阶段。
2. 持续校准(Continuous Calibration)
AI产品需要持续的校准过程,而非一次性的发布后不管:
- 监控行为漂移:用户使用模式会随时间变化,AI需要适应
- 外部事件触发校准:如API变化(GPT-4到GPT-4o的迁移)、业务流程调整等
- 用户反馈循环:用户的真实使用数据是最宝贵的改进来源
这类似于软件开发中的CI/CD(持续集成/持续部署),但针对AI系统的特点进行了调整——从集成代码变为运行评估,从部署变为行为校准。
3. 评估体系(Evals)
评估是AI产品开发的核心:
- 定义清晰的评估标准:不只是准确率,还包括响应质量、用户体验指标等
- 自动化评估流程:持续运行评估,确保每次更新不会引入回归
- 人工评估的重要性:自动化评估无法捕捉所有问题,需要结合人工审核
4. 多代理系统的正确打开方式
关于多代理系统,嘉宾提供了一个重要洞察:
- 成功的多代理架构通常采用监督者模式(Supervisor Pattern):一个主代理协调多个子代理
- 避免让代理之间通过点对点协议“闲聊”,这种方式难以控制
- 让单一主代理负责任务分解和结果整合,而不是依赖分布式协调
关键洞察与辩论
关于过度炒作与被低估的趋势
被误解的概念:
- 多代理系统:人们想象多个AI代理协作解决复杂问题,但实际上这种方式很难控制,成功的案例很少
被低估的趋势:
- 编码代理(Coding Agents):虽然社交媒体上讨论很多,但实际采用率仍然很低。2025-2026年将是编码代理创造巨大价值的年份
- 产品设计和问题理解:过度关注工具而忽视设计思维是普遍问题
关于未来展望
- 背景代理/主动代理:AI将更深入地理解用户工作流程,主动提供帮助,而非等待用户提问
- 多模态体验:除了文本生成,更重要的是理解多模态输入(如手写文档、复杂PDF),这将开启大量新的应用场景
- AI帮你工作,而非你帮AI工作:代理将主动识别问题并解决,例如发现代码bug并自动修复
“痛苦是新的护城河”
这是嘉宾提出的一个深刻观点:成功的企业不是因为最先进入市场或拥有最酷的功能,而是因为他们经历了理解问题本质的痛苦过程。这种通过反复试错积累的认知,才是真正的竞争优势。
金句
“构建AI产品不是关于成为第一个拥有代理的公司,而是你是否建立了正确的飞轮,以便能够持续改进。”
“AI只是一种工具。真正重要的是你有多沉迷于你试图解决的问题。”
“领导者必须亲自使用产品,亲自观察AI的行为,而不是完全依赖团队的汇报。”
“实施将变得异常廉价。真正重要的是你的设计、你的判断、你的品味。”
“80%的所谓AI工程师和AI产品经理实际上花在理解工作流程上。他们不是在构建最炫的模型,而是在理解用户行为和数据。”
“痛苦是新的护城河——你经历的理解问题的痛苦过程,转化为你公司真正的护城河。”
“不要只关注工具跳跃。真正需要对业务问题痴迷。AI只是一个工具。”
📺 视频原片
视频时长: 86 分钟 | 视频ID: z7T1pCxgvlA