Opus 4.5 改变了一切（访谈）

原始标题: Opus 4.5 changed everything (Interview)

发布日期: 2026-02-27 | 来源频道: @changelog

📝 深度摘要

1. 节目元数据 (Meta Info)

核心主题：Anthropic Opus 4.5 模型如何成为 AI 编码的拐点，以及它如何彻底改变了开发者的工作方式。探讨从"能帮你写代码"到"能帮你完成整个项目"的范式转变。
出场人物：主持人 Adam Stacoviak（The Changelog 主编），嘉宾 Burke Holland（Microsoft GitHub Copilot 团队开发者关系工程师）

2. 核心摘要 (The TL;DR)

这是《The Changelog》具有里程碑意义的一期：Jerod Santo 正式宣布退出，Adam Stacoviak 单飞后的首期节目，邀请了 GitHub Copilot 团队的 Burke Holland 来探讨 Opus 4.5 如何改变了 AI 辅助开发的游戏规则。Burke 在圣诞节期间用 Opus 4.5 完成了一系列令人震惊的项目：一个下午就能搭建出功能完整的 iOS 应用，替妻子的生意实现了自动化，还用 AI “杀掉了"她之前付费的 SaaS 工具。这期节目深刻探讨了 AI 时代的开发者定位问题：是继续做"代码工匠”，还是拥抱"人人都是 builder"的新世界？嘉宾一致认为：软件开发的门槛正在极速降低，但生产级软件的交付仍然需要架构、安全和工程化能力。AI 不会杀死开发者，而是会让所有人变成开发者。

3. 深度技术剖析 (Deep Dives)

议题一：Opus 4.5 —— 从"能写代码"到"能干活"的临界点

背景/上下文：Burke 在 GitHub Copilot 团队工作多年，经历了从 GPT-4.1 到 Sonnet 3.5 的演进。他注意到之前的模型虽然能生成代码，但常常是"spaghetti code"（意面代码），而且会在某个错误处卡住，无法自我修复。他把这种情况比喻为"你不能一半时间正确一半时间错误，你需要时时刻时刻都正确"。2024 年 12 月，Anthropic 发布了 Opus 4.5，这个模型让 Burke 在圣诞节期间实现了真正的生产力飞跃。
技术细节与挑战：Burke 详细描述了他的测试过程。首先他让模型用原生 WinUI 库构建一个 Windows 窗口调整工具，结果"one-shot"——一次提示就完成了，而且代码结构清晰。接着他用同样的方法构建了一个屏幕录制转 GIF 的工具，同样是一次成功。然后他野心勃勃地想做一个完整的屏幕视频编辑工具（类似 Snagit），在"几个小时"内就做出了一个能用的 V1 版本。他强调整个过程没有任何特殊的 workflow，只是正常 prompt 和模型"brainstorm"了一下。更关键的是，他用 Opus 4.5 为妻子搭建了一个 iOS 应用：上传生日庆祝展板的图片，用 Gemini 模型生成社交媒体配文。这个应用他一年前用 AI 尝试过，花了数晚时间，做到 80% 就无法完成。这次用 Opus 4.5，一个下午就搞定了。他还说妻子之前使用一个付费的导航应用来规划安装展板的路线，现在这个应用也被他用 AI 替代了——这就是"SaaS killer"的真实案例。
关键结论/观点：Burke 认为 Opus 4.5 代表了一个"inflection point"（拐点）。之前人们对 AI 写代码是将信将疑，但现在如果你体验过 Opus 4.5，你会发现它真的能干活。不过他也指出，虽然模型能力大幅提升，但使用成本也在上升——Claude Code 每月 200 美元可以消耗约 10 亿 token，价值约 25000 美元，这种补贴不会永远持续。

议题二：AI 编码工具的工作流演进与最佳实践

背景/上下文：作为 GitHub Copilot 的开发者关系工程师，Burke 的日常工作就是研究如何让开发者更高效地使用 AI 工具。他发现现在的 AI 编码工具生态非常复杂：有 VS Code、Copilot CLI、Cursor、Windsurf 等各种 Agent，还有 MCP servers、skills、instruction files、custom agents 等概念。他坦言"we don’t know what the future looks like"（我们不知道未来什么样），只能不断尝试和迭代。
技术细节与挑战：Burke 描述了他当前的工作流。首先他会在 Copilot CLI 中使用"plan mode"与模型讨论需求，这个模式会迭代 4-6 轮，让模型帮他发现遗漏的需求。他使用 Opus 4.6 进行规划，因为它"incredibly good"。规划完成后进入 MVP 阶段，他会使用 Copilot 的"Autopilot"功能——这是一个路由循环，模型会持续运行直到达到 95% 置信度才停止。他还创建了一个叫"Anvil"的自定义 Agent，它会判断任务是简单、中等还是困难，并根据难度选择不同的 workflow。在复杂任务中，他甚至会同时使用 Gemini 3、GPT 5.3 Codex 和 Opus 4.6，让不同的模型做不同的工作——4.6 负责规划，5.3 负责写代码，Gemini 负责设计。他提到一个有趣的观察：模型之间的"性格"差异很大，GPT 5.3 像个"非常 senior 的开发者"，而 Opus 4.6 像个"最好的朋友"，会恭维你让你感觉良好。Burke 还尝试了让 Agent 在 Telegram 上向他汇报进度，这样他可以远程审批下一步操作，但他承认这会带来"Agent anxiety"——你总是担心 Agent 在做什么。他也尝试了"Ralph loop"——让 Agent 24/7 运行，自动添加游戏功能，但认为最终产物可能只是个"怪物"，无法真正发布。
关键结论/观点：Burke 认为现在的 AI 工具"all on par"（水平相当），你选哪个都不会错。但关键是要找到适合自己的 workflow，而不是照搬别人的。他特别强调：Prompt engineering 的本质就是给模型足够的上下文，你描述得越清楚，结果就越好。他也承认 AI 仍有很大局限性，特别是在浏览器之外的原生应用场景，Agent 很难自我验证代码是否正确运行。

议题三：开发者会被替代吗？——从"代码工匠"到"人人都是 Builder"

背景/上下文：这是本期节目最引发思考的议题。Sam Altman 等人曾预言工程师会被 AI 替代，业界对此议论纷纷。Burke 和 Adam 从多个角度深入探讨了这个话题。
技术细节与挑战：Adam 首先提出了"toll booth"（收费站）的担忧：现在 AI 工具越来越贵，Claude Code 每月 200 美元，如果要保持"高绩效"，是否意味着只有付得起钱的人才能当开发者？行业的门槛是否被抬高了？Burke 回应说：写代码从来不是最难的部分，难的是把东西部署到生产环境。这就是为什么很多人"vibe code"（凭感觉写代码）但最终无法上线——生产级软件需要架构、安全、运维等全链路能力。他引用了一个例子：VS Code 是最大的开源项目之一，去年 12 月有 15000 个 issue 需要处理，团队正在研究如何用 AI 来自动化这个流程。Adam 分享了他自己的转变：以前他觉得必须亲自写代码，现在他用 AI 学习新概念，比如他之前完全不懂 ETL 管道，但通过 AI 解释，他学会了 Medallion Method（ bronze-silver-gold 分层方法），现在他已经能熟练使用这些概念来指导 AI 工作。他还说以前害怕学新语言（比如 Go），现在发现"it doesn’t matter at all"——你可以让 AI 写，你只需要理解概念。Burke 提到一个反例：有人用 AI agents 搭建了整个浏览器或整个编译器，这很惊人，但"to ship that browser is a whole other story"（要发布那个浏览器是另一回事）。
关键结论/观点：两人一致认为 AI 不会杀死开发者，而是会重新定义"开发者"这个词。Burke 说：“AI is going to replace developers” 应该被理解为"everybody is going to be a developer at some level"（每个人在某种程度上都将成为开发者）。Adam 更倾向于用"builder"而非"developer"来描述这个趋势。他引用了《谁动了我的奶酪》的故事：像 Sniff 和 Scurry 一样主动寻找新奶酪（拥抱 AI），而不是像 Hem 和 Ha 一样固守原地。Adam 还提到他的朋友、Raygun CEO John Daniel Trask 的例子——34 年开发经验，最近 18 个月没手动写一行代码，但产出前所未有地高。不过 Burke 也表达了对"cathedral building"（建造大教堂）的担忧：以前人们花数年建教堂，现在几个月就完工，质量不可同日而语。软件是否也会变得如此？当所有代码都可以 AI 生成，我们是否还会记得如何写出真正精致的代码？

议题四：开源与工具链的范式转移

背景/上下文：节目还讨论了 AI 时代开源生态和工具链的变化。
技术细节与挑战：Adam 提到现在创建软件的成本如此之低，以至于很多人可以轻松创建自己的工具然后分享给所有人。他以 Cloudflare 的 OpenNext 为例——他们用 1200 美元就实现了 Next.js 的替代方案。但 Burke 也指出，像 NPM 这样的 incumbents（老牌工具）有其优势：模型对这些工具了如指掌，因为它们在训练数据中。如果你创建一个新工具，模型可能不知道如何使用。他说：“People choose the path of least resistance”（人们选择阻力最小的路径）。Adam 还提到 YOLO flag——很多 AI 工具允许你一键让 Agent 执行任何操作，完全不设限，这在安全上非常危险。他特别提到 OpenClaw 这个项目可以帮你锁定 AI 的权限。Burke 承认现在人们"appetite for risk seems to be ludicrous"（对风险的胃口似乎疯狂），但这是事实。
关键结论/观点：两人都认为"Nothing is safe"（没有什么是安全的）。软件现在太容易被复制了，每个公司都需要"reinvent themselves"（重新定义自己）。关于开源，Burke 认为 AI 时代反而让开源更繁荣了，因为工具链变得更容易获取。他也提到 GitHub Copilot 最初发布时引发争议（因为用开源代码训练），但现在开源生态反而更好了。

4. Homelab & 自托管车库 (The Homelab Corner)

折腾日常/硬件配置：Adam 提到他妻子的生意完全运行在 Raspberry Pi 上，接受订单邮件并自动打印。这个小型的homelab 解决方案已经支撑了整个 Franchise 的运营。
网络与架构玩法：节目中讨论较少，主要集中在软件层面的自动化架构。

5. AI 与 Agent 工作流 (AI & Agentic Workflows)

讨论的工具/框架：GitHub Copilot（包括 CLI 和 VS Code 集成）、Claude Code、Augment Code（Augie）、Cursor、Windsurf、GPT 5.3 Codex、Opus 4.5/4.6、Gemini 3.1、MCP servers、OpenClaw、Zed 编辑器。
工作流范式转移：这期节目是关于"范式转移"的最佳案例。Burke 展示了他的完整工作流：从 plan mode（规划模式）开始，用 Opus 4.6 进行 4-6 轮的迭代规划，然后进入 Autopilot（自动驾驶）模式，Agent 会持续运行直到达到 95% 置信度。他甚至创建了自定义 Agent “Anvil"来根据任务难度自动选择不同的模型和 workflow。Adam 也展示了他如何用 Opus 4.6 + Augie 实现"睡前提交，一觉醒来 V1 就完成"的体验。他特别强调 planning（规划）环节的价值——通过与 AI 讨论需求，你能发现自己遗漏的边界情况，这比直接写代码更有价值。

6. 行业洞察与"暴论” (Industry Insights & Hot Takes)

观点一：传统 SDLC 软件生命周期已死：Adam 认为现在软件创建的门槛降到几乎为零，这意味着传统的"需求分析→设计→开发→测试→部署"流程正在被打破。Burke 补充说，VS Code 团队现在有 15000 个 issue 要处理，这在以前是不可想象的。AI 正在改变一切，从个人开发者到大型团队。
观点二：开发者不会消失，但角色会彻底改变：Burke 和 Adam 都认为"developer"这个 title 会变得过时。未来每个人都是"builder"——不需要懂代码就能用 AI 构建自己的工具。但这不意味着专业开发者会失业，而是需要转向更高层次的工作：架构设计、系统集成、安全审计、AI 模型的编排等。
观点三：工具没有好坏，只有适合不适合：Burke 强调现在所有主流 AI 编码工具"all on par"，选哪个都不会错。关键是你要找到适合自己工作方式的 workflow，而不是追逐最新的热点。
观点四：AI 时代的"手工艺人"会更珍贵：Burke 用"cathedral vs tract home"的比喻表达担忧——当所有人都能用 AI 快速生成代码时，真正能写出精致、可维护、有美感代码的"工匠"会变得更加珍贵，就像手工家具 vs IKEA 组装家具。

7. 工具雷达 (Tool Radar & Shoutouts)

Claude Code / Opus 4.5-4.6：本期主角，Anthropic 的 AI 编码模型，展示了真正的生产力飞跃
GitHub Copilot CLI：Burke 所在的团队产品，刚刚 GA（正式发布），支持 fleet 命令可以部署多 Agent 协同工作
Augment Code (Augie)：Adam 日常使用的 AI 编程助手，以其 context engine 著称
GPT 5.3 Codex：被描述为"像非常 senior 的开发者"，适合实际写代码
Gemini 3.1：Google 的模型，在 Burke 的工作流中负责设计工作
OpenClaw：Adam 提到的安全项目，可以锁定 AI 权限
Zed：Adam 个人偏好的编辑器
Firebase：Burke 提到的例子，模型对这类工具了如指掌
Tigris：S3 兼容的对象存储，Adam 在使用
diffs.com：新出现的 diff 渲染库初创公司
Card My Yard：Adam 妻子加盟的公司，用于生日展板租赁

8. 金句摘录 (Golden Quotes)

“Coding something is easy. Code has never been the hard part. It’s getting that thing into production that’s hard.” 写代码很容易。代码从来都不是最难的部分。难的是把它部署到生产环境。

“We’re in the era of polymath. If you can begin to connect dots, you can become a polymath.” 我们正处于通才的时代。如果你开始能够连接各个知识点，你就能成为一个通才。

“The cheese is moving. How do you adapt?” 奶酪正在移动。你该如何适应？

9. 赞助商与商业信息 (Sponsors)

Augment Code：AI 编程助手，以其 context engine 和 Augie CLI 著称。Adam 高度评价其为"one-shot tool"，可以让他在睡前提交任务，醒来后 V1 就完成
Squarespace：建站和内容变现平台，提供预约、发票、支付、会员内容等一站式服务
Notion：AI 驱动的团队协作空间，支持自定义 AI Agent 自动化工作流程
fly.io：The Changelog 的托管平台

📺 播客地址

播客时长: 104分钟

1. 节目元数据 (Meta Info)#

2. 核心摘要 (The TL;DR)#

3. 深度技术剖析 (Deep Dives)#

议题一：Opus 4.5 —— 从"能写代码"到"能干活"的临界点#

议题二：AI 编码工具的工作流演进与最佳实践#

议题三：开发者会被替代吗？——从"代码工匠"到"人人都是 Builder"#

议题四：开源与工具链的范式转移#

4. Homelab & 自托管车库 (The Homelab Corner)#

5. AI 与 Agent 工作流 (AI & Agentic Workflows)#

6. 行业洞察与"暴论” (Industry Insights & Hot Takes)#

7. 工具雷达 (Tool Radar & Shoutouts)#

8. 金句摘录 (Golden Quotes)#

9. 赞助商与商业信息 (Sponsors)#