微调的强大替代方案

原始标题: The Powerful Alternative To Fine-Tuning

发布日期: 2026-02-27 | 来源频道: @ycombinator

📝 深度摘要

对话背景与核心主题

本期Y Combinator的Light Cone播客邀请了Poetic公司联合创始人兼联席CEO Ian Fischer。Poetic是一家构建递归自我改进AI推理系统的初创公司，核心产品被称为"脚手架"(stilts/harness)——一种能够自动生成推理系统的技术架构，让任何大语言模型都能获得性能提升。主持人与嘉宾探讨了这种新范式相较于传统微调(Fine-Tuning)的根本性优势。

核心逻辑拆解

传统微调面临的核心困境在于：每当你花费数百万美元训练一个专用模型后，更强大的基础模型很快就会发布，你辛苦构建的微调模型瞬间过时。Poetic的解决思路是"脚手架"——不修改模型本身，而是在模型之上构建推理系统，让基础模型自动调用更好的策略来解决问题。这相当于给模型"穿上高跟鞋"，使其始终比同类模型更高。

方法论与工具箱

Poetic的核心技术是"递归自我改进"(Recursive Self-Improvement)。他们的"Poetic元系统"能够自动分析特定问题，为其生成专门的推理系统。这套系统可以包括：更优的提示词、上下文增强策略、多次调用协同工作等。与传统人工构建Agent不同，Poetic将整个优化过程自动化，大幅降低成本和时间。

关键洞察与辩论

Ian分享了几个令人震惊的成果数据：在ARC AGI V2基准测试中，Poetic使用成本仅为Gemini 3 Deep Think一半的Gemini 3 Pro，实现了比官方更高的分数；在"人类最后考试"(Humanity’s Last Exam)这个包含2500道极难问题的测试中，Poetic达到55%，超越Anthropic最新发布的Claude Opus 4.6的53.1%。而完成这些成果的团队仅有7人，优化成本不到10万美元——相比之下，训练一个基础模型需要数月时间和数亿美元投入。

金句

“你微调了一个三年前的模型，然后GPT-4发布后，你的成果就一文不值了。”
“脚手架让你始终比最新模型更强，永远不会错过下一代模型的进步。”
“我们不是在训练新模型，而是在教模型如何更好地思考。”
“世界变化太快，不要设限。想象任何事情，尝试用AI去做，看看能做到什么程度——你正在让世界变得更好。”

📺 视频原片

视频时长: 19 分钟 | 视频ID: UPGB-hsAoVY

对话背景与核心主题#

核心逻辑拆解#

方法论与工具箱#

关键洞察与辩论#

金句#

对话背景与核心主题

核心逻辑拆解

方法论与工具箱

关键洞察与辩论

金句