原始标题: The Powerful Alternative To Fine-Tuning

发布日期: 2026-02-27 | 来源频道: @ycombinator

📝 深度摘要

对话背景与核心主题

本期Y Combinator的Light Cone播客邀请了Poetic公司联合创始人兼联席CEO Ian Fischer。Poetic是一家构建递归自我改进AI推理系统的初创公司,核心产品被称为"脚手架"(stilts/harness)——一种能够自动生成推理系统的技术架构,让任何大语言模型都能获得性能提升。主持人与嘉宾探讨了这种新范式相较于传统微调(Fine-Tuning)的根本性优势。

核心逻辑拆解

传统微调面临的核心困境在于:每当你花费数百万美元训练一个专用模型后,更强大的基础模型很快就会发布,你辛苦构建的微调模型瞬间过时。Poetic的解决思路是"脚手架"——不修改模型本身,而是在模型之上构建推理系统,让基础模型自动调用更好的策略来解决问题。这相当于给模型"穿上高跟鞋",使其始终比同类模型更高。

方法论与工具箱

Poetic的核心技术是"递归自我改进"(Recursive Self-Improvement)。他们的"Poetic元系统"能够自动分析特定问题,为其生成专门的推理系统。这套系统可以包括:更优的提示词、上下文增强策略、多次调用协同工作等。与传统人工构建Agent不同,Poetic将整个优化过程自动化,大幅降低成本和时间。

关键洞察与辩论

Ian分享了几个令人震惊的成果数据:在ARC AGI V2基准测试中,Poetic使用成本仅为Gemini 3 Deep Think一半的Gemini 3 Pro,实现了比官方更高的分数;在"人类最后考试"(Humanity’s Last Exam)这个包含2500道极难问题的测试中,Poetic达到55%,超越Anthropic最新发布的Claude Opus 4.6的53.1%。而完成这些成果的团队仅有7人,优化成本不到10万美元——相比之下,训练一个基础模型需要数月时间和数亿美元投入。

金句

  • “你微调了一个三年前的模型,然后GPT-4发布后,你的成果就一文不值了。”
  • “脚手架让你始终比最新模型更强,永远不会错过下一代模型的进步。”
  • “我们不是在训练新模型,而是在教模型如何更好地思考。”
  • “世界变化太快,不要设限。想象任何事情,尝试用AI去做,看看能做到什么程度——你正在让世界变得更好。”

📺 视频原片


视频时长: 19 分钟 | 视频ID: UPGB-hsAoVY