原始标题: Forward Future Live | 02.06.26 | Guests from Modular, Emergence Capital, & Axiom

发布日期: 2026-02-07 | 来源频道: @matthew_berman

📝 深度摘要

1. 对话背景与核心主题

本期直播由科技博主Matthew Berman主持,邀请Modular、Emergence Capital与Axiom三家AI领域创新公司共同探讨人工智能在编程与数学推理方面的最新进展。Modular带来的MODLAR引擎支持本地化部署,通过代码embedding技术大幅降低Token消耗;Axiom基于Lean定理证明器构建的AI数学家在PUTNAM竞赛中取得满分成绩,验证了"数学即代码"的理念。直播同时讨论了Claude 4等最新AI模型的能力提升,以及AI如何从AI原生公司兴起、中型企业加速采用、企业级安全合规三个维度重塑软件行业格局,探讨了传统SaaS模式面临的挑战与机遇。

1. 核心干货概览 (Technical Takeaways & Stack)

类别 名称 核心用途 / 技术意义
开源工具/库 MODLAR ( Modular ) 新一代AI编程与推理引擎,定位为OpenAI的竞争对手,支持本地化部署以降低Token消耗
开源工具/库 Lean 形式化定理证明语言,用于数学证明的自动化验证,Axiom将其作为AI数学推理的核心基础设施
模型版本/API Claude 4.6 / Opus Anthropic最新模型,直播中展示其代码生成与推理能力
模型版本/API Codex / Gemini 用于本地代码表示生成的模型,配合 embeddings 实现30倍Token消耗降低
关键技术指标 30x Token 节省 通过本地代码表示(embeddings)技术,将Token使用量降低至原来的1/30
关键技术指标 IMO 金牌水平 Axiom的AI数学家在PUTNAM考试中获得满分,历史第六位达成此成就的人类或AI
关键技术指标 100,000倍数据差距 Lean语言的Token量约为Python的十万分之一,构成严峻的数据稀缺挑战

2. 技术深度拆解与实战 SOP (Technical Deep Dive / SOP)

模块一:MODLAR与本地化部署架构(Tim Davis / Modular)

环境配置路径:Modular正在构建的MODLAR引擎允许开发者在本地运行AI推理任务,无需持续向云端上传全部代码库。Tim Davis在直播中演示了如何通过构建本地代码表示(local representations)来减少云端API调用。他提到自己的Token使用量因此下降了约30倍,这对于大规模企业级应用具有显著的成本意义。

核心工作流逻辑:输入代码文件 → 本地embedding生成 → 仅发送精简的代码表示给Claude/Codex/Gemini → 模型基于本地上下文进行推理 → 返回结果。该工作流的关键在于将完整的代码库转换为高维向量嵌入,而非每次请求都上传原始代码。

实测案例:Tim演示了用MODLAR处理复杂代码库的场景,强调本地化推理能够在不牺牲准确性的前提下实现成本优化。他预告该技术将开源发布,但具体时间未在直播中确认。

模块二:形式化数学与自验证AI(Axiom / Karina Hong)

环境配置路径:Axiom基于Lean定理证明器构建AI数学家。团队首先将自然语言数学问题转换为Lean形式化语言,然后利用强化学习训练模型生成可自验证的证明链。Lean是一种函数式编程语言兼证明助手,其内核具备自验证能力。

核心工作流逻辑:数学问题(自然语言)→ 形式化建模(Lean)→ AI生成证明 → Lean验证器检查正确性 → 通过则输出证明,否则反馈给AI重新推理。Axiom将此称为"验证生成"(Verified Generation),即附带证明的代码生成。

实测案例:2024年12月,Axiom的AI在PUTNAM考试(全球最难数学竞赛之一,通常平均分为零,仅五位人类曾获满分)中获得满分,成为历史上第六个达成此成就的实体。Karina透露,团队最初预测AI只能解决12道题中的4道,实际表现远超预期。

细节支撑:Karina指出Lean面临严峻的数据稀缺问题——在线Lean数据的Token量约为Python的十万分之一。她将这个挑战类比为"数据匮乏场景下的AI训练",这与代码生成领域形成鲜明对比。团队通过吸引资深数学家(如Ken Ono教授)加入,将人类数学直觉融入AI训练流程。

模块三:企业软件市场的AI冲击波(Joe Floyd / Emergence Capital)

市场背景:Joe Floyd分析了近期" SAS apocalypse “现象——传统SaaS公司市值普遍下跌35%至40%,PE倍数从7-8倍压缩至4.5-5倍。他认为这一趋势部分是资本向AI领域迁移的结果,OpenAI和Anthropic的估值已超过万亿美元,且增速超过软件行业历史任何时期。

技术影响分析:Joe指出AI正在从层面改变软件三个格局。第一,AI原生公司(AI Natives)从一开始就采用AI技术。第二,中型成长公司(50-100百万ARR)在ChatGPT发布后12-18个月内开始采用AI。第三,上市公司可能还需要额外12-18年才能完全适应。

Vibe Coding的边界:Joe分享了一个关键洞察——个人用例(如自定义CRM)适合用Vibe Coding快速构建,因为"唯一会生气的就是你本人”。但企业场景完全不同:组织需要安全、合规、权限控制,以及"有 throat to choke"——出了问题有人可以追责。他提到一家公司曾尝试用Vibe Coding替代Lattis(HR绩效系统),结果因权限漏洞导致员工互看评审结果,最终酿成安全事故。

投资方向:Emergence Capital正在将投资范围从纯软件扩展到硬件(Bedrock Robotics——建筑设备自动驾驶)和生物技术。Joe明确表示:“传统软件模式已死”(The traditional software model is simply dead),现在必须"All in AI"。

3. 核心干货运用 (Prompts & Configuration)

Prompt策略(Tim Davis本地化推理):核心思路是"先本地,后云端"——利用embedding模型预处理代码库,将完整代码转换为语义向量,仅将最相关的上下文片段发送给大语言模型。这种策略在处理大型代码库时尤其有效,能够在保持推理质量的同时显著降低成本。

Axiom的验证生成框架

问题输入 → 形式化建模 → AI证明生成 → Lean验证 → 通过/反馈循环

关键配置在于将验证步骤嵌入生成流程,确保每个输出的数学证明都附带可执行的真值检验。Axiom的团队成员既包括顶尖数学家,也包括来自Meta等公司的世界模型研究人员,这种跨学科组合是实现"自验证生成"的关键。

Anthropic vs OpenAI的定位差异:Joe Floyd指出Anthropic正在将自己定位为"反广告平台"的奢侈品AI形象,通过Super Bowl广告强化"高端、学术、非商业化"的品牌认知。而OpenAI则采取"全民AI"策略,通过广告补贴免费用户以实现市场覆盖。两种路线反映了不同的商业逻辑。

4. 极客洞察与避坑指南 (Geek Insights & Boundary)

反直觉技术结论

  1. AI在数学上可能比人类更强,但路径不同:Karina指出"对人类困难的问题与对AI困难的问题可能截然不同",这反而创造了人机协作的机会——AI可以处理人类不擅长的计算密集型证明,人类则提供直觉与方向判断。

  2. 传统SaaS的"护城河"正在崩塌:Joe Floyd认为过去软件公司依赖的"系统集成"和"工作流复杂性"在AI面前不再是障碍。他举例说,即使是Salesforce这样的巨头,如果工程师效率提升10倍,其净利润率可能翻倍——这将彻底改变软件公司的估值逻辑。

  3. 数据稀缺有时是优势:Lean数据虽比Python少十万倍,但这种稀缺性反而成为Axiom的技术护城河——竞争对手同样面临数据瓶颈,而Axiom已通过"人类数学家+AI"的混合模式率先突破。

适用边界与风险

  • Vibe Coding:仅适用于个人或非关键业务场景,企业级应用需权衡安全、合规与责任归属
  • 本地化部署:对成本敏感且有技术能力维护基础设施的团队有价值,但增加了运维复杂度
  • 形式化验证:目前仅适用于数学和代码领域,向其他领域(如自然语言推理)的扩展仍在探索中
  • AI数学家的商业化:早期阶段,目标客户是需要"可证明保证"的关键行业(芯片、航空、医疗、加密货币)

实战陷阱

  • 勿将Vibe Coding的便捷性等同于生产就绪——直播中Joe提到的HR系统漏洞案例表明,缺乏形式化验证的AI生成代码可能引发严重安全事故
  • Token优化并非无代价——过度压缩上下文可能导致推理质量下降,需在成本与准确性之间找到平衡
  • 警惕"AI末日论"与"AI万能论"两极——Karina强调AI与人类是协作关系而非竞争

5. 金句 (Golden Quotes)

  • “你只能将很少的东西发送给Claude和Codex以及Gemini——只需要你本地系统的精简表示。这样做能带来Token使用的巨大收益。我的Token使用量比之前下降了约30倍,因为可以在本地进行计算,而不必把所有东西都传到云端。"——Tim Davis(Modular)

  • “传统软件模式已死。你不可能再指望雇佣数百名销售代表,然后像过去十年那样以40%的年增长率销售传统软件——这种模式根本无法持续。"——Joe Floyd(Emergence Capital)

  • “做个人CRM可以放手去干。唯一会生气的就是你自己。但对于组织来说,这是非常困难的,因为数以千计的销售代表经过培训只能使用那一个特定的系统。你失去了所有这些——如果你用Vibe Coding自己搭建的话。"——Joe Floyd(Emergence Capital)

  • “数学就是代码,代码就是数学。通过将验证与生成相结合,我们可以构建一个真正强大的推理引擎,它能够自我改进——从数学开始,然后扩展到代码,再从代码到现实世界的物理验证。"——Karina Hong(Axiom)

  • “对人类困难的问题与对AI困难的问题可能非常不同。正因为这种差异,你实际上拥有一种AI与人类协作的折返机会。许多数学家正在将AI作为合作者——Axiom最近宣布了一系列从自然语言端到端验证的研究猜想,这可能是首次AI在研究级别上自动生成可自验证证明的案例。"——Karina Hong(Axiom)

  • “我认为AI是世界上有史以来最强大的通缩力量。大多数上市公司还没有看到任何好处。他们只看到人们攻击他们——初创公司攻击他们,或者Anthropic攻击他们。你能想象Salesforce能够将研发支出削减到什么程度吗?如果工程师的效率提升10倍,他们的净利润率可能会翻倍。"——Joe Floyd(Emergence Capital)


📺 视频原片


视频ID: 1HVTbejTUOo