原始标题: Forward Future Live | 02.06.26 | Guests from Modular, Emergence Capital, & Axiom

发布日期: 2026-02-07 | 来源频道: @matthew_berman

📝 深度摘要

1. 对话背景与核心主题

本期直播由科技博主Matthew Berman主持，邀请Modular、Emergence Capital与Axiom三家AI领域创新公司共同探讨人工智能在编程与数学推理方面的最新进展。Modular带来的MODLAR引擎支持本地化部署，通过代码embedding技术大幅降低Token消耗；Axiom基于Lean定理证明器构建的AI数学家在PUTNAM竞赛中取得满分成绩，验证了"数学即代码"的理念。直播同时讨论了Claude 4等最新AI模型的能力提升，以及AI如何从AI原生公司兴起、中型企业加速采用、企业级安全合规三个维度重塑软件行业格局，探讨了传统SaaS模式面临的挑战与机遇。

1. 核心干货概览 (Technical Takeaways & Stack)

类别	名称	核心用途 / 技术意义
开源工具/库	MODLAR ( Modular )	新一代AI编程与推理引擎，定位为OpenAI的竞争对手，支持本地化部署以降低Token消耗
开源工具/库	Lean	形式化定理证明语言，用于数学证明的自动化验证，Axiom将其作为AI数学推理的核心基础设施
模型版本/API	Claude 4.6 / Opus	Anthropic最新模型，直播中展示其代码生成与推理能力
模型版本/API	Codex / Gemini	用于本地代码表示生成的模型，配合 embeddings 实现30倍Token消耗降低
关键技术指标	30x Token 节省	通过本地代码表示（embeddings）技术，将Token使用量降低至原来的1/30
关键技术指标	IMO 金牌水平	Axiom的AI数学家在PUTNAM考试中获得满分，历史第六位达成此成就的人类或AI
关键技术指标	100,000倍数据差距	Lean语言的Token量约为Python的十万分之一，构成严峻的数据稀缺挑战

2. 技术深度拆解与实战 SOP (Technical Deep Dive / SOP)

模块一：MODLAR与本地化部署架构（Tim Davis / Modular）

环境配置路径：Modular正在构建的MODLAR引擎允许开发者在本地运行AI推理任务，无需持续向云端上传全部代码库。Tim Davis在直播中演示了如何通过构建本地代码表示（local representations）来减少云端API调用。他提到自己的Token使用量因此下降了约30倍，这对于大规模企业级应用具有显著的成本意义。

核心工作流逻辑：输入代码文件 → 本地embedding生成 → 仅发送精简的代码表示给Claude/Codex/Gemini → 模型基于本地上下文进行推理 → 返回结果。该工作流的关键在于将完整的代码库转换为高维向量嵌入，而非每次请求都上传原始代码。

实测案例：Tim演示了用MODLAR处理复杂代码库的场景，强调本地化推理能够在不牺牲准确性的前提下实现成本优化。他预告该技术将开源发布，但具体时间未在直播中确认。

模块二：形式化数学与自验证AI（Axiom / Karina Hong）

环境配置路径：Axiom基于Lean定理证明器构建AI数学家。团队首先将自然语言数学问题转换为Lean形式化语言，然后利用强化学习训练模型生成可自验证的证明链。Lean是一种函数式编程语言兼证明助手，其内核具备自验证能力。

核心工作流逻辑：数学问题（自然语言）→ 形式化建模（Lean）→ AI生成证明 → Lean验证器检查正确性 → 通过则输出证明，否则反馈给AI重新推理。Axiom将此称为"验证生成"（Verified Generation），即附带证明的代码生成。

实测案例：2024年12月，Axiom的AI在PUTNAM考试（全球最难数学竞赛之一，通常平均分为零，仅五位人类曾获满分）中获得满分，成为历史上第六个达成此成就的实体。Karina透露，团队最初预测AI只能解决12道题中的4道，实际表现远超预期。

细节支撑：Karina指出Lean面临严峻的数据稀缺问题——在线Lean数据的Token量约为Python的十万分之一。她将这个挑战类比为"数据匮乏场景下的AI训练"，这与代码生成领域形成鲜明对比。团队通过吸引资深数学家（如Ken Ono教授）加入，将人类数学直觉融入AI训练流程。

模块三：企业软件市场的AI冲击波（Joe Floyd / Emergence Capital）

市场背景：Joe Floyd分析了近期" SAS apocalypse “现象——传统SaaS公司市值普遍下跌35%至40%，PE倍数从7-8倍压缩至4.5-5倍。他认为这一趋势部分是资本向AI领域迁移的结果，OpenAI和Anthropic的估值已超过万亿美元，且增速超过软件行业历史任何时期。

技术影响分析：Joe指出AI正在从层面改变软件三个格局。第一，AI原生公司（AI Natives）从一开始就采用AI技术。第二，中型成长公司（50-100百万ARR）在ChatGPT发布后12-18个月内开始采用AI。第三，上市公司可能还需要额外12-18年才能完全适应。

Vibe Coding的边界：Joe分享了一个关键洞察——个人用例（如自定义CRM）适合用Vibe Coding快速构建，因为"唯一会生气的就是你本人”。但企业场景完全不同：组织需要安全、合规、权限控制，以及"有 throat to choke"——出了问题有人可以追责。他提到一家公司曾尝试用Vibe Coding替代Lattis（HR绩效系统），结果因权限漏洞导致员工互看评审结果，最终酿成安全事故。

投资方向：Emergence Capital正在将投资范围从纯软件扩展到硬件（Bedrock Robotics——建筑设备自动驾驶）和生物技术。Joe明确表示：“传统软件模式已死”（The traditional software model is simply dead），现在必须"All in AI"。

3. 核心干货运用 (Prompts & Configuration)

Prompt策略（Tim Davis本地化推理）：核心思路是"先本地，后云端"——利用embedding模型预处理代码库，将完整代码转换为语义向量，仅将最相关的上下文片段发送给大语言模型。这种策略在处理大型代码库时尤其有效，能够在保持推理质量的同时显著降低成本。

Axiom的验证生成框架：

问题输入 → 形式化建模 → AI证明生成 → Lean验证 → 通过/反馈循环

关键配置在于将验证步骤嵌入生成流程，确保每个输出的数学证明都附带可执行的真值检验。Axiom的团队成员既包括顶尖数学家，也包括来自Meta等公司的世界模型研究人员，这种跨学科组合是实现"自验证生成"的关键。

Anthropic vs OpenAI的定位差异：Joe Floyd指出Anthropic正在将自己定位为"反广告平台"的奢侈品AI形象，通过Super Bowl广告强化"高端、学术、非商业化"的品牌认知。而OpenAI则采取"全民AI"策略，通过广告补贴免费用户以实现市场覆盖。两种路线反映了不同的商业逻辑。

4. 极客洞察与避坑指南 (Geek Insights & Boundary)

反直觉技术结论：

AI在数学上可能比人类更强，但路径不同：Karina指出"对人类困难的问题与对AI困难的问题可能截然不同"，这反而创造了人机协作的机会——AI可以处理人类不擅长的计算密集型证明，人类则提供直觉与方向判断。
传统SaaS的"护城河"正在崩塌：Joe Floyd认为过去软件公司依赖的"系统集成"和"工作流复杂性"在AI面前不再是障碍。他举例说，即使是Salesforce这样的巨头，如果工程师效率提升10倍，其净利润率可能翻倍——这将彻底改变软件公司的估值逻辑。
数据稀缺有时是优势：Lean数据虽比Python少十万倍，但这种稀缺性反而成为Axiom的技术护城河——竞争对手同样面临数据瓶颈，而Axiom已通过"人类数学家+AI"的混合模式率先突破。

适用边界与风险：

Vibe Coding：仅适用于个人或非关键业务场景，企业级应用需权衡安全、合规与责任归属
本地化部署：对成本敏感且有技术能力维护基础设施的团队有价值，但增加了运维复杂度
形式化验证：目前仅适用于数学和代码领域，向其他领域（如自然语言推理）的扩展仍在探索中
AI数学家的商业化：早期阶段，目标客户是需要"可证明保证"的关键行业（芯片、航空、医疗、加密货币）

实战陷阱：

勿将Vibe Coding的便捷性等同于生产就绪——直播中Joe提到的HR系统漏洞案例表明，缺乏形式化验证的AI生成代码可能引发严重安全事故
Token优化并非无代价——过度压缩上下文可能导致推理质量下降，需在成本与准确性之间找到平衡
警惕"AI末日论"与"AI万能论"两极——Karina强调AI与人类是协作关系而非竞争

5. 金句 (Golden Quotes)

“你只能将很少的东西发送给Claude和Codex以及Gemini——只需要你本地系统的精简表示。这样做能带来Token使用的巨大收益。我的Token使用量比之前下降了约30倍，因为可以在本地进行计算，而不必把所有东西都传到云端。"——Tim Davis（Modular）
“传统软件模式已死。你不可能再指望雇佣数百名销售代表，然后像过去十年那样以40%的年增长率销售传统软件——这种模式根本无法持续。"——Joe Floyd（Emergence Capital）
“做个人CRM可以放手去干。唯一会生气的就是你自己。但对于组织来说，这是非常困难的，因为数以千计的销售代表经过培训只能使用那一个特定的系统。你失去了所有这些——如果你用Vibe Coding自己搭建的话。"——Joe Floyd（Emergence Capital）
“数学就是代码，代码就是数学。通过将验证与生成相结合，我们可以构建一个真正强大的推理引擎，它能够自我改进——从数学开始，然后扩展到代码，再从代码到现实世界的物理验证。"——Karina Hong（Axiom）
“对人类困难的问题与对AI困难的问题可能非常不同。正因为这种差异，你实际上拥有一种AI与人类协作的折返机会。许多数学家正在将AI作为合作者——Axiom最近宣布了一系列从自然语言端到端验证的研究猜想，这可能是首次AI在研究级别上自动生成可自验证证明的案例。"——Karina Hong（Axiom）
“我认为AI是世界上有史以来最强大的通缩力量。大多数上市公司还没有看到任何好处。他们只看到人们攻击他们——初创公司攻击他们，或者Anthropic攻击他们。你能想象Salesforce能够将研发支出削减到什么程度吗？如果工程师的效率提升10倍，他们的净利润率可能会翻倍。"——Joe Floyd（Emergence Capital）

📺 视频原片

视频ID: 1HVTbejTUOo

📝 深度摘要#

1. 对话背景与核心主题#

1. 核心干货概览 (Technical Takeaways & Stack)#

2. 技术深度拆解与实战 SOP (Technical Deep Dive / SOP)#

模块一：MODLAR与本地化部署架构（Tim Davis / Modular）#

模块二：形式化数学与自验证AI（Axiom / Karina Hong）#

模块三：企业软件市场的AI冲击波（Joe Floyd / Emergence Capital）#

3. 核心干货运用 (Prompts & Configuration)#

4. 极客洞察与避坑指南 (Geek Insights & Boundary)#

5. 金句 (Golden Quotes)#

📺 视频原片#