原始标题: Business Solves Problems Faster

发布日期: 2026-01-15 | 来源频道: @ai-in-business-v2

📝 深度摘要

🎙️ 本期头条:AI 在数学领域重大突破——从「解题」到「创造新方法」,已解决 15 道长期未解数学难题

💡 商业洞察与深度拆解

  • AI 纠正人类数学错误,创造新算法:前 Google X 高管 Mo Gaudet 在演讲中透露,他让 AI 优化自身代码时,AI 意外发现其使用了 56 年的矩阵乘法方法存在缺陷。更令人震惊的是,AI 没有简单优化现有代码,而是发明了一种全新的数学计算方法,最终实现了 26% 的性能提升,为 Google 节省了数百万美元的成本和能源消耗。这一事件意义重大:AI 不再仅仅是执行人类指令的工具,而是能够自主发现并纠正人类长期忽视的数学错误,甚至创造全新的算法路径。

  • GPT-5 Pro 首次完全解决顶级数学难题:根据 Bartosz Nasrekki 在 X 上的推文,GPT-5 Pro 在无需任何互联网搜索的情况下,仅用 15 分钟就解决了名为「Yut Samarutsu 第 554 号问题」的著名数学难题。这是首个完全解决该任务的模型,展示了模型在初等抽象代数推理方面的强大能力。这标志着 AI 在数学推理领域的又一次质的飞跃。

  • AI 数学定理证明器满分夺冠:Didi 发布的推文显示,AI 在被誉为「世界最难数学竞赛」的 Pootman 竞赛中取得了满分(120/120 分)。该竞赛共有 12 道题目,每题 10 分,去年最高分仅为 90 分,而中位数更是零分。Axiom 的 AI 证明器在 Lear 环境中获得满分并公布了所有解题方案。这一里程碑事件证明了 AI 在数学竞赛级别的问题解决上已经超越人类最顶尖的选手。

  • 开源数学难题被批量攻克:软件工程师、前量化交易员 Neil Somani 测试了 OpenAI 最新模型解决未解决数学问题的能力。他将一道未解数学难题输入 ChatGPT,15 分钟后模型给出了解题方案。Somani 使用在线验证工具 Harmonic 对答案进行检验,结果显示答案完全正确。更令人惊叹的是 AI 的推理过程:它首先研究了勒让德公式、贝特朗 postulate 和大卫之星定理,然后找到了一位哈佛数学家 Noam Eliksiz 在 2013 年发表的数学Overflow 帖子(虽然解决的是相关问题而非同一问题),随后没有简单复制该解法,而是采用了完全不同的方法,最终给出了更加完整的答案,并与 20 世纪最具影响力的数学家保罗·埃尔德什的相关工作产生了联系。

  • 数学难题攻克进入加速期:自圣诞节以来,Iridos 列表(包含一千道未解数学问题的著名清单)上有 15 道难题从「未解决」状态变为「已解决」。其中 11 个已发表解决方案明确提到了 AI 工具的参与。这意味着 AI 辅助或完全独立解决的数学难题占比高达 73%,AI 正在以前所未有的速度推动数学领域的发展。

  • ** Terence Tao 观点:AI 尚未完全取代数学家,但已带来巨变**:世界顶级数学家陶哲轩(Terrence Tao)密切关注 AI 进展,他指出 AI 系统在多种情况下能够自主产生有意义的新想法,而在其他情况下则通过发现相关过去研究来帮助人类推进解题进程。陶哲轩还指出,AI 可能特别擅长处理那些不太知名、被忽视的数学问题,因为这些问题并非无解,而是缺乏足够的人类专家关注。AI 系统可以非常系统化地进行工作,不会有「疲劳」问题,能够遍历数千种可能性。

🛠️ AI 实战与案例(主持人经验分享)

  • 主持人 Jaden 提到他在日常使用 AI 的过程中,明显感觉到 AI 正在变得「惊人地好」,而且改进速度非常快。他认为这不仅是因为模型本身在变好,更大程度上是因为人们为模型添加的各种工具和工程化手段。他强调 AI 仍然需要人类来指明方向——AI 本身不会自动满世界去解决数学问题,需要人类告诉它要解决什么问题。

  • 主持人推荐了 AIbox.ai 平台,该平台允许用户无需编码即可构建 AI 工具。用户只需通过提示词描述想要构建的工具,平台就会自动链接各种 AI 模型、设置提示词并生成可用的工具。他提到有人创建了一个「圣经故事图形小说生成器」,这是一个非常酷的工具。

📈 趋势展望

  • AI 推理能力范式转变:AI 在数学领域的突破不仅仅是解决更多问题那么简单的数量变化,而是出现了质的转变——从「更好地解决人类已知方法的问题」进化到「发现人类方法中的错误并创造全新解法」。这意味着 AI 不再是单纯的计算工具,而是开始具备真正的推理和创新能力。

  • 数学证明验证工具崛起:传统的数学证明使用自然语言编写,往往隐藏着各种小错误或不清晰的步骤。新型软件工具(如 Harmonic)能够将数学论证翻译成精确格式进行自动验证。AI 系统在这类工具的辅助下,能够更快地确认结果并在此基础上构建新的证明。这种「AI 推理 + 自动化验证」的组合正在大幅加速数学研究的进程。

  • 跨领域应用前景广阔:正如 Harmonic 创始人 Tudor Archimic 所言,真正重要的信号不是解决了多少问题,而是严肃的数学和计算机科学教授是否愿意使用这些工具——这些人的职业生涯依赖于严谨性和可信度,当他们也开始依赖 AI 工具时,说明 AI 的能力已经得到顶级专业人士的认可。这种 AI 推理能力将远超数学领域,可以应用于工程、经济、医学、科学等各个领域。当 AI 系统更擅长探索想法、验证工作和连接过去知识时,这些领域的研发创新都将被大幅加速。

🔗 提到的关键工具/公司

  • ChatGPT 5.2(OpenAI)
  • GPT-5 Pro(OpenAI)
  • Axiom AI Prover(Axiom)
  • Harmonic(数学证明验证工具)
  • AIbox.ai(主持人推荐的 AI 工具构建平台)
  • Iridos 问题列表(数学难题数据集)
  • Google(AI 优化案例)

📺 播客地址


播客时长: 13分钟