原始标题: 2025 was the year of agents, what’s coming in 2026?

发布日期: 2026-01-09 | 来源频道: @practical-ai

📝 深度摘要

2025年是智能体元年,2026年将走向何方?

播客摘要

频道:Practical AI Podcast
时长:51分钟
日期:2026年1月9日
主持人:Daniel Whitenack(Prediction Guard CEO)、Chris Benson(洛克希德·马丁首席AI研究工程师)


开篇:2026年的AI展望

欢迎来到新一期的Practical AI Podcast。2026年已经到来,这是AI领域有史以来发展最快的一年。主持人Daniel Whitenack和Chris Benson回顾了2025年AI领域发生的重要变革,并展望了新一年的发展趋势。作为播客的老朋友,两位主持人在新年第一期节目中,以轻松但深刻的方式探讨了AI行业的现状与未来。

每年的年初,主持人都会尝试总结过去一年的重要事件,并对接下来的发展做出一些预测。正如他们在节目中承认的那样,以往的预测往往并不完全准确,但这并不妨碍他们对行业趋势的深入分析和对未来发展方向的洞察。


2025年:智能体(AI Agents)崛起之年

从模型到智能体的转变

主持人认为,2025年最显著的特征是从单纯讨论AI模型转向讨论AI智能体。在2025年之前,业界讨论的焦点主要集中在大型语言模型上;随后,讨论逐渐转向AI助手;而到了2025年,智能体(Agents)成为了绝对的主角。智能体是具有自主能力的AI系统,它们不仅能够生成内容,还能自主决策、执行任务并与外部系统交互。

Chris Benson指出,2025年围绕智能体出现了前所未有的 hype(炒作)。各种媒体报道、行业会议都在讨论智能体,声称它们将彻底改变企业的工作方式。然而,现实情况要比炒作复杂得多。Chris明确表示,他看到的所谓"70%的组织已经在使用AI智能体"这样的说法"完全是 BS(胡说八道)"。

企业在智能体探索中的真实状态

根据Chris的观察,当前企业的状态呈现出明显的两极分化。一方面,一些已经找到合适用例并能够看到成效的企业,正在其特定领域内取得令人惊叹的成果。这些企业通常是那些能够将智能体技术与自身业务需求紧密结合的公司。另一方面,还有大量企业正处于"迷茫"状态,它们到处都能看到关于智能体的讨论和研究,却不知道如何真正开始实施。

Chris进一步分析道,这种差异并不意味着一个企业比另一个更聪明,关键在于是否找到了正确的用例,是否有合适的人才来推动项目,以及是否有良好的商业案例来支撑投资。他强调,在智能体项目中取得成功需要多方面的配合:领域专业知识、技术能力、清晰的业务目标,以及足够的耐心来迭代和改进。

Andre Karpathy的观点与行业洞察

在讨论智能体的发展时,主持人提到了知名AI研究者Andre Karpathy在X平台上发布的一篇长文。Karpathy是AI领域备受尊敬的技术专家,曾在OpenAI和特斯拉担任重要职务。他在文章中承认,即使是他这样的专业人士,在面对AI快速变革时也感到有些"跟不上节奏"。

Karpathy特别提到了AI编程能力的惊人进步。在过去的几年里,AI模型在编程方面的表现一直不尽如人意,即使是最先进的模型也需要资深工程师不断修正其错误。然而,2025年底的情况发生了根本性变化。以OpenAI的Opus 4.5和5.2模型为代表的新一代模型,已经能够进行高级别的编程,且错误率极低。

Chris还提到一个令他自己这个Rust程序员感到兴奋的变化:之前AI模型在Rust编程方面的表现较差,因为Rust社区相对较小,训练数据不足。然而到了2025年底,AI在Rust编程方面的表现已经"大放异彩"(kicking butt)。Chris形容说,在过去两个月里,他的编程工作流程发生了翻天覆地的变化,他正在学习如何有效地使用编程智能体来提升自己的工作效率。


智能体应用的真实案例与经验

Daniel公司的实践经验

Daniel分享了他在 Prediction Guard 公司使用智能体的亲身经历。在最后一次董事会上,投资者们注意到一个令人惊讶的现象:在过去两个季度里,公司在团队规模没有扩大的情况下,产品开发进度比以往任何时候都要快得多。投资者们甚至专门提到了这一点——团队能够在不增加人员的情况下实现如此快速的产品迭代,这在此前是不可想象的。

Daniel强调,这些智能体工作流程的变革性效果是确实存在的,特别是当有相关领域知识的人来驱动这些系统时。这种变革是"乘数级的"(multiplicative),能够将一个人的能力放大到前所未有的程度。

Chris的"顿悟时刻"

Chris分享了他在假期期间的一次经历,这促使他给Daniel发短信说"天哪,我们必须在新年初讨论这个"。当时,Chris正在为公司推进一个复杂的自主项目。他花费了大量时间研究和思考这个项目的各个方面,并开发了一个非常详细、具体的提示(prompt),以确保项目能够达到生产级别的质量——这与一年前人们谈论的"AI垃圾代码"完全不同。

当Chris最终运行这个提示时,在短短六分钟内,AI就生成了他原本需要至少六周才能完成的工作成果。虽然Chris本人对所需内容有深入了解,也知道如何构建有效的提示,但这个结果仍然让他感到极度震惊。他形容这是他编程生涯中"最大的顿悟时刻"之一。

成功的关键:专业知识和持续学习

从Chris的经历中可以提取几个重要教训。首先,要成功地使用AI智能体,确实需要一定程度的专业知识。这包括如何提示和配置这些系统、如何连接数据源、如何利用MCP服务器、如何确定自动化的类型、如何将其集成到日常工作流程中等等。正如Karpathy所描述的那样,智能体就像一个强大的外星工具,但没有任何使用手册——每个人都需要自己摸索如何掌握和操作它。

其次,Daniel指出另一个常见失败原因:有些公司试图将自动化应用于本身就有问题的业务流程。AI并不能解决流程本身的问题,它只是放大现有流程的效率。如果流程本身是低效的或有缺陷的,AI只会更快速地产生低效或缺陷的结果。

Chris还强调了一个重要的学习过程:在最终成功生成那个复杂项目之前,他经历了"数百个提示"的反复试验。他给其他人的建议是:AI会为你打开新的门,但你必须自己走过这些门,从每次尝试中学习,然后用这些学习来构建更好的下一个提示。这种专业知识与AI能力的结合,使得能够用提示描述一个复杂的系统,让复杂的智能体模型能够在几乎生产就绪的模式中将其组合在一起。


多模态AI的发展现状

输入端多模态的普及

主持人还讨论了多模态AI的发展。Daniel认为,2025年初他们预测的多模态AI发展趋势确实已经实现——现在有大量的视觉语言模型、视频模型、音乐模型等各种多模态模型出现,如Sora等。

然而,Chris指出一个有趣的分化现象:在他接触的大多数商业场景中,多模态AI主要体现在输入端——也就是说,人们正在将视频、音频、图像和文本放入模型中进行处理。但在输出端,真正使用多模态输出的企业仍然相对较少。输出的形式仍然主要是文本,或者是一些结构化的文本形式(如JSON结构、工具调用、模板等)。

唯一显著的例外是语音合成,这种技术已经非常普及。Chris认为,当多模态输出能够与智能体结合时,将会产生更丰富的输出体验。想象一下,用户输入各种类型的信息,模型处理后产生的输出不仅包括文本,还包括实时语音对话和支持性的媒体内容——这将把AI体验提升到一个全新的水平。


推理时代(Reasoning Era)的到来

什么是推理模型?

2025年另一个重要的发展是推理模型(Reasoning Models)的兴起。Daniel解释说,推理模型这个名称实际上有些误导——它们并不是真正在"推理"任何东西,而只是生成模仿或模拟推理过程的文本片段。这些模型通过生成代表思考过程的文本来"解决"问题,然后生成最终答案。这种方法已被证明在处理更复杂的任务方面非常有效,可能实现比以往更复杂的编排或动态工作流程。

当前发布的大多数LLM模型要么是纯粹的推理模型——它们总是以这种方式进行推理,生成推理令牌然后输出常规令牌;要么是条件性推理模型或混合模型,它们只在某些时候进行推理而在其他时候不进行。

推理模型的代价

然而,Chris指出推理模型存在一个显著的问题:延迟。在实际业务应用中,如果你已经精心设计了自己的工作流程,你可能真的不想要那些推理令牌,因为它们会大大增加等待时间。这些后期模型的推理令牌会引入大量的延迟,让人感到烦恼。

Daniel补充说,当你考虑到这些模型是流式输出时,问题的严重性就更加明显了。每生成一个令牌就是模型的一次推理运行。这意味着如果你生成2000个推理令牌,就意味着在昂贵的GPU上运行了2000次推理。他同意这在总体上是件好事——他们确实处于推理时代,看到这些模型的兴起令人兴奋,但天下没有免费的午餐,延迟的增加是一个真实的代价。

消费者选择与成本考量

Chris进一步指出,这种延迟问题某种程度上是模型提供商有意或无意造成的(很可能是前者)。以ChatGPT为例,用户可以在网页界面上选择"即时"或"思考"模式。当然,每个人都想要"思考"模式,而选择"思考"后还有"标准思考"或"深度思考"选项。这种设计利用了人类"越多越好"的心理倾向,但正如Chris所指出的,深度思考的代价——从电力消耗的角度来看——要高得多。

这引出了另一个2025年底的热门话题:电力限制。多年来,业界一直在讨论GPU供应不足是AI发展的限制因素。而现在,电力成为了新的瓶颈。每次以"推理模式"进行的提示消耗的电力都大大增加,而这最终会转化为成本。Chris提到,他们最近经常在新闻中看到关于电力消耗的讨论。


基础设施、硬件与能源挑战

能源问题成为新焦点

话题转向了基础设施和能源问题。Daniel分享了几个他亲身经历的 anecdotes:他在科罗拉多矿业学院的同学们现在在能源行业工作,他们告诉他,现在有很多投机者在四处活动,试图购买和获得那些相对较新但由于人们从煤炭转向而被关闭的发电厂的权利。这些人预计,随着AI发展需要更多电力,这些发电厂将不得不重新启动。

另一个例子是Daniel所在地区(拉斐特/西拉斐特)的一个芯片组装厂项目。这是一个数十亿美元的投资,但同时也引发了社区的争议和反弹——有人支持,也有人反对。Daniel认为有趣的是,在中国,如果想要在AI领域占据主导地位,需要大量发电厂,决策过程会简单得多——政府会直接在那里建设发电厂。

地缘政治与AI权力

Daniel指出,这种动态已经渗透到地缘政治和环境中。权力和AI、芯片制造、岸上生产等话题正在推动政策对话。无论人们对此持何种立场,有一点是明确的:每个国家都在追求越来越强的电力消耗能力来支持AI增长,这在世界各国都引发了有趣的动态。

Chris补充道,现在有些国家正在"入侵其他国家并夺取石油",这在不久以前是难以想象的。但现在电力成为人们谈论的焦点,因为AI发展需要电力。无论在什么情况下,AI都正在成为推动这些政策决策的动机。

两位主持人都认为,AI已经不再是政策讨论的边缘话题,而是正在成为核心议题。在2024年底,政府还在讨论如何"监管AI";而到了2025年底,AI已经反过来驱动关键的政策决策。


预测性AI与生成性AI的融合

被忽视的预测性AI

在讨论2025年的趋势时,Daniel强调了一个经常被忽视的领域:预测性AI(Predictive AI)。他指出,在最近的另一期节目中,他们提到一个重要趋势:生成性AI模型在基于Transformer架构上已经趋于 plateau( plateau),但预测性模型仍在快速进步。

对于不熟悉这些术语的听众,Daniel解释說:生成性AI模型(如大型语言模型、视觉语言模型等)生成令牌或图像等输出;而预测性或区分性模型则进行分类预测、预测等任务。现实中,这些预测性模型在各个行业仍然持续提供惊人的投资回报率(ROI),并且还在不断改进。围绕这些模型的工具实际上也在变得越来越好。

自动机器学习的新篇章

Daniel提到,多年前业界讨论过"自动机器学习"(AutoML)这个概念——即自动化AI或统计模型的参数化,帮助我们更快更好地创建模型。现在的情况实际上更加有趣:每个人都在谈论生成性AI,但人们开始意识到,可能存在更好的"增强分析"或"增强ML"的方式——即使用高度复杂的工具,无论是用于SQL查询的非生成性AI模型、时间序列预测模型,还是数据科学工具,现在都可以作为工具集成到生成性AI模型中,由后者来编排和协调它们的使用。

例如,你可以将电商数据存储在SQL数据库中,有一个使用Facebook Prophet进行时间序列预测的工具,然后生成性AI模型可以调用这些工具,从SQL数据库中提取正确的数据,用生成的代码格式化数据,发送到擅长时间序列建模的预测工具,然后为你生成2026年销售预测。

Daniel认为,真正有趣的是,所有这些讨论实际上都是关于那个"编排器"模型的,而不是关于其他被集成的工具。因为实际上是那些被集成到编排器中的工具才创造了真正的乘数效应和系统的力量。

Chris完全同意这一观点,并认为这将在物理AI(Physical AI)的未来中进一步放大。当这些编排器与围绕它们的工具相结合,当预测性模型现在通过智能体系统被赋能时,存在着巨大的能力,而公众可能还没有意识到这一点——他们看到无人机和机器人,但没有真正理解这些技术是如何实现的。

超越Transformer的局限

Chris提到,一个标志性的事件是AI领域所谓的"三教父"之一Yann LeCun离开了Meta。LeCun在Meta(约十年)期间倡导的一个观点是Transformer架构存在局限性。随着AI行业许多人开始关注"世界模型"(World Models)来推动发展,Chris认为,预测能力与智能体的结合将真正推动许多领域的进步——不仅是他刚才谈到的工具能力,还有物理AI领域。

因此,Chris预测,我们可能会在这些领域看到某种"复兴",因为人们开始意识到:“受够了生成性AI。它确实很棒,但我现在终于能看到它的局限和天花板了。”


2026年的关键技术趋势预测

MCP服务器与工具集成:AI工程的新角色

在展望2026年时,Daniel提出了一个重要预测:那些能够构建MCP服务器、将工具连接到模型、真正架构智能体系统的人才——无论使用什么模型——将变得极其有价值。

Daniel强调,这就是如何让智能体项目避免失败的方式。那些能够提出一组服务——MCP服务器、数据库、RAG系统——并知道如何将它们连接到编排层以使其可用的人,正在形成一种 highly valuable 的角色。他认为这个角色将持续存在很长时间,因为需要连接的东西在企业内部是如此复杂,以至于这种AI集成和工具开发、工具集成的技能在相当长的时间内不会消失。

Chris完全同意,并补充说,把所有这些整合在一起的"秘诀"是学会如何很好地使用你现有的工具,通过提示创建工作流程,让这些工具为你启动所有这些系统。所以你不需要独自承担一切——你是位于伟大AI智能体交响乐中心的指挥家,你必须学会指挥那些智能体来产生比去年多得多的问题。Chris认为这是一个可以实现的目标,但这是一组离散的技能,需要很大的灵活性,并且需要走出你的舒适区去尝试非常不舒服的事情。

物理AI与消费者AI时代的来临

Chris对2026年做出了一个具体预测:我们将开始看到消费者级别的AI maker era(创客时代)的到来。随着我们进入物理AI时代,各种智能体平台将在我们周围运行,大型和小型的模型都参与其中,过去成本高得让人望而却步的情况正在改变。GPU和ASIC(专用集成电路)等技术使得AI能力的价格大大降低,可以嵌入到更小的设备中。你和你的孩子将去商店购买能够实现去年根本无法想象的东西——这些在家庭预算范围内是可行的。

Chris认为,这不再只是商业或工业或军事级别的兴趣,而是消费者现在可以获取的东西。随着基于这些技术的新玩具出现并教育孩子们,这将为你家中开辟一个全新的能力范围。你会看到消费电子产品以更低的价格反映这一点——你可能不仅拥有扫地机器人,还会有许多非常 specific(特定任务)的小机器人进入你的生活。如果你在当地商店或网上找不到这个东西,你可以用你的创客工具包自己制作,因为那正在成为现实。

模型商品化与系统复杂性

Daniel的预测更加务实。他认为,首先,模型已经被商品化得非常厉害。前沿模型的性能提升已经趋于平稳。开源模型基本上已经赶超。所以现在不再是"拥有最好的模型"的竞争——这已经变得不那么重要了。重要的是灵活性,是避免被锁定,是能够使用多种不同的模型,是构建系统的方式。

其次,Daniel认为生态系统的碎片化和复杂性会持续到2026年——在这方面不会有太多整合。他说,现在不再是"我要获得最好的模型,我的公司就有了AI,我就为未来做好了准备"——获得一个模型是最简单的事情。你可以在手机上、在笔记本电脑上运行一个模型——这不代表什么。困难的是说"好的,我需要一个系统来做这个"——现在我需要所有这些工具,我需要以某种方式连接它们。这变得极其复杂。我需要它合规,需要它在受监管的行业工作,这变得极其复杂。我需要接入这种或那种数据,更多复杂性。

Daniel举了一个具体的例子:他试图在Azure AI中构建符合NIST 601标准(美国国家标准与技术研究院发布的安全AI标准)的系统。结果发现,他需要使用Azure的9种不同服务才能达到39%的合规性。要管理所有这些不同的服务、所有这些不同的东西变得非常复杂,需要大量的人力来完成。

因此,Daniel认为这个领域的赢家将是那些能够向客户说明"与其启动Azure上的37个不同东西并雇用10个人来管理它,这里有一个整合的、快速实现价值的方式让你获得X或Y"的公司——无论是垂直化的AI解决方案、安全AI解决方案,还是其他什么。


量子计算与未来展望

关于量子计算与AI的结合,Chris表示他不认为量子计算已经达到了能够产生实际成果的阶段。他补充道,虽然他相当关注量子计算领域,但人们说"你总是离实用还有10年"——他们目前确实还没有到达那个阶段。

Chris更愿意将注意力放在他认为是2026年真正会发生变化的地方:随着物理AI时代和各种智能体平台的到来,各种规模的模型参与其中,普通人参与AI的门槛正在大幅降低。GPU和ASIC等技术使得AI能力的价格变得更加亲民,这将为消费者市场带来全新的可能性。


总结:2026年AI领域的关键主题

这期新年特别节目涵盖了AI领域的广泛主题。主持人通过对2025年的回顾和2026年的展望,为听众提供了深刻的行业洞察。

2025年的关键收获

  1. 智能体元年:2025年标志着AI从模型到智能体的重大转变,虽然炒作与现实之间存在差距,但真正找到用例的企业已经看到了变革性的成果。

  2. 编程能力的突破:AI编程能力在2025年底实现了质的飞跃,特别是在高级编程任务中表现出色。

  3. 推理时代的到来:推理模型带来了更强的能力,但也带来了延迟和成本的新挑战。

  4. 能源成为新瓶颈:GPU供应问题让位于电力供应问题,这已经影响到地缘政治和政策决策。

  5. 多模态的不平衡发展:多模态AI在输入端已经普及,但在输出端仍有很大发展空间。

2026年的预测与建议

  1. 工具集成技能的价值:能够架构MCP服务器、连接各种工具到AI系统的人才将变得极其珍贵。

  2. 消费者AI创客时代的开始:AI能力将进入消费级设备,为普通人带来前所未有的可能性。

  3. 系统复杂性管理:在模型能力不再是瓶颈的时代,如何管理AI系统的复杂性将成为核心竞争力。

  4. 垂直化解决方案的机会:面对碎片化的AI生态系统,能够提供整合解决方案的公司将获得优势。

  5. 物理AI的融合:预测性AI与生成性AI的结合将为物理世界带来更多AI应用。

正如Daniel在节目结束时所说,2026年将是AI领域又一个疯狂但充满机遇的年份。对于从业者来说,关键在于持续学习、勇于尝试,并找到将AI能力与自身领域专业知识相结合的最佳方式。


感谢您收听Practical AI Podcast。如欲了解更多信息,请访问practicalai.fm,并在LinkedIn、X或Blue Sky上关注我们。


📺 播客地址


播客时长: 52分钟