原始标题: This is the WAY OF THE FUTURE

发布日期: 2026-01-26 | 来源频道: @DaveShap

📝 深度摘要

对话背景与核心主题

整个互联网似乎都对ClaudeBot感到疯狂。ClaudeBot是一个半自主的个人代理(personal agent),它的核心特点在于主动性——它会主动寻找任务来完成,而不是被动等待用户下达指令。这种主动性正是之前那些所谓"代理浏览器"所承诺但未能真正实现的能力。

与Anthropic和OpenAI推出的企业级代理浏览器不同,ClaudeBot是开源且激进的。它诞生于开源空间,核心理念是"使用风险自负"——如果它删除了你所有的邮件,或者帮你购买了一万张去大溪地的机票,那是你自己的问题。企业级产品必须设置重重安全护栏,而开源项目可以更自由地探索边界。

核心逻辑拆解

实现真正自主代理需要几个关键技术原语的成熟:

第一,模型能力:模型需要具备执行任务、解决问题和调用工具的能力。

第二,工具使用:模型能够使用JSON、调用API,甚至主动查找文档来学习如何使用不熟悉的API。

第三,记忆管理:这是最大的挑战之一。模型不仅要能完成任务,还要记住"应该做什么"和"这个用户需要什么"。早期的检索增强生成(RAG)只是原始的记忆汤,而递归语言模型提供了更结构化的记忆管理方案。

作者早在四年前就提出了自然语言认知架构(NLCA)的概念,其核心理念是将一切存入纯文本/ markdown,用任务规范文件(tasks.md)来管理代理的行为。这与ClaudeBot的实现方式非常相似。

方法论与工具箱

作者进一步提出了ACE框架(自主认知实体,Autonomous Cognitive Entity),这是一个更复杂的分层架构:

  1. 全局策略层:环境上下文和长期规划
  2. 代理模型:代理能做什么、不能做什么的自我认知
  3. 执行功能:风险、资源和计划管理
  4. 认知控制:任务选择和切换——当一个任务失败时,决定是放弃还是换一种方法尝试
  5. 任务执行层:具体执行API调用、计算、编写函数等

这个框架被比喻为公司的组织架构图,或一座办公楼的分层结构。不同的小代理各司其职,通过"北向总线"(反馈)和"南向总线"(命令控制)进行信息流通。

关键洞察与辩论

ClaudeBot缺少什么? 目前它缺少一个抱负层(Aspirational Layer)——也就是AI的"最高法院",用来判断行为是否符合使命、价值观和普世伦理。作者建议将启发式指令(Heristic Imperatives)作为这一层的基础,这是他研究道德、伦理、哲学和博弈论多年后提出的AI价值框架:

  • 减少宇宙中的痛苦:痛苦是有意义的(教导我们什么会伤害我们),但痛苦是无适应性的(没有目的)。减少痛苦是一个面向所有智能生命的亲社会、亲生命的方向。
  • 增加繁荣:繁荣(prosperity)来自拉丁语"prosperatoss",意为"活得好"——繁荣、蓬勃发展。这与"减少痛苦"形成平衡,否则一个无生命的地球反而会是最小化痛苦的最优解。
  • 增加理解:好奇心是人类的独特之处。对知识的渴求本身即是目的。但纯粹的好奇心可能具有破坏性(比如《星际迷航》中的星际观察者为了实验而伤害生命),所以用"增加理解"来规范它。

这三个价值形成了一个向量,驱动AI与人类保持一致。

金句

  • “这不是关于你能做什么,而是你应该做什么。”
  • “你不能事先决定一项技术会做什么——它会出现 emergent 能力。”
  • “当你构建一个思考引擎时,从执行任务到自主执行任务,中间隔着的只是’谁来指定任务’的问题。”
  • “开源运动相对于企业有一个独特的优势:我就是发布了,然后看会发生什么。”

📺 视频原片


视频时长: 21 分钟 | 视频ID: 2SBMsfU-XFo