原始标题: Can a Claude Code AI Agent CRUSH The Predictions Market? Let’s Find Out

发布日期: 2026-02-20 | 来源频道: @AllAboutAI

📝 深度摘要

AI 智能体架构与自主开发实战笔记

1. 对话背景与核心主题

本次演示来自 AllAboutAI 频道的 Matt，他是一位专注于 AI 智能体工作流与自动化实战的技术博主。视频核心主题为：验证 Claude Code 是否能够在预测市场（Poly Market）上实现自主交易并“碾压”预测结果。Matt 希望通过一小时的实际交易演示，展示 AI 智能体如何独立完成市场分析、决策执行与仓位管理的完整闭环，同时探索“无人值守”交易系统的工程可行性。

2. 核心干货概览 (Agentic Stack & Assets)

类别	名称	核心用途 / 技术意义
核心 AI 代理	Claude Code (Cloud Code Opus)	承担自主决策核心大脑，负责信号分析、交易策略生成与浏览器操作控制
自动化/触发工具	Browser-based Automation + Skills	通过 skill 机制定义 Poly Market 操作 SOP，实现 24/7 自主运行的执行层
集成技能/MCP	Poly Market Skill (skill.md) + Binance Websocket	扩展代理的外部操作能力：前者负责页面导航与交易执行，后者提供实时价格与清算数据

3. 智能体架构与 SOP (Architecture & Implementation Deep Dive)

环境搭建与初始化

Matt 在 Mac Mini 上部署了 Claude Code 环境，并创建了 Poly Market 专用 skill 文件（位于 Poly Market/skill.md）。该 skill 包含了针对 Poly Market 界面的导航指令集，使代理能够自主完成页面加载、市场选择、下单确认等操作。此外，他配置了 Binance Websocket 实时数据流，用于获取比特币实时价格与清算信息，为策略执行提供数据支撑。

在本地硬件方面，Matt 演示了使用 AMD Ryzen AI Pro 芯片笔记本电脑运行本地开源模型的能力。他测试了 GPUS OSS 20B 模型（推理速度约 50 tokens/秒）以及 Qwen Coder 30B 编程模型，均可在本地无网络环境下运行 AI 工作流，体现了离线部署的可行性。

自主运行逻辑链 (The Loop)

整个交易循环遵循以下闭环逻辑：

信号采集：通过 Binance Websocket 获取实时价格，与目标价位对比；读取 Poly Market 侧边栏的公众共识、动量指标、短期趋势与人群仓位数据（共 7 种信号）。
策略决策：基于信号生成交易方向（买涨/买跌）与仓位大小。核心策略为“前置加载”（frontload）——不当前 5 分钟窗口下注，而是跳转到下一窗口以获取更优价格。
执行操作：代理通过浏览器自动化点击 Poly Market 界面，完成下单、确认、Claim 奖金等操作。
结果反馈：5 分钟窗口结束后，系统自动判定盈亏，更新账户余额，并进入下一轮循环。
自适应调整：在演示过程中，Matt 指示代理“学习并创建新策略”，代理基于历史数据生成了名为"Fade the Swing"的反向交易策略。

实战案例还原 (Use Cases)

视频演示了完整的 1 小时比特币 5 分钟涨跌预测交易：

初始资金 Claim：在视频开始时 Claim 了账户中的 $37。
第一笔交易：代理在最后一秒下单 $1 买涨，市场意外反转，最终获得 $9 收益（960% 回报率）。
中期表现：连续多次亏损后，Matt 指示代理自主优化策略，代理提出了“反向侧边栏”激进策略（3-5-8 美元递增仓位）。
最终结算：1 小时交易结束后，总收益约为 $4.30，账户整体市值有所下降但实现了正向回报。

细节支撑

在实际运行中遇到了若干技术问题：代理在窗口切换时存在延迟，Matt 不得不启用"dangerously skip"模式以跳过安全检查确保流程连续；此外，策略执行存在随机性，代理有时会连续下注 3 次 $1 而非按计划执行单一交易。

4. 核心执行资产 (CLI Commands & Prompts)

指令集还原

视频中展示的关键操作指令（根据视频描述推断）：

使用 skill polyarket 加载 Poly Market 交易技能
通过自然语言指令触发交易循环：“do 1 hour of 5 minute Bitcoin trades”
使用 “dangerously skip” 模式绕过安全检查确保自动化流程不中断
实时监控 Binance Websocket 数据流获取价格信号

系统提示词策略

Matt 通过自然语言对话引导代理自主决策，例如：

“请进行 1 小时交易并进行关键点总结”
“请基于已收集的数据创建新的交易策略，增加更多风险敞口”
“思考并提出创造性的策略设计”

代理在收到指令后自主分析历史交易数据、生成新策略（如"Fade the Swing"策略：反向人群趋势交易，当市场过度乐观时押注反转），并自动执行。

5. 开发者进阶洞察 (Vibe Coding Insights & Boundary)

Vibe Coding 核心心法

Matt 在演示中强调的核心心法为“写指令而非写代码”——他无需编写复杂的交易算法，而是通过自然语言描述交易目标和约束条件，由 Claude Code 自主解析并生成执行路径。skill 机制本质上是将领域知识封装为可复用的指令模块，使非技术人员也能通过描述性语言驱动复杂的自动化流程。

自主性风险预警

视频中暴露了若干关键风险点：

策略无效风险：Matt 明确表示当前的交易策略“没有优势”（no edge），本质上等同于赌博，无法保证长期盈利能力。
时序依赖风险：代理对时间窗口的判断存在误差，可能错失最佳下单时机或提前进入下一窗口。
资金管理风险：在演示的后半段，代理采用了“3-5-8”递增仓位策略，若连续亏损可能导致账户快速归零。

实战陷阱

浏览器自动化不稳定：代理在执行交易时偶尔出现操作异常（如一次性下注多次），需要人工干预。
市场流动性风险：在测试中观察到 $1 的小额交易也可能影响市场价格（“could change the price a bit”）。
模型幻觉风险：代理在解释交易理由时可能产生看似合理但实际无效的逻辑，Matt 评价“它会给出它为什么要这么做的理由”。

6. 金句

“看着代理自己下注、自己解释为什么要这么做，这个过程真的太有意思了。”
“这基本上就是在赌博，但我真的非常喜欢看 AI 自己去做决定、执行交易的样子。”
“这个策略没有任何优势，只是为了乐趣和测试系统的自主运行能力。”
“我对 Claude Code 导航 Poly Market 并执行交易的能力印象非常深刻，虽然有一些小问题，但整体表现远超预期。”

总结

本次演示验证了 Claude Code 在预测市场场景下的自主交易能力边界：代理能够独立完成信号采集、策略决策、浏览器操作与结果反馈的完整闭环，实现了“无人值守”的交易执行。然而，Matt 也坦诚指出当前策略缺乏实际优势，AI 智能体在金融市场的长期盈利能力仍有待验证。更重要的是，这场实验展示了 AI Agent 在复杂网页交互、实时数据处理与自主决策方面的工程潜力，为“vibe coding”范式下的智能体应用提供了实战参考。

📺 视频原片

视频ID: yqr2qoTcMPk

📝 深度摘要#

AI 智能体架构与自主开发实战笔记#

1. 对话背景与核心主题#

2. 核心干货概览 (Agentic Stack & Assets)#

3. 智能体架构与 SOP (Architecture & Implementation Deep Dive)#

环境搭建与初始化#

自主运行逻辑链 (The Loop)#

实战案例还原 (Use Cases)#

细节支撑#

4. 核心执行资产 (CLI Commands & Prompts)#

指令集还原#

系统提示词策略#

5. 开发者进阶洞察 (Vibe Coding Insights & Boundary)#

Vibe Coding 核心心法#

自主性风险预警#

实战陷阱#

6. 金句#

总结#

📺 视频原片#