原始标题: Can a Claude Code AI Agent CRUSH The Predictions Market? Let’s Find Out
发布日期: 2026-02-20 | 来源频道: @AllAboutAI
📝 深度摘要
AI 智能体架构与自主开发实战笔记
1. 对话背景与核心主题
本次演示来自 AllAboutAI 频道的 Matt,他是一位专注于 AI 智能体工作流与自动化实战的技术博主。视频核心主题为:验证 Claude Code 是否能够在预测市场(Poly Market)上实现自主交易并“碾压”预测结果。Matt 希望通过一小时的实际交易演示,展示 AI 智能体如何独立完成市场分析、决策执行与仓位管理的完整闭环,同时探索“无人值守”交易系统的工程可行性。
2. 核心干货概览 (Agentic Stack & Assets)
| 类别 | 名称 | 核心用途 / 技术意义 |
|---|---|---|
| 核心 AI 代理 | Claude Code (Cloud Code Opus) | 承担自主决策核心大脑,负责信号分析、交易策略生成与浏览器操作控制 |
| 自动化/触发工具 | Browser-based Automation + Skills | 通过 skill 机制定义 Poly Market 操作 SOP,实现 24/7 自主运行的执行层 |
| 集成技能/MCP | Poly Market Skill (skill.md) + Binance Websocket | 扩展代理的外部操作能力:前者负责页面导航与交易执行,后者提供实时价格与清算数据 |
3. 智能体架构与 SOP (Architecture & Implementation Deep Dive)
环境搭建与初始化
Matt 在 Mac Mini 上部署了 Claude Code 环境,并创建了 Poly Market 专用 skill 文件(位于 Poly Market/skill.md)。该 skill 包含了针对 Poly Market 界面的导航指令集,使代理能够自主完成页面加载、市场选择、下单确认等操作。此外,他配置了 Binance Websocket 实时数据流,用于获取比特币实时价格与清算信息,为策略执行提供数据支撑。
在本地硬件方面,Matt 演示了使用 AMD Ryzen AI Pro 芯片笔记本电脑运行本地开源模型的能力。他测试了 GPUS OSS 20B 模型(推理速度约 50 tokens/秒)以及 Qwen Coder 30B 编程模型,均可在本地无网络环境下运行 AI 工作流,体现了离线部署的可行性。
自主运行逻辑链 (The Loop)
整个交易循环遵循以下闭环逻辑:
- 信号采集:通过 Binance Websocket 获取实时价格,与目标价位对比;读取 Poly Market 侧边栏的公众共识、动量指标、短期趋势与人群仓位数据(共 7 种信号)。
- 策略决策:基于信号生成交易方向(买涨/买跌)与仓位大小。核心策略为“前置加载”(frontload)——不当前 5 分钟窗口下注,而是跳转到下一窗口以获取更优价格。
- 执行操作:代理通过浏览器自动化点击 Poly Market 界面,完成下单、确认、Claim 奖金等操作。
- 结果反馈:5 分钟窗口结束后,系统自动判定盈亏,更新账户余额,并进入下一轮循环。
- 自适应调整:在演示过程中,Matt 指示代理“学习并创建新策略”,代理基于历史数据生成了名为"Fade the Swing"的反向交易策略。
实战案例还原 (Use Cases)
视频演示了完整的 1 小时比特币 5 分钟涨跌预测交易:
- 初始资金 Claim:在视频开始时 Claim 了账户中的 $37。
- 第一笔交易:代理在最后一秒下单 $1 买涨,市场意外反转,最终获得 $9 收益(960% 回报率)。
- 中期表现:连续多次亏损后,Matt 指示代理自主优化策略,代理提出了“反向侧边栏”激进策略(3-5-8 美元递增仓位)。
- 最终结算:1 小时交易结束后,总收益约为 $4.30,账户整体市值有所下降但实现了正向回报。
细节支撑
在实际运行中遇到了若干技术问题:代理在窗口切换时存在延迟,Matt 不得不启用"dangerously skip"模式以跳过安全检查确保流程连续;此外,策略执行存在随机性,代理有时会连续下注 3 次 $1 而非按计划执行单一交易。
4. 核心执行资产 (CLI Commands & Prompts)
指令集还原
视频中展示的关键操作指令(根据视频描述推断):
- 使用
skill polyarket加载 Poly Market 交易技能 - 通过自然语言指令触发交易循环:“do 1 hour of 5 minute Bitcoin trades”
- 使用 “dangerously skip” 模式绕过安全检查确保自动化流程不中断
- 实时监控 Binance Websocket 数据流获取价格信号
系统提示词策略
Matt 通过自然语言对话引导代理自主决策,例如:
- “请进行 1 小时交易并进行关键点总结”
- “请基于已收集的数据创建新的交易策略,增加更多风险敞口”
- “思考并提出创造性的策略设计”
代理在收到指令后自主分析历史交易数据、生成新策略(如"Fade the Swing"策略:反向人群趋势交易,当市场过度乐观时押注反转),并自动执行。
5. 开发者进阶洞察 (Vibe Coding Insights & Boundary)
Vibe Coding 核心心法
Matt 在演示中强调的核心心法为“写指令而非写代码”——他无需编写复杂的交易算法,而是通过自然语言描述交易目标和约束条件,由 Claude Code 自主解析并生成执行路径。skill 机制本质上是将领域知识封装为可复用的指令模块,使非技术人员也能通过描述性语言驱动复杂的自动化流程。
自主性风险预警
视频中暴露了若干关键风险点:
- 策略无效风险:Matt 明确表示当前的交易策略“没有优势”(no edge),本质上等同于赌博,无法保证长期盈利能力。
- 时序依赖风险:代理对时间窗口的判断存在误差,可能错失最佳下单时机或提前进入下一窗口。
- 资金管理风险:在演示的后半段,代理采用了“3-5-8”递增仓位策略,若连续亏损可能导致账户快速归零。
实战陷阱
- 浏览器自动化不稳定:代理在执行交易时偶尔出现操作异常(如一次性下注多次),需要人工干预。
- 市场流动性风险:在测试中观察到 $1 的小额交易也可能影响市场价格(“could change the price a bit”)。
- 模型幻觉风险:代理在解释交易理由时可能产生看似合理但实际无效的逻辑,Matt 评价“它会给出它为什么要这么做的理由”。
6. 金句
- “看着代理自己下注、自己解释为什么要这么做,这个过程真的太有意思了。”
- “这基本上就是在赌博,但我真的非常喜欢看 AI 自己去做决定、执行交易的样子。”
- “这个策略没有任何优势,只是为了乐趣和测试系统的自主运行能力。”
- “我对 Claude Code 导航 Poly Market 并执行交易的能力印象非常深刻,虽然有一些小问题,但整体表现远超预期。”
总结
本次演示验证了 Claude Code 在预测市场场景下的自主交易能力边界:代理能够独立完成信号采集、策略决策、浏览器操作与结果反馈的完整闭环,实现了“无人值守”的交易执行。然而,Matt 也坦诚指出当前策略缺乏实际优势,AI 智能体在金融市场的长期盈利能力仍有待验证。更重要的是,这场实验展示了 AI Agent 在复杂网页交互、实时数据处理与自主决策方面的工程潜力,为“vibe coding”范式下的智能体应用提供了实战参考。
📺 视频原片
视频ID: yqr2qoTcMPk