这个测试旨在阻止AI——GPT-5终于通过了

GPT-5通过Poetic元系统首次突破ARC AGI 2抽象推理基准测试,达到人类水平(75% vs 60%),证明“解除束缚”(unhobbling)路线可行。该理论由前OpenAI研究员Leopold Aschenbrener提出,指出AI模型虽具备强大原始能力,但被束缚在限制性范式中——如要求复杂数学问题立即给出答案,而非像人类那样逐步推理。Poetic的元系统在底层模型上增加“管理器AI”,负责选择模型、分解问题步骤并自我检查进度。Gemini 3 Pro经三轮解除束缚调整后也从30%提升至超越人类水平。Aschenbrener预测到2027年AI将从聊天机器人进化为具备代理能力的“协作者”,而François Chollet警示即使通过ARC AGI测试也不代表实现通用智能,当前AI仍依赖人类提供的问题结构。

January 1, 2026 · 6 min · 2526 words · AIcan