ARC AGI

GPT-5通过Poetic元系统首次突破ARC AGI 2抽象推理基准测试，达到人类水平（75% vs 60%），证明“解除束缚”（unhobbling）路线可行。该理论由前OpenAI研究员Leopold Aschenbrener提出，指出AI模型虽具备强大原始能力，但被束缚在限制性范式中——如要求复杂数学问题立即给出答案，而非像人类那样逐步推理。Poetic的元系统在底层模型上增加“管理器AI”，负责选择模型、分解问题步骤并自我检查进度。Gemini 3 Pro经三轮解除束缚调整后也从30%提升至超越人类水平。Aschenbrener预测到2027年AI将从聊天机器人进化为具备代理能力的“协作者”，而François Chollet警示即使通过ARC AGI测试也不代表实现通用智能，当前AI仍依赖人类提供的问题结构。