GPT 5.4 来了:我们或许有了全球最强模型
OpenAI 发布 GPT 5.4 系列旗舰模型,整合推理、编码与代理工作流于单一模型。在 OSWorld 基准测试中达 75% 准确率,仅需 15 次工具调用即可完成任务,效率较 GPT 5.2 提升约 3 倍。支持 100 万 Token 上下文窗口,可直接操作计算机执行复杂任务。模型可通过 Playwright 库操控浏览器、读写文件与执行命令,实现 Gmail 自动化、批量数据录入及游戏生成等功能。该系列包含 Thinking 与 Pro 两版本,Prompt 策略与 Opus/Claude 模型存在本质差异,需分别优化模板。Thinking 版本性价比突出,已可满足大多数应用场景。