新ChatGPT 5.4发布对世界意味着什么
GPT-5.4发布仅48小时后推出,整合了行业领先的编码能力并提升跨工具协作表现。在基于44个白领职业的GDPval基准测试中首次超越人类达70.8%。视频深度测评了模型创建可运行交互式网页、自动化测试纠错等能力,同时指出当模型犯错时89%概率会胡编答案而非承认不知。更重磅的是,OpenAI与Anthropic因国防部合同爆发激烈冲突:Dario Amodei指控OpenAI的“安全层”80%是“安全剧场”,而据报道Claude已通过Palantir系统为伊朗境内的军事目标提供坐标建议。主理人预测白领工作将持续到年底,专业界限正在被AI模糊。