原始标题: AI News: This Video Model Has Everyone Freaked Out!
发布日期: 2026-02-13 | 来源频道: @mreflow
📝 深度摘要
对话背景与核心主题
这是mreflow频道的AI新闻周更视频,发布于2026年2月13日。视频开场直接展示了一段令人震惊的对比:2023年的Will Smith吃意大利面视频与2026年 Seed Dance 2.0 生成的版本——后者逼真度之高,仿佛真的Will Smith在吃面。这正是本周AI圈最炸裂的消息:视频生成模型已经进化到让人"真假难辨"的程度。
本周AI领域呈现三大主线:视频生成模型集体爆发、大语言模型推理能力再创新高、开源模型快速追赶闭源标杆。
核心逻辑拆解
1. 视频生成:字节跳动Seed Dance 2.0登场
Seed Dance 2.0 是字节跳动(TikTok母公司)发布的最新视频模型,其核心突破在于多模态输入支持:可接受文本、图片、音频、视频四种输入形式,目前市面上独一无二。模型支持生成15秒高质量音视频,具备双声道音频和超逼真的视听体验。
更关键的是其口型同步能力——主持人称其为"见过的最佳口型同步"。角色一致性也达到了"令人难以置信"的程度。
值得注意的是,这个模型由中国企业发布,对版权和商标的限制相对宽松。相比之下,美国公司如Sora、Google受限于版权,无法生成迪士尼、漫威等IP内容。这导致中国公司在视频生成领域可能实现"弯道超车"。
2. 大语言模型:推理与速度的双重突破
Google Gemini 3 Deep Think 定位为超级推理模型,目前仅向Google AI Ultra订阅用户开放(月费$250)。在多个benchmark上,它的表现堪称"屠杀级":
- Arc AGI 2推理测试:大幅超越Gemini 3 Pro、Claude Opus 4.6、GPT-5.2
- Humanity’s Last Exam:再次领先所有对手
- 多模态理解:同样领先,虽然优势较小
- 奥林匹克竞赛题:2025年国际物理和化学奥林匹克金牌水平
- 理论物理:在CMT benchmark达到50.5%分数
GPT-5.3 Codeex Spark 则展示了另一条路径:速度。使用Cerebrris芯片加速推理,生成一个贪吃蛇游戏只需2-6秒(对比普通版45秒)。主持人现场演示:给出一个"制作 Vampire Survivors 风格游戏"的prompt,50秒后一个完整的可玩游戏就诞生了——包含升级系统、敌人AI、XP收集机制。
3. 开源模型:格局正在改写
GLM 4.5 来自中国公司ZAI,是开源大模型领域的重磅选手。在Swebench Verified测试中,它超越了Opus 4.5、Gemini 3 Pro、GPT-5.2。更惊人的是,EO1 Research用GLM 5(新一代)24小时自主开发了一个可运行的Game Boy Advanced模拟器——模型自己制定计划、执行、测试、修复,完全不需要人类干预。
MiniMax M2.5 则在成本上打破纪录:每百万输入tokens仅需$0.30,每小时运行成本$1,一年四个实例仅需$10,000。在SWE-bench verified上,它已经与Opus 4.6几乎持平。
4. 其他要闻速览
- OpenAI:开始测试ChatGPT广告(争议与机会并存);新可穿戴设备推迟到2027年2月;GPT-4o等多款模型将于2月13日下架
- Meta:Facebook头像动画功能;Threads上线"Dear Algo"feed控制功能
- Anthropic:Claude Code.work桌面版登陆Windows
- Waymo:第六代自动驾驶 driver亮相,分辨率大幅提升
方法论与工具箱
- 视频生成首选:Seed Dance 2.0(多模态最强)、Kling 3.0(Leonardo内置)
- 图像生成:Qwen Image 2.0(阿里出品,2K分辨率,文字渲染优秀)
- 代码编写:GPT-5.3 Codeex Spark(速度最快)、MiniMax M2.5(性价比最高)
- 深度推理:Gemini 3 Deep Think(复杂推理任务首选)
- 开源本地部署:GLM 4.5/M2.5系列(成本可控,性能接近闭源)
关键洞察与辩论
视频生成临界点已至:Seed Dance 2.0 代表视频生成进入"无法分辨真假"的时代。主持人警示:未来网上会出现更多"我靠这到底是真的还是AI"的视频。
开源与闭源的差距正在消失:GLM 4.5、M2.5等开源模型在benchmark上已经与GPT、Claude几乎持平,且成本仅百分之一。只需$20,000购买两台M3 Ultra Mac Studio(512GB RAM),就能运行接近Opus水平的开源模型。
AI Agent的自我进化:GLM 5演示中,模型可以自主设定目标、制定计划、执行测试、修复问题,连续工作24小时完成复杂项目。这意味着"给AI一个任务"正在转变为"给AI一个目标"。
中国AI公司的独特优势:对版权限制较少,使其在视频生成、IP内容方面可能领先于美国公司。
金句
- “The realism on these videos is to a level I have absolutely never seen before."(这些视频的真实感达到了我从未见过的水平)
- “We’re getting to a point now where you don’t just give it a task, you give it a goal."(我们正在到达一个节点:不再只是给AI一个任务,而是给它一个目标)
- “It’s been a good week for LLMs."(这是大语言模型的好一周)
- “Things are not slowing down right now."(局势现在完全没有放缓的迹象)
📺 视频原片
视频时长: 30分钟 | 视频ID: msrbd-d6lWk