AI一周要闻视频模型炸裂更新与LLM格局巨变

原始标题: AI News: This Video Model Has Everyone Freaked Out!

发布日期: 2026-02-13 | 来源频道: @mreflow

📝 深度摘要

对话背景与核心主题

这是mreflow频道的AI新闻周更视频，发布于2026年2月13日。视频开场直接展示了一段令人震惊的对比：2023年的Will Smith吃意大利面视频与2026年 Seed Dance 2.0 生成的版本——后者逼真度之高，仿佛真的Will Smith在吃面。这正是本周AI圈最炸裂的消息：视频生成模型已经进化到让人"真假难辨"的程度。

本周AI领域呈现三大主线：视频生成模型集体爆发、大语言模型推理能力再创新高、开源模型快速追赶闭源标杆。

核心逻辑拆解

1. 视频生成：字节跳动Seed Dance 2.0登场

Seed Dance 2.0 是字节跳动（TikTok母公司）发布的最新视频模型，其核心突破在于多模态输入支持：可接受文本、图片、音频、视频四种输入形式，目前市面上独一无二。模型支持生成15秒高质量音视频，具备双声道音频和超逼真的视听体验。

更关键的是其口型同步能力——主持人称其为"见过的最佳口型同步"。角色一致性也达到了"令人难以置信"的程度。

值得注意的是，这个模型由中国企业发布，对版权和商标的限制相对宽松。相比之下，美国公司如Sora、Google受限于版权，无法生成迪士尼、漫威等IP内容。这导致中国公司在视频生成领域可能实现"弯道超车"。

2. 大语言模型：推理与速度的双重突破

Google Gemini 3 Deep Think 定位为超级推理模型，目前仅向Google AI Ultra订阅用户开放（月费$250）。在多个benchmark上，它的表现堪称"屠杀级"：

Arc AGI 2推理测试：大幅超越Gemini 3 Pro、Claude Opus 4.6、GPT-5.2
Humanity’s Last Exam：再次领先所有对手
多模态理解：同样领先，虽然优势较小
奥林匹克竞赛题：2025年国际物理和化学奥林匹克金牌水平
理论物理：在CMT benchmark达到50.5%分数

GPT-5.3 Codeex Spark 则展示了另一条路径：速度。使用Cerebrris芯片加速推理，生成一个贪吃蛇游戏只需2-6秒（对比普通版45秒）。主持人现场演示：给出一个"制作 Vampire Survivors 风格游戏"的prompt，50秒后一个完整的可玩游戏就诞生了——包含升级系统、敌人AI、XP收集机制。

3. 开源模型：格局正在改写

GLM 4.5 来自中国公司ZAI，是开源大模型领域的重磅选手。在Swebench Verified测试中，它超越了Opus 4.5、Gemini 3 Pro、GPT-5.2。更惊人的是，EO1 Research用GLM 5（新一代）24小时自主开发了一个可运行的Game Boy Advanced模拟器——模型自己制定计划、执行、测试、修复，完全不需要人类干预。

MiniMax M2.5 则在成本上打破纪录：每百万输入tokens仅需$0.30，每小时运行成本$1，一年四个实例仅需$10,000。在SWE-bench verified上，它已经与Opus 4.6几乎持平。

4. 其他要闻速览

OpenAI：开始测试ChatGPT广告（争议与机会并存）；新可穿戴设备推迟到2027年2月；GPT-4o等多款模型将于2月13日下架
Meta：Facebook头像动画功能；Threads上线"Dear Algo"feed控制功能
Anthropic：Claude Code.work桌面版登陆Windows
Waymo：第六代自动驾驶 driver亮相，分辨率大幅提升

方法论与工具箱

视频生成首选：Seed Dance 2.0（多模态最强）、Kling 3.0（Leonardo内置）
图像生成：Qwen Image 2.0（阿里出品，2K分辨率，文字渲染优秀）
代码编写：GPT-5.3 Codeex Spark（速度最快）、MiniMax M2.5（性价比最高）
深度推理：Gemini 3 Deep Think（复杂推理任务首选）
开源本地部署：GLM 4.5/M2.5系列（成本可控，性能接近闭源）

关键洞察与辩论

视频生成临界点已至：Seed Dance 2.0 代表视频生成进入"无法分辨真假"的时代。主持人警示：未来网上会出现更多"我靠这到底是真的还是AI"的视频。
开源与闭源的差距正在消失：GLM 4.5、M2.5等开源模型在benchmark上已经与GPT、Claude几乎持平，且成本仅百分之一。只需$20,000购买两台M3 Ultra Mac Studio（512GB RAM），就能运行接近Opus水平的开源模型。
AI Agent的自我进化：GLM 5演示中，模型可以自主设定目标、制定计划、执行测试、修复问题，连续工作24小时完成复杂项目。这意味着"给AI一个任务"正在转变为"给AI一个目标"。
中国AI公司的独特优势：对版权限制较少，使其在视频生成、IP内容方面可能领先于美国公司。

金句

“The realism on these videos is to a level I have absolutely never seen before."（这些视频的真实感达到了我从未见过的水平）
“We’re getting to a point now where you don’t just give it a task, you give it a goal."（我们正在到达一个节点：不再只是给AI一个任务，而是给它一个目标）
“It’s been a good week for LLMs."（这是大语言模型的好一周）
“Things are not slowing down right now."（局势现在完全没有放缓的迹象）

📺 视频原片

视频时长: 30分钟 | 视频ID: msrbd-d6lWk

对话背景与核心主题#

核心逻辑拆解#

1. 视频生成：字节跳动Seed Dance 2.0登场#

2. 大语言模型：推理与速度的双重突破#

3. 开源模型：格局正在改写#

4. 其他要闻速览#

方法论与工具箱#

关键洞察与辩论#

金句#