原始标题: AI News: This Video Model Has Everyone Freaked Out!

发布日期: 2026-02-13 | 来源频道: @mreflow

📝 深度摘要

对话背景与核心主题

这是mreflow频道的AI新闻周更视频,发布于2026年2月13日。视频开场直接展示了一段令人震惊的对比:2023年的Will Smith吃意大利面视频与2026年 Seed Dance 2.0 生成的版本——后者逼真度之高,仿佛真的Will Smith在吃面。这正是本周AI圈最炸裂的消息:视频生成模型已经进化到让人"真假难辨"的程度。

本周AI领域呈现三大主线:视频生成模型集体爆发、大语言模型推理能力再创新高、开源模型快速追赶闭源标杆。

核心逻辑拆解

1. 视频生成:字节跳动Seed Dance 2.0登场

Seed Dance 2.0 是字节跳动(TikTok母公司)发布的最新视频模型,其核心突破在于多模态输入支持:可接受文本、图片、音频、视频四种输入形式,目前市面上独一无二。模型支持生成15秒高质量音视频,具备双声道音频和超逼真的视听体验。

更关键的是其口型同步能力——主持人称其为"见过的最佳口型同步"。角色一致性也达到了"令人难以置信"的程度。

值得注意的是,这个模型由中国企业发布,对版权和商标的限制相对宽松。相比之下,美国公司如Sora、Google受限于版权,无法生成迪士尼、漫威等IP内容。这导致中国公司在视频生成领域可能实现"弯道超车"。

2. 大语言模型:推理与速度的双重突破

Google Gemini 3 Deep Think 定位为超级推理模型,目前仅向Google AI Ultra订阅用户开放(月费$250)。在多个benchmark上,它的表现堪称"屠杀级":

  • Arc AGI 2推理测试:大幅超越Gemini 3 Pro、Claude Opus 4.6、GPT-5.2
  • Humanity’s Last Exam:再次领先所有对手
  • 多模态理解:同样领先,虽然优势较小
  • 奥林匹克竞赛题:2025年国际物理和化学奥林匹克金牌水平
  • 理论物理:在CMT benchmark达到50.5%分数

GPT-5.3 Codeex Spark 则展示了另一条路径:速度。使用Cerebrris芯片加速推理,生成一个贪吃蛇游戏只需2-6秒(对比普通版45秒)。主持人现场演示:给出一个"制作 Vampire Survivors 风格游戏"的prompt,50秒后一个完整的可玩游戏就诞生了——包含升级系统、敌人AI、XP收集机制。

3. 开源模型:格局正在改写

GLM 4.5 来自中国公司ZAI,是开源大模型领域的重磅选手。在Swebench Verified测试中,它超越了Opus 4.5、Gemini 3 Pro、GPT-5.2。更惊人的是,EO1 Research用GLM 5(新一代)24小时自主开发了一个可运行的Game Boy Advanced模拟器——模型自己制定计划、执行、测试、修复,完全不需要人类干预。

MiniMax M2.5 则在成本上打破纪录:每百万输入tokens仅需$0.30,每小时运行成本$1,一年四个实例仅需$10,000。在SWE-bench verified上,它已经与Opus 4.6几乎持平。

4. 其他要闻速览

  • OpenAI:开始测试ChatGPT广告(争议与机会并存);新可穿戴设备推迟到2027年2月;GPT-4o等多款模型将于2月13日下架
  • Meta:Facebook头像动画功能;Threads上线"Dear Algo"feed控制功能
  • Anthropic:Claude Code.work桌面版登陆Windows
  • Waymo:第六代自动驾驶 driver亮相,分辨率大幅提升

方法论与工具箱

  • 视频生成首选:Seed Dance 2.0(多模态最强)、Kling 3.0(Leonardo内置)
  • 图像生成:Qwen Image 2.0(阿里出品,2K分辨率,文字渲染优秀)
  • 代码编写:GPT-5.3 Codeex Spark(速度最快)、MiniMax M2.5(性价比最高)
  • 深度推理:Gemini 3 Deep Think(复杂推理任务首选)
  • 开源本地部署:GLM 4.5/M2.5系列(成本可控,性能接近闭源)

关键洞察与辩论

  1. 视频生成临界点已至:Seed Dance 2.0 代表视频生成进入"无法分辨真假"的时代。主持人警示:未来网上会出现更多"我靠这到底是真的还是AI"的视频。

  2. 开源与闭源的差距正在消失:GLM 4.5、M2.5等开源模型在benchmark上已经与GPT、Claude几乎持平,且成本仅百分之一。只需$20,000购买两台M3 Ultra Mac Studio(512GB RAM),就能运行接近Opus水平的开源模型。

  3. AI Agent的自我进化:GLM 5演示中,模型可以自主设定目标、制定计划、执行测试、修复问题,连续工作24小时完成复杂项目。这意味着"给AI一个任务"正在转变为"给AI一个目标"。

  4. 中国AI公司的独特优势:对版权限制较少,使其在视频生成、IP内容方面可能领先于美国公司。

金句

  • “The realism on these videos is to a level I have absolutely never seen before."(这些视频的真实感达到了我从未见过的水平)
  • “We’re getting to a point now where you don’t just give it a task, you give it a goal."(我们正在到达一个节点:不再只是给AI一个任务,而是给它一个目标)
  • “It’s been a good week for LLMs."(这是大语言模型的好一周)
  • “Things are not slowing down right now."(局势现在完全没有放缓的迹象)

📺 视频原片


视频时长: 30分钟 | 视频ID: msrbd-d6lWk