YouTube

NVIDIA新AI抹除现实

NVIDIA发布Omnimatte Zero技术，实现视频中物体及相关次级效应的一键移除。该技术不仅删除目标对象，还会自动消除阴影、反光和被影响过的草地等细节。核心创新是拼图堆思维——将视频视为一叠拼图，从其他帧复制对应块填补缺失区域，无需重新绘制。这带来三大优势：利用现有扩散模型无需额外训练、零训练成本、实时运行达每秒25帧。系统通过平均时间注意力机制从其他帧吸引背景信息，确保颜色和线条匹配。最令人惊叹的是能区分保留和删除的阴影——长椅阴影被保留，人物阴影被移除。源代码也将免费提供。

从零到110亿美元ElevenLabs的崛起之路

ElevenLabs联合创始人Matty和Peter讲述AI语音合成公司的崛起故事。公司源于创始人在波兰的成长经历——发现外国电影配音同一演员完成所有角色，情感尽失，遂立志打造自然语音。2021年创立后仅数年便达到110亿美元估值。ElevenLabs的核心竞争力在于将研究与产品紧密结合——产品团队直接与用户沟通获取反馈，研究团队立即在产品上测试模型，形成双向加速机制。公司采用远程办公模式，在11个城市拥有超过300名员工，每六个月翻一番。最激进的是取消所有职级title，过滤自我意识过强的人，消除隐性偏见，赋予员工充分自主权。创始人认为语音是唯一能让人产生情感共鸣的AI模态，语音技术将打破语言和文化障碍。

前OpenAI研究员他们全都错了_AI需要全新范式

一位前OpenAI研究员正在创办新AI公司，计划融资5亿至10亿美元，探索与主流大语言模型完全不同的道路。该公司致力于开发能够从现实世界中持续学习的AI模型，即’持续学习’技术。当前AI模型的核心问题是’静态’——训练完成后无法再学习新知识。新公司计划超越Transformer架构，目标比当前最先进模型少用100倍数据进行训练，可能需要全新的优化方法。亚马逊AI研究负责人David Luan在NeurIPS大会上表示，现有的模型训练方式不会持续下去。

Mixpanel_CEO_解读什么才是真正的世界级产品领导者

Mixpanel新任CEO Jen Taylor分享世界级产品领导者的核心特质。真正的关键在于好奇心——杰出产品经理与普通产品经理的区分点。她强调产品管理本质是通过影响力进行管理，需调动整个组织而非直接指挥。AI正在重塑产品分析，让获取洞察更快速、更深入，并帮助团队构建智能代理工作流，从创意到实验形成闭环。数据驱动的真正价值不在于找到答案，而在于如何构建正确的问题和假设。Jen在担任CEO后前四个月已与60多位客户面对面交流，展现客户中心主义。她还指出印度生态系统独特优势——创业者展现出定性与定量平衡的能力，UPI等基础设施创新催生了全新产品范式。

SaaS大屠杀公开市场崩溃

SaaS板块正经历大屠杀级暴跌。自2022年Q1以来所有上市软件公司增长率持续放缓，这是缓慢的死亡。市场对收入持久性的信念正在崩塌——每个需要CRM的公司都已经有了。微软单日蒸发3600亿美元成为史上第二大市值损失，核心问题在于其收入约40-50%依赖OpenAI且缺乏自研LLM。顶级投资人提出推理即新销售框架：AI时代产品成功取决于AI代理能否让产品本身具有病毒性和ROI显著性。估值标准从收入倍数转向自由现金流倍数。系统记录类公司（如SAP）不会消失，但执行引擎类（如CRM）和任务清单类应用面临消亡风险。

Sam_Altman_回击批评者我们不傻

Anthropic在超级碗期间发布广告讽刺ChatGPT将加入付费推广，OpenAI CEO Sam Altman发文回击，称该广告’完全不诚实’，强调OpenAI知道用户会拒绝这种广告模式。Sam Altman公布数据称ChatGPT月活已达4亿，而Claude仅1550万。他批评Anthropic封锁竞争对手使用其编码产品是’威权主义’，并宣布OpenAI的Codex已获得50万下载量。这场隔空交锋引发AI行业关于广告商业模式的大讨论。

六个月后所有人都会用这种方法训练AI代理

本视频演示如何用Claude Code为AI代理训练新技能，创建可复用的产品推广视频生成工作流。通过六步流程：定义任务目标→首次迭代→反馈优化→效果验证→技能固化→自动发布，最终实现只需提供产品URL即可快速生成推广视频并自动发布到X平台。整个过程展示了AI代理的迭代学习能力——从粗糙首版到精炼成品，通过人类反馈不断优化。

本周AI重大发布汇总

本周AI领域两大重磅发布：OpenAI为ChatGPT带来全新图像生成功能，支持风格迁移和文字渲染，引发病毒式传播；Google发布Gemini 2.5 Pro实验版本，在LM Arena排行榜上超越GPT-4o，支持100万token上下文窗口且完全免费。主播认为Gemini 2.5的意义被ChatGPT热度掩盖，但其技术突破更为深远，标志着AI民主化的重大进展。

DeepSeek新研究_未来已来

DeepSeek发布了一项里程碑式研究，首次公开创建ChatGPT级别AI的完整配方。该研究包含五大核心发现：群体相对策略优化（GRPO）取代昂贵教师模型，让AI通过相互比较评估优劣；AI自发学会在回答前暂停思考；纯强化学习让数学竞赛成功率从15%飙升到80%；少量示例仍能带来超过3倍性能提升；蒸馏技术用70亿参数小模型击败GPT-4o。这项研究让曾经需要数十亿美元的训练技术变得人人可免费获取，研究者预测一两年内我们就能在个人设备上运行当今最强大的AI模型。

Google_Gemini_智能视觉实战教程

Google发布Gemini 3 Agentic Vision，这是视觉AI领域的新一代能力，填补了传统AI在视觉分析方面的短板。该功能能实现高精度、高效率的图像理解和处理，核心能力包括：从复杂图像中自动识别并裁剪所有目标对象、在图像上绘制箭头和标注进行直观分类、将图像数据自动转换为标准化图表、识别图像中的逻辑错误如测量错误、支持缩放旋转裁剪等操作提取微小细节。与普通AI不同，Gemini Agentic Vision不仅能分析图像，还能通过编写代码在图像上直接绘制和标注，真正实现理解并行动的智能交互。其准确性是目前最突出的优势，特别适合金融交易高低点标注、电子元件识别等专业场景。