NVIDIA新AI抹除现实

NVIDIA发布Omnimatte Zero技术,实现视频中物体及相关次级效应的一键移除。该技术不仅删除目标对象,还会自动消除阴影、反光和被影响过的草地等细节。核心创新是拼图堆思维——将视频视为一叠拼图,从其他帧复制对应块填补缺失区域,无需重新绘制。这带来三大优势:利用现有扩散模型无需额外训练、零训练成本、实时运行达每秒25帧。系统通过平均时间注意力机制从其他帧吸引背景信息,确保颜色和线条匹配。最令人惊叹的是能区分保留和删除的阴影——长椅阴影被保留,人物阴影被移除。源代码也将免费提供。

February 6, 2026 · 3 min · 1086 words · AIcan

从零到110亿美元ElevenLabs的崛起之路

ElevenLabs联合创始人Matty和Peter讲述AI语音合成公司的崛起故事。公司源于创始人在波兰的成长经历——发现外国电影配音同一演员完成所有角色,情感尽失,遂立志打造自然语音。2021年创立后仅数年便达到110亿美元估值。ElevenLabs的核心竞争力在于将研究与产品紧密结合——产品团队直接与用户沟通获取反馈,研究团队立即在产品上测试模型,形成双向加速机制。公司采用远程办公模式,在11个城市拥有超过300名员工,每六个月翻一番。最激进的是取消所有职级title,过滤自我意识过强的人,消除隐性偏见,赋予员工充分自主权。创始人认为语音是唯一能让人产生情感共鸣的AI模态,语音技术将打破语言和文化障碍。

February 6, 2026 · 3 min · 1456 words · AIcan

前OpenAI研究员他们全都错了_AI需要全新范式

一位前OpenAI研究员正在创办新AI公司,计划融资5亿至10亿美元,探索与主流大语言模型完全不同的道路。该公司致力于开发能够从现实世界中持续学习的AI模型,即’持续学习’技术。当前AI模型的核心问题是’静态’——训练完成后无法再学习新知识。新公司计划超越Transformer架构,目标比当前最先进模型少用100倍数据进行训练,可能需要全新的优化方法。亚马逊AI研究负责人David Luan在NeurIPS大会上表示,现有的模型训练方式不会持续下去。

February 6, 2026 · 3 min · 1113 words · AIcan

Mixpanel_CEO_解读什么才是真正的世界级产品领导者

Mixpanel新任CEO Jen Taylor分享世界级产品领导者的核心特质。真正的关键在于好奇心——杰出产品经理与普通产品经理的区分点。她强调产品管理本质是通过影响力进行管理,需调动整个组织而非直接指挥。AI正在重塑产品分析,让获取洞察更快速、更深入,并帮助团队构建智能代理工作流,从创意到实验形成闭环。数据驱动的真正价值不在于找到答案,而在于如何构建正确的问题和假设。Jen在担任CEO后前四个月已与60多位客户面对面交流,展现客户中心主义。她还指出印度生态系统独特优势——创业者展现出定性与定量平衡的能力,UPI等基础设施创新催生了全新产品范式。

February 5, 2026 · 3 min · 1231 words · AIcan

SaaS大屠杀公开市场崩溃

SaaS板块正经历大屠杀级暴跌。自2022年Q1以来所有上市软件公司增长率持续放缓,这是缓慢的死亡。市场对收入持久性的信念正在崩塌——每个需要CRM的公司都已经有了。微软单日蒸发3600亿美元成为史上第二大市值损失,核心问题在于其收入约40-50%依赖OpenAI且缺乏自研LLM。顶级投资人提出推理即新销售框架:AI时代产品成功取决于AI代理能否让产品本身具有病毒性和ROI显著性。估值标准从收入倍数转向自由现金流倍数。系统记录类公司(如SAP)不会消失,但执行引擎类(如CRM)和任务清单类应用面临消亡风险。

February 5, 2026 · 6 min · 2560 words · AIcan

Sam_Altman_回击批评者我们不傻

Anthropic在超级碗期间发布广告讽刺ChatGPT将加入付费推广,OpenAI CEO Sam Altman发文回击,称该广告’完全不诚实’,强调OpenAI知道用户会拒绝这种广告模式。Sam Altman公布数据称ChatGPT月活已达4亿,而Claude仅1550万。他批评Anthropic封锁竞争对手使用其编码产品是’威权主义’,并宣布OpenAI的Codex已获得50万下载量。这场隔空交锋引发AI行业关于广告商业模式的大讨论。

February 5, 2026 · 3 min · 1014 words · AIcan

六个月后所有人都会用这种方法训练AI代理

本视频演示如何用Claude Code为AI代理训练新技能,创建可复用的产品推广视频生成工作流。通过六步流程:定义任务目标→首次迭代→反馈优化→效果验证→技能固化→自动发布,最终实现只需提供产品URL即可快速生成推广视频并自动发布到X平台。整个过程展示了AI代理的迭代学习能力——从粗糙首版到精炼成品,通过人类反馈不断优化。

February 5, 2026 · 2 min · 822 words · AIcan

本周AI重大发布汇总

本周AI领域两大重磅发布:OpenAI为ChatGPT带来全新图像生成功能,支持风格迁移和文字渲染,引发病毒式传播;Google发布Gemini 2.5 Pro实验版本,在LM Arena排行榜上超越GPT-4o,支持100万token上下文窗口且完全免费。主播认为Gemini 2.5的意义被ChatGPT热度掩盖,但其技术突破更为深远,标志着AI民主化的重大进展。

February 5, 2026 · 3 min · 1266 words · AIcan

DeepSeek新研究_未来已来

DeepSeek发布了一项里程碑式研究,首次公开创建ChatGPT级别AI的完整配方。该研究包含五大核心发现:群体相对策略优化(GRPO)取代昂贵教师模型,让AI通过相互比较评估优劣;AI自发学会在回答前暂停思考;纯强化学习让数学竞赛成功率从15%飙升到80%;少量示例仍能带来超过3倍性能提升;蒸馏技术用70亿参数小模型击败GPT-4o。这项研究让曾经需要数十亿美元的训练技术变得人人可免费获取,研究者预测一两年内我们就能在个人设备上运行当今最强大的AI模型。

February 4, 2026 · 3 min · 1035 words · AIcan

Google_Gemini_智能视觉实战教程

Google发布Gemini 3 Agentic Vision,这是视觉AI领域的新一代能力,填补了传统AI在视觉分析方面的短板。该功能能实现高精度、高效率的图像理解和处理,核心能力包括:从复杂图像中自动识别并裁剪所有目标对象、在图像上绘制箭头和标注进行直观分类、将图像数据自动转换为标准化图表、识别图像中的逻辑错误如测量错误、支持缩放旋转裁剪等操作提取微小细节。与普通AI不同,Gemini Agentic Vision不仅能分析图像,还能通过编写代码在图像上直接绘制和标注,真正实现理解并行动的智能交互。其准确性是目前最突出的优势,特别适合金融交易高低点标注、电子元件识别等专业场景。

February 4, 2026 · 2 min · 576 words · AIcan