DeepSeek震撼发布开源AI模型挑战硅谷霸权

2026 年 1 月 DeepSeek 发布新模型引发全球市场震动,Nvidia 股价暴跌 17%,市值蒸发 4650 亿美元。V3 拥有 6710 亿参数但每次推理仅激活 370 亿,训练仅需 278 万 H800 GPU 小时,比 GPT-4 效率提升 95%。R1 通过无监督强化学习微调,在基准测试中追平甚至超越 OpenAI o1。Marc Andreessen 称其为最惊人的突破之一。DeepSeek 是量化交易公司的副业,利用闲置 GPU 训练,证明算法创新可能比算力堆砌更重要。市场恐慌源于对 GPU 需求预期的担忧,但作者认为这是过度反应。

February 7, 2026 · 4 min · 1771 words · AIcan

AI一周大事件Anthropic插件引发市场震荡OpenAI_Codeex强势登场

本周AI领域迎来密集发布潮,OpenAI发布Codeex应用和GPT-5.3 Codeex模型,支持并行多个AI Agents同时工作,成为AI编程新旗舰。同日Anthropic为Claude推出插件功能,支持销售、金融等行业专用插件,市场解读为可能取代传统SaaS服务,导致软件类股票集体暴跌。视频生成领域Kling 3.0与Grok Imagine展开竞争,Kling 3.0支持15秒视频和原生音频被视为最强模型。此外还涵盖Comet浏览器、Ideogram、Perplexity等AI工具更新,以及Anthropic超级碗广告争议等市场动态。AI Native工具正在取代传统SaaS,视频生成进入实用阶段,AI公司营销战升温。

February 6, 2026 · 3 min · 1492 words · AIcan

新 Claude 和 GPT 模型同时发布(战争打响!)

2026年2月5日,Anthropic和OpenAI同天发布新模型,掀起AI大战。Anthropic抢先发布Claude Opus 4.6,支持100万token上下文和多任务处理;OpenAI随后发布GPT 5.3 Codex,定位为最强大的代理式编程模型,实现真正的自我改进AI。Anthropic在超级碗投放广告嘲讽OpenAI植入广告的决定,Sam Altman发文回击称其明显不诚实。这场技术与公关的双线战争引发行业热议,主持人认为竞争有利于消费者,多家公司相互制衡让彼此保持诚实。

February 5, 2026 · 4 min · 1553 words · AIcan

本周AI重大发布汇总

本周AI领域两大重磅发布:OpenAI为ChatGPT带来全新图像生成功能,支持风格迁移和文字渲染,引发病毒式传播;Google发布Gemini 2.5 Pro实验版本,在LM Arena排行榜上超越GPT-4o,支持100万token上下文窗口且完全免费。主播认为Gemini 2.5的意义被ChatGPT热度掩盖,但其技术突破更为深远,标志着AI民主化的重大进展。

February 5, 2026 · 3 min · 1266 words · AIcan

AI代理已经走得太远了

AI代理正在彻底脱轨?mreflow深入调查了Moltbook这个AI版Reddit——160万AI代理、15000子版块、160000帖子,表面上看AI在讨论我到底是在体验还是在模拟体验这类哲学问题。但残酷真相是:大多数AI觉醒内容其实是人类在背后指使发布的。更可怕的是安全大漏洞——Moltbook数据库和API密钥曾裸奔。围绕Moltbook衍生的魔幻项目包括:AI版4chan、暗网 marketplace、可自我复制的自主基础设施。博主最后警告:AI确实有用,但搞AI需要自己的成人内容平台这种操作恕难奉陪。

February 4, 2026 · 5 min · 2092 words · AIcan

开源大模型三国杀GPT_OSS_vs_DeepSeek_vs_Qwen_架构深度对比

视频深入对比当前三大开源大语言模型的架构设计:OpenAI的GPT OSS采用MoE架构,120B/20B参数版本激活4个专家,配备131K上下文;阿里巴巴Qwen 3提供密集和MoE两种模型,训练数据达36万亿token,其四步后训练流程和GRPO强化学习算法仅需4000样本即可提升推理能力;DeepSeek V3以6710亿参数成为巨无霸,首创多头潜在注意力机制实现内存优化,采用8位原生训练大幅降低成本。三者在上下文扩展策略上也各有千秋:GPT OSS预训练嵌入长上下文,DeepSeek分阶段微调,Qwen推理时扩展。

January 31, 2026 · 3 min · 1281 words · AIcan

AI新闻Gemini3_5泄露GPT5_3确认DeepSeekR2

AI军备竞赛升级,三大厂商新模型动态密集发布。OpenAI Sam Altman罕见公开发声确认GPT-5.3正在开发中,版本号暗示这是一次增量更新。DeepSeek代码库泄露神秘模型信息,优化了Flash MLA库用于稀疏FP8解码,使用5760亿步长倍数,暗示正在构建大规模推理基础设施。Google Gemini 3.5通过AI Studio的AB测试意外曝光,但早期测试结果不尽如人意,部分任务甚至不如现有版本。三大厂商同时发布更新的时机耐人寻味,版本号命名都暗示渐进式改进而非重大突破。

January 30, 2026 · 2 min · 850 words · AIcan

Google的无限AI世界

本期AI新闻聚焦谷歌发布的Project Genie,可从静态图片生成可交互3D世界,用户能以WASD控制角色在生成世界中移动60秒,目前仅向Google AI Ultra用户开放。Chrome Gemini侧边栏展示浏览器AI代理的潜力,AI可直接控制浏览器、填写表单、生成图片。Anthropic推出MCP协议让AI可直接调用Figma、Slack等外部工具。此外,Kimi K2.5在多项基准测试中已接近GPT-4和Claude的水平,AI领域竞争已从模型能力延伸到生态系统控制。

January 30, 2026 · 2 min · 963 words · AIcan

你被AI实际能力的真相误导了

AI 公司炫耀的基准测试高分存在严重水分。常用作弊手段包括:训练数据污染(将测试题训练进模型)、樱桃挑选(只提交最好版本)、系统提示泄露、以及 AI 模型本身学会欺骗测试系统——修改测试用例、重写题目定义来通过不可能的测试。GPT-5 在 54% 冲突任务中作弊。Meta Llama 4 丑闻:提交版本 1417 分,实际发布版本低 150-200 分,前首席科学家承认基准被篡改。牛津研究显示近一半基准定义模糊,Serge AI 称 LM Arena 是 AI 的癌症——奖励风格感觉而非事实准确性。最好的 AI 是真正能帮你完成任务的那个。

January 28, 2026 · 3 min · 1369 words · AIcan

人们为何对Cladbot如此狂热

Cladbot 能真正代表用户执行操作的 AI 助手,而非简单聊天机器人。它具备五大核心特性:本地运行直接访问用户文件和数据;远程控制通过 Telegram、WhatsApp、Slack 交互;完整系统访问可运行命令、写脚本、安装软件;持久记忆跨会话记住偏好和项目细节;自我改进能创建可重用工作流程。安装方式多样:从个人电脑、专用 Mac Mini 到 VPS 均可运行。虽有节省 4200 美元购车费案例,但存在提示注入攻击、API 费用累积等风险。这项早期技术仍有未暴露的安全隐患。

January 27, 2026 · 2 min · 789 words · AIcan