原始标题: NVIDIA GTC 2026 Everything Announced

发布日期: 2026-02-05 | 来源频道: @mreflow

📝 深度摘要

本期视频聚焦于2025年3月AI领域的两大重磅发布。首先,OpenAI于3月25日为ChatGPT带来了全新的图像生成能力,用户可以直接在对话中生成图像,还能将任意图片转换成Studio Gibli等艺术风格,引发全网热议甚至导致OpenAI服务器一度过载。其次,Google发布了Gemini 2.5 Pro实验版本,在LM Arena排行榜上力压群雄,在科学、数学、代码、视觉推理和长上下文等维度全面领先,最关键的是这一模型完全免费开放使用。此外,视频还介绍了Microsoft Teams Free和Microsoft 365 Copilot的新功能。


📺 视频原片


视频时长: 34 分钟 | 视频ID: Tx0Y3qb9ZUc

对话背景与核心主题

本周AI领域迎来两大震撼发布,直接改变了AI竞争格局。视频首先详细演示了ChatGPT全新图像生成功能的实际效果,包括风格迁移、图像编辑、文本渲染等能力。随后重点介绍了Google Gemini 2.5的惊艳表现,这一模型在多项基准测试中超越GPT-4o,且完全免费可用。主播认为Gemini 2.5的发布被ChatGPT图像功能的热度所掩盖,但其技术突破意义更为深远。

核心逻辑拆解

ChatGPT图像生成的三大核心能力包括:直接生成图像、精确渲染文字、风格迁移。其中风格迁移功能最受关注,用户可以将任何照片转换成Studio Gibli、GTA 5、South Park等风格,引发病毒式传播。该功能目前仅向Plus和Pro用户开放,免费版因需求过大而延迟发布。

Gemini 2.5的技术优势体现在四个维度:推理能力在LM Arena排名第一;支持100万token上下文窗口(约75万词);处理速度极快;完全免费使用。主播现场演示了将4小时机器学习视频的完整 transcript 粘贴给Gemini 2.5,模型仅用62秒就完成了分析和要点提炼,只使用了5%的上下文窗口。

方法论与工具箱

  • ChatGPT图像生成:通过对话式提示词完成图像生成和编辑
  • Gemini 2.5:访问 Google AI Studio 选择 Gemini 2.5 Pro Experimental 免费使用
  • 代码开发:Gemini 2.5已集成到Windsurf和Cursor等IDE中
  • Microsoft Teams Free:aka.ms/FutureTools 获取免费协作套件

关键洞察与辩论

  • 被低估的Gemini 2.5:主播认为这是本周最重要的发布,但被ChatGPT图像热度掩盖
  • OpenAI vs Midjourney:Midjourney CEO公开批评ChatGPT图像生成"又慢又差",但众多用户认为这是酸葡萄心理
  • AI民主化意义:Gemini 2.5的免费开放意味着任何人都可以零成本使用世界顶级AI模型
  • 从提示工程到对话设计:ChatGPT图像功能代表了AI创作工具的工作流变革

金句

“这不仅仅是风格迁移,而是集成了Control Nets、IP Adapters和Graphic Designer思维的AI专家。”

“我们从需要成为技术提示工程师,变成了只需像和熟练艺术家对话一样使用AI。”

" Gemini 2.5 是有史以来最聪明的AI模型,而且完全免费。"