3D生成

Google DeepMind发布Genie 3，这是首个可商用的交互式世界生成模型，能够根据文本提示或图片实时生成完整的可交互3D虚拟世界。用户只需输入描述性提示词，如"太空中漂浮的有机外星建筑"，系统即可生成包含角色控制器、可探索环境的完整3D世界。实测支持第三人称和第一人称视角切换，具备World Sketching（草图创建）、World Exploration（实时探索）、World Remixing（二次创作）等核心功能。不过该技术目前存在明显局限：单次体验仅60秒、操控延迟严重、物理碰撞检测不完善，且需付费订阅Google AI Ultra才能访问。Genie 3代表了AI从生成静态图像向生成可交互3D环境的重要跨越，尽管距离游戏级应用尚有距离，但已展现出世界模型技术的巨大潜力。

Project Genie 教程（如何使用 Project Genie）

Google DeepMind 发布 Genie 3 交互式世界模型