Project Genie 教程(如何使用 Project Genie)

Google DeepMind发布Project Genie,首个可通过自然语言实时生成可交互3D虚拟世界的AI原型。用户描述环境和角色后,系统即可生成完整可探索的3D世界,支持第一人称和第三人称视角。采用双阶段生成流程,先由Nano模型生成草图预览,确认后生成最终世界。目前仅向美国地区Google AI Ultra订阅用户(约200美元/月)开放,生成需10-30秒,探索时限60秒。该技术标志着生成式AI从2D向3D沉浸式环境的关键跨越。

January 30, 2026 · 5 min · 2325 words · AIcan

Google DeepMind 发布 Genie 3 交互式世界模型

Google DeepMind发布Genie 3,这是首个可商用的交互式世界生成模型,能够根据文本提示或图片实时生成完整的可交互3D虚拟世界。用户只需输入描述性提示词,如"太空中漂浮的有机外星建筑",系统即可生成包含角色控制器、可探索环境的完整3D世界。实测支持第三人称和第一人称视角切换,具备World Sketching(草图创建)、World Exploration(实时探索)、World Remixing(二次创作)等核心功能。不过该技术目前存在明显局限:单次体验仅60秒、操控延迟严重、物理碰撞检测不完善,且需付费订阅Google AI Ultra才能访问。Genie 3代表了AI从生成静态图像向生成可交互3D环境的重要跨越,尽管距离游戏级应用尚有距离,但已展现出世界模型技术的巨大潜力。

January 29, 2026 · 7 min · 3097 words · AIcan