原始标题: Project Genie Tutorial (How to use Project Genie)

发布日期: 2026-01-30 | 来源频道: @TheAiGrid

📝 深度摘要

1. 讨论背景与核心主题

Project Genie 是 Google DeepMind 推出的实验性研究原型,旨在让用户能够实时创建、探索和混制由人工智能生成的虚拟世界。该工具代表了生成式 AI 从二维图像生成向三维可交互环境演进的重要里程碑。作为一款早期原型产品,Project Genie 目前仅向特定用户群体开放访问,象征着 Google 在 AI 驱动的世界生成领域的最新探索。

2. 核心干货概览

类别 核心事件 / 产品 战略意义 / 行业影响
重磅发布 Project Genie 实验性研究原型 首次实现通过文本提示或图像上传即可生成可探索的三维虚拟世界
技术架构 双阶段生成流程(Nano Nana 生成预览 → 完整交互世界) 降低了用户创作门槛,显著提升生成效率
接入门槛 Google AI Ultra 订阅($200/月)+ 美国地区 + 18岁以上 高定价策略锁定核心创作者群体,为未来商业化铺路
核心功能 随机世界生成、图像转世界、角色定制、物理模拟 拓展了 AI 在游戏开发、影视预演、教育场景的应用边界

3. 深度事件拆解

访问条件与产品定位

Project Genie 目前处于分阶段推出的早期阶段,接入条件较为严格。首先,用户必须订阅 Google AI Ultra,这是 Google 的高级订阅层级,月费约 200 美元,包含更高的 AI 使用配额以及 30TB 的云存储空间。其次,用户必须位于美国境内并年满 18 岁。第三,用户需要通过 Google Labs(访问地址为 labs.google/project/genie)使用符合条件的 Google 账户登录访问。值得注意的是,虽然订阅费用较高,但在早期原型阶段,使用 Project Genie 生成世界并不消耗 AI 积分,对订阅用户完全免费。

世界生成技术原理

Project Genie 采用双阶段 AI 生成流程。当用户输入提示词或上传图像后,系统首先调用名为 Nano Nana 的 AI 模型生成一个世界草图预览,这本质上是一个概念图像,向用户展示生成后的世界大致外观。在此阶段,用户有两个选择:如果预览效果满意,可以直接确认并进入完整交互式世界进行探索;如果不满意,则可以在生成完整世界之前编辑预览图像,添加、修改或删除元素,从而节省时间并确保最终输出符合预期。

Prompt 写作公式

视频详细阐述了一套针对 Project Genie 的精准提示词写作方法。角色描述部分需要明确四点:身份外观(角色是什么样子,如白色毛绒兔子、微观蚂蚁或驾驶摩托车的机械臂)、主要动作与能力(角色能做什么,如飞行、驾驶、奔跑、跳跃)、动作对世界的影响(角色移动时留下何种痕迹,如车轮印记、蓝色油漆轨迹或草地切割效果)。环境描述部分同样需要明确四点:环境类型(森林、城市、山脉等)、表面与地形(泥土路、沥青路、平静海洋等)、环境风格(写实、游戏化、卡通等)以及环境内部的关键物体与角色(建筑、废墟、火山等动态元素)。

视角与控制

用户可以在第一人称视角和第三人称视角之间选择。第一人称视角下可以看到角色的眼睛,类似于第一人称射击游戏;第三人称视角下可以从后方或上方观察角色,更适合复杂移动操作。基础控制采用标准 PC 游戏布局:W 键前进、S 键后退、A 键左移、D 键右移、空格键跳跃或上升、方向键旋转视角或改变方向。每个生成的世界提供约 60 秒的探索时间,用户可以测试特定功能或物理效果后重新生成相同提示词以获得世界变体。

图像上传功能

Project Genie 支持直接上传图像而非撰写文本提示,这一功能极大拓展了创作可能性。使用图像上传时,建议使用高分辨率图像以获得最佳效果;如果图像中的角色需要成为可控制对象,必须确保角色在画面中居中且占据主体位置,否则 AI 可能无法准确识别用户意图。用户可以将真实地点的照片转换为可探索的世界,也可以将自己的艺术作品以低多边形环境形式呈现,甚至可以利用 Nano Banana 将自己的照片转化为复古视频游戏风格的肖像和可探索环境。

4. 核心干货运用

新手入门建议

对于初次接触 Project Genie 的用户,建议首先点击"掷骰子"按钮体验随机生成功能。该功能会自动生成一个完整的随机世界和角色,用户无需任何创作投入即可直观了解 Project Genie 的能力边界。在熟悉控制方式并建立基本认知后,再尝试自定义创作。建议新手优先选择第三人称视角,因为这种视角更易于观察角色位置和导航复杂地形。

技术操作要点

生成世界时需要保持稳定的网络连接,并确保在生成过程中(通常需要 10 至 30 秒)停留在页面不要切换或刷新,否则可能中断生成过程。探索时不建议在单次生成中尝试覆盖整个世界,而是应该针对特定功能或物理效果进行测试。Gallery 功能提供了预制世界作为创作起点,用户可以在此基础上通过自然语言修改草图来创建属于自己的新世界。

5. 行业前瞻与非共识观察

创意应用的突破性潜力

Project Genie 的出现标志着 AI 生成内容从被动观赏向主动交互的重大跨越。传统的 AI 图像或视频生成仅允许用户观看结果,而 Project Genie 让用户能够进入由 AI 创造的世界并进行实时互动。这种从"消费者"到"参与者"的身份转变,为游戏开发、影视预演、建筑可视化、教育培训等领域开辟了全新可能。用户可以将自己的绘画作品转化为可探索的三维空间,或将真实场景的照片转换为沉浸式虚拟环境,这种创作自由度在以往需要专业建模技能才能实现。

物理模拟的精细度

从演示视频来看,Project Genie 在物理模拟方面展现出相当的水准。无论是控制角色在地面行走时扬起的尘土、滑雪时与雪地物体的碰撞,还是车辆在泥土路上留下的车辙痕迹,系统都能够较为自然地呈现。这种实时物理反馈机制增强了虚拟世界的真实感,也为程序化内容生成提供了新的技术验证路径。

6. 金句

“Project Genie 让你能够实时创建、探索和混制由人工智能生成的虚拟世界,而这仅仅是 AI 驱动世界生成的起点。”

“使用 Project Genie,你只需描述你的角色和想要的运行环境,AI 就会为你构建出一个完整的可交互三维世界。”

“你的创造力边界在哪里,Project Genie 的世界就能延伸到哪里。”


📺 视频原片


视频ID: 552BIIO9jd0