Project_Genie_教程_如何使用_Project_Genie

原始标题: Project Genie Tutorial (How to use Project Genie)

发布日期: 2026-01-30 | 来源频道: @TheAiGrid

📝 深度摘要

对话背景与核心主题

本期视频介绍了 Google DeepMind 推出的实验性研究原型——Project Genie。这是一款革命性的 AI 工具，能够实时生成、探索和混搭虚拟世界。用户只需通过文字描述或上传图片，就能创建可交互的 3D 环境，并控制角色在其中自由探索。作为早期预览版本，目前仅向美国地区的 Google AI Ultra 订阅用户开放。

核心逻辑拆解

视频采用渐进式教学结构，首先说明访问权限门槛，然后演示基础操作流程，接着深入讲解提示词的编写公式，最后展示丰富的应用案例。这种由浅入深的安排非常适合零基础用户快速上手。

访问 Project Genie 需要满足三个条件：第一，必须是 Google AI Ultra 订阅用户（月费约 200 美元，可获得更高 AI 使用配额和 30TB 存储空间）；第二，必须身处美国且年满 18 岁；第三，需通过 labs.google/project genie 使用符合条件的 Google 账户登录。值得注意的是，当前阶段属于分批推送，即使满足条件也需等待开通权限。好消息是生成世界无需消耗 AI 积分，这对早期用户十分友好。

方法论与工具箱

入门首选技巧： 点击「roll the dice」（掷骰子）按钮。这个随机生成器会完全自动创建随机世界和角色，无需任何输入。对新手来说是体验产品能力的最佳起点，能帮助用户在正式创作前熟悉界面和操作手感。

生成机制解析： Project Genie 底层使用名为 Nano Nana 的 AI 首先生成世界草图预览，让用户在正式生成前就能看到概念图像。此时可选择直接批准进入完整交互世界，或编辑预览图添加、修改、删除元素后再生成。生成耗时通常在 10 到 30 秒之间，期间需保持网络连接并停留在页面内。

提示词写作公式： 视频给出了完整的提示词框架，包含四大维度。角色层面需明确身份外观（是什么生物或物体）、行动能力（能做什么动作）、与世界的交互方式（移动时产生什么效果）。环境层面需描述具体场景（森林、城市、山脉）、表面材质（泥土道路、沥青路面、水面）、视觉风格（写实、游戏化、卡通）、内部物体（建筑、道具、其他角色）、动态行为（风、扬尘、动态出现的物体）。

图片上传功能： 可直接上传图片替代文字提示。使用建议包括：使用高分辨率图片以获得最佳效果；如图片将转化为角色，该角色需在画面中居中突出；可以上传真实地点照片转化为可探索世界；也能让艺术作品获得可玩角色。

视角选择： 支持第一人称（FPS 游戏视角）和第三人称（冒险游戏视角）两种模式。初学者建议选择第三人称，更容易判断角色位置和复杂移动操作。

操作控制： 标准 WASD 移动、空格跳跃或上升、方向键旋转视角。每次生成后有 60 秒探索时间，建议每次测试特定功能而非试图一次探索完毕。

关键洞察与辩论

视频中展示了多个令人惊艳的应用案例：用身体视角模拟监控画面效果、操控一盒香烟在地铁中穿梭、滑雪运动员从山坡冲下的物理模拟等。这些案例表明创作者的想象力是唯一的边界。视频创作者还提到为观众准备了免费的提示词库和 Gemini 定制工具，可自动生成符合规范的提示词。

金句

「Project Genie 真正取决于你的创造力在哪里——你的想象力边界在哪里，可能性就到哪里。」

📺 视频原片

视频时长: 8 分钟 | 视频ID: 552BIIO9jd0

对话背景与核心主题#

核心逻辑拆解#

方法论与工具箱#

关键洞察与辩论#

金句#

对话背景与核心主题

核心逻辑拆解

方法论与工具箱

关键洞察与辩论

金句