原始标题: Project Genie Tutorial (How to use Project Genie)
发布日期: 2026-01-30 | 来源频道: @TheAiGrid
📝 深度摘要
对话背景与核心主题
本期视频介绍了 Google DeepMind 推出的实验性研究原型——Project Genie。这是一款革命性的 AI 工具,能够实时生成、探索和混搭虚拟世界。用户只需通过文字描述或上传图片,就能创建可交互的 3D 环境,并控制角色在其中自由探索。作为早期预览版本,目前仅向美国地区的 Google AI Ultra 订阅用户开放。
核心逻辑拆解
视频采用渐进式教学结构,首先说明访问权限门槛,然后演示基础操作流程,接着深入讲解提示词的编写公式,最后展示丰富的应用案例。这种由浅入深的安排非常适合零基础用户快速上手。
访问 Project Genie 需要满足三个条件:第一,必须是 Google AI Ultra 订阅用户(月费约 200 美元,可获得更高 AI 使用配额和 30TB 存储空间);第二,必须身处美国且年满 18 岁;第三,需通过 labs.google/project genie 使用符合条件的 Google 账户登录。值得注意的是,当前阶段属于分批推送,即使满足条件也需等待开通权限。好消息是生成世界无需消耗 AI 积分,这对早期用户十分友好。
方法论与工具箱
入门首选技巧: 点击「roll the dice」(掷骰子)按钮。这个随机生成器会完全自动创建随机世界和角色,无需任何输入。对新手来说是体验产品能力的最佳起点,能帮助用户在正式创作前熟悉界面和操作手感。
生成机制解析: Project Genie 底层使用名为 Nano Nana 的 AI 首先生成世界草图预览,让用户在正式生成前就能看到概念图像。此时可选择直接批准进入完整交互世界,或编辑预览图添加、修改、删除元素后再生成。生成耗时通常在 10 到 30 秒之间,期间需保持网络连接并停留在页面内。
提示词写作公式: 视频给出了完整的提示词框架,包含四大维度。角色层面需明确身份外观(是什么生物或物体)、行动能力(能做什么动作)、与世界的交互方式(移动时产生什么效果)。环境层面需描述具体场景(森林、城市、山脉)、表面材质(泥土道路、沥青路面、水面)、视觉风格(写实、游戏化、卡通)、内部物体(建筑、道具、其他角色)、动态行为(风、扬尘、动态出现的物体)。
图片上传功能: 可直接上传图片替代文字提示。使用建议包括:使用高分辨率图片以获得最佳效果;如图片将转化为角色,该角色需在画面中居中突出;可以上传真实地点照片转化为可探索世界;也能让艺术作品获得可玩角色。
视角选择: 支持第一人称(FPS 游戏视角)和第三人称(冒险游戏视角)两种模式。初学者建议选择第三人称,更容易判断角色位置和复杂移动操作。
操作控制: 标准 WASD 移动、空格跳跃或上升、方向键旋转视角。每次生成后有 60 秒探索时间,建议每次测试特定功能而非试图一次探索完毕。
关键洞察与辩论
视频中展示了多个令人惊艳的应用案例:用身体视角模拟监控画面效果、操控一盒香烟在地铁中穿梭、滑雪运动员从山坡冲下的物理模拟等。这些案例表明创作者的想象力是唯一的边界。视频创作者还提到为观众准备了免费的提示词库和 Gemini 定制工具,可自动生成符合规范的提示词。
金句
「Project Genie 真正取决于你的创造力在哪里——你的想象力边界在哪里,可能性就到哪里。」
📺 视频原片
视频时长: 8 分钟 | 视频ID: 552BIIO9jd0