原始标题: Claude Code Let’s Build: AI Video Editor
发布日期: 2026-01-17 | 来源频道: @AllAboutAI
📝 深度摘要
对话背景与核心主题
这是一个周末实战教程,创作者利用空闲时间展示如何用 Claude Code 从零构建一个半自动化的 AI 视频编辑器。视频不仅演示了具体的开发流程,更核心的是向观众展示如何借助 AI 编码工具将想法快速转化为可用的应用程序。整个项目采用 Next.js + JavaScript 技术栈,结合 ffmpeg、Whisper 语音转文本模型和 Gemini 3.5 Flash API,实现了一个具备基础剪辑功能和 AI 智能剪辑能力的视频编辑器。
核心逻辑拆解
项目的技术架构清晰分为三层。前端界面层使用 Next.js 搭建,包含视频上传组件、播放器组件、时间线组件和剪辑片段编辑器,用户可以通过拖拽上传视频,在时间线上点击定位,按 C 键切割片段,选中后按删除移除不需要的内容。后端核心处理层集成了 ffmpeg 用于视频处理和导出,同时使用 OpenAI 的 Whisper 模型(选用 small 版本)在本地将音频转为文字,为 AI 分析提供文本基础。最上层是 AI 智能层,通过 Gemini 3.5 Flash 的 function calling 功能,让用户可以用自然语言描述需求(如"只保留 Claude 发疯的部分"或"只保留讨论金钱的内容"),AI 就能理解视频内容并自动筛选出符合要求的片段。
方法论与工具箱
开发过程采用了"AI 驱动开发"的方法论。创作者首先准备好转录所需的文档资料,包括 Gemini API 文档和 function calling 说明,然后在 Claude Code 的 plan mode 下描述项目需求,让 AI 自动生成完整的开发计划。开发过程中,创作者通过回答 Claude Code 的追问来确定具体需求(如选择哪个 Whisper 模型、是否需要波形图可视化等),之后由 AI 持续执行计划、完成代码编写。关键技术工具包括:ffmpeg(视频处理)、Whisper small 模型(本地转录)、Gemini 3.5 Flash(AI 理解和推理)、Next.js(前端框架)。
关键洞察与辩论
视频展示了 AI 编码工具在应用开发中的巨大潜力。从项目启动到完成基础功能,整个过程基本由 Claude Code 主导完成,创作者只需提供需求和确认方向。更值得注意的是 AI 剪辑功能的实验结果:通过 Whisper 转录获得视频的文字内容后,Gemini 能够准确理解用户意图并从长视频中提取相关片段。实验中分别测试了"保留 Claude 发疯的部分"和"保留讨论金钱的部分",AI 都成功识别并截取了对应的内容段落,验证了"用自然语言指挥 AI 剪辑"的可行性。
金句
“我们可以用嘴巴完成一切,只需要说保留哪些片段,AI 就能理解并做到。”
“希望这能给你一些启发,让你了解可以用 Claude Code 构建什么。”
📺 视频原片
视频时长: 16 分钟 | 视频ID: dMpaPgLYj_U