创作流程

学习目标：掌握从 idea 到成品的完整 AI 视频创作流程
预计时间：60 分钟
难度：⭐⭐⭐

流程概述

AI 视频创作的完整流程可以分为以下几个阶段：

创意阶段 (1-2 小时)
  ↓
脚本与故事板 (1-2 小时)
  ↓
素材准备 (30 分钟 - 1 小时)
  ↓
AI 生成 (1-3 小时)
  ↓
后期处理 (2-8 小时)
  ↓
质量验收与交付 (30 分钟)

总计：5-17 小时（根据项目复杂度）

阶段一：创意开发

需求分析

1. 明确项目目标

问题：
- 视频的用途是什么？
  • 广告宣传
  • 品牌展示
  • 产品介绍
  • 内容创作
- 目标受众是谁？
  • 年龄段：20-30岁、30-50岁等
  • 性别：男性、女性、不限
  • 兴趣偏好：科技、时尚、生活等
- 传播渠道是什么？
  • 平台：抖音、B站、朋友圈、视频号等
  • 形式：横屏、竖屏
  • 时长：15秒、30秒、60秒等

2. 确定项目约束

约束条件：
- 预算限制：时间、成本
- 时长要求：15秒、30秒、60秒等
- 分辨率要求：1080p、4K等
- 风格要求：写实、卡通、电影感等
- 品牌要求：品牌色、Logo位置、品牌调性等
- 合规要求：内容合规、版权合规等

创意生成

1. 头脑风暴

方法：
- 快速生成多个创意方向
- 不设限，自由发散
- 数量优先，质量其次

工具：
- AI 辅助：使用 ChatGPT、Claude 等生成创意
- 传统工具：思维导图、白板讨论
- 参考案例：观看同行业优秀案例

示例创意方向：
- 方向1：产品功能展示
- 方向2：生活场景应用
- 方向3：情感化叙事
- 方向4：幽默趣味内容
- 方向5：科技未来感

2. 创意筛选

筛选标准：
- 与目标匹配度
- 与受众匹配度
- 可实现性
- 成本可控性
- 差异化程度

筛选方法：
- 团队讨论：集体评估创意方向
- 用户调研：快速验证创意接受度
- A/B 测试：小规模测试不同创意

输出：
- 选出1-2个主创意方向
- 明确每个创意的要点

3. 创意细化

细化内容：
- 具体场景设计
- 人物设定（如有）
- 情节发展
- 视觉风格
- 音乐风格

细化方法：
- 故事板：绘制分镜故事板
- 文案：撰写具体文案
- 风格参考：收集风格参考图
- 音乐参考：收集音乐参考

输出：
- 详细的创意方案
- 故事板草图
- 风格和音乐参考

阶段二：脚本与故事板

脚本撰写

1. 脚本结构

标准脚本结构：
1. 标题
2. 时长
3. 核心信息
4. 画面描述（分镜头）
5. 文案
6. 音乐建议

示例：
标题：品牌手机广告
时长：30秒
核心信息：产品高性能、拍照清晰、续航持久

镜头1（0-5秒）：
画面：特写手机，手指滑动屏幕
文案：快，更快，更流畅
音乐：轻快电子乐

镜头2（5-10秒）：
画面：全景，多人用手机拍照，快乐表情
文案：记录每一个精彩瞬间
音乐：高潮音乐

镜头3（10-15秒）：
画面：中景，手机在阳光下，展现外观设计
文案：优雅设计，手感舒适
音乐：柔和音乐

镜头4（15-20秒）：
画面：特写，手机夜景模式拍照，夜景清晰
文案：夜景模式，依然清晰
音乐：温馨音乐

镜头5（20-25秒）：
画面：全景，手机在旅行场景，展现续航
文案：超长续航，陪你走得更远
音乐：激励音乐

镜头6（25-30秒）：
画面：产品Logo，品牌标语
文案：[品牌名称] - 定义未来
音乐：品牌音乐

2. AI 辅助脚本生成

工具：
- ChatGPT：快速生成脚本初稿
- Claude：优化脚本语言和节奏
- 文心一言：中文脚本优化

提示词示例：
"为[品牌名称]的手机写一个30秒的广告脚本，核心信息是高性能、拍照清晰、续航持久，受众是20-30岁年轻人，风格是科技感、时尚感，需要6个镜头，每个镜头5秒，包含画面描述和文案"

优化方法：
- 生成后人工修改
- 多轮对话优化
- 调整语气和节奏

3. 脚本优化

优化要点：
- 节奏：前3秒抓住注意力，中间展示信息，最后强化记忆
- 文案：简洁有力，避免冗长
- 画面：视觉化，避免抽象描述
- 音乐：配合画面，增强情感

优化方法：
- 多次朗读：测试脚本朗读效果
- 模拟演练：模拟实际观看体验
- 朋友反馈：获取客观反馈

输出：
- 优化后的脚本
- 明确的镜头划分
- 画面和音乐的详细描述

故事板制作

1. 故事板类型

类型1：简单草图
- 快速绘制每个镜头的草图
- 标注构图、运镜方式
- 标注人物位置、道具等

类型2：详细故事板
- 绘制详细的场景图
- 标注具体时间点
- 标注转场方式
- 标注灯光、色彩等

类型3：AI 故事板
- 使用 AI 生成故事板图像
- 输入脚本，输出故事板
- 快速迭代多个版本

2. 故事板制作工具

工具推荐：
- 专业工具：Storyboarder、Toon Boom Storyboard Pro
- 设计软件：Photoshop、Figma、Sketch
- AI 工具：Kling AI、Pika 等 AI 生成工具

使用建议：
- 根据项目复杂度选择工具
- 简单项目：AI 工具快速生成
- 复杂项目：专业工具精确绘制
- 结合使用：AI 快速生成 + 专业工具优化

3. 故事板优化

优化要点：
- 构图：每个镜头构图清晰明确
- 流畅：镜头之间衔接自然
- 视觉：整体视觉风格统一
- 时长：每个镜头时长合理

优化方法：
- 团队评审：团队共同评审故事板
- AI 生成：AI 生成多个版本对比
- 参考对比：与优秀案例对比

输出：
- 最终故事板
- 镜头时长表
- 转场方式说明
- 视觉风格说明

阶段三：素材准备

视觉素材

1. 角色素材

如需角色：
- 角色设计：绘制或收集角色设计图
- 角色参考：收集角色参考图片
- 角色动作：设计角色动作参考

AI 生成：
- 参考图：使用角色参考图
- 一致性：多次生成保持角色一致
- 多角度：生成不同角度的角色图

2. 环境素材

环境参考：
- 地点参考：收集目标地点的参考图片
- 光照参考：收集不同光照的参考图
- 风格参考：收集风格参考图

AI 生成：
- 环境生成：生成不同环境背景
- 风格一致：保持环境风格一致
- 光照一致：保持光照风格一致

3. 产品素材

如需产品：
- 产品图片：准备产品多角度图片
- 产品视频：准备产品展示视频（如有）
- 3D 模型：准备产品 3D 模型（如有）

应用：
- 产品展示：在 AI 生成视频中展示产品
- 场景融入：将产品融入 AI 生成场景
- 风格匹配：产品风格与视频风格匹配

音频素材

1. 语音素材

AI 语音生成：
- 工具：Suno、Udio、ElevenLabs 等
- 方法：输入脚本，AI 生成语音
- 优化：调整语速、语调、情感

人工配音：
- 专业配音：找专业配音员
- 配音指导：提供配音要求和方向
- 多版配音：生成多个版本对比

2. 背景音乐

音乐选择：
- 风格匹配：音乐风格与视频风格匹配
- 节奏匹配：音乐节奏与视频节奏匹配
- 情感匹配：音乐情感与视频情感匹配

来源：
- 音乐库：Epidemic Sound、Artlist、PremiumBeat
- 免费音乐：YouTube Audio Library、Free Music Archive
- AI 生成：Suno、Udio 等 AI 音乐生成

3. 音效

音效选择：
- 场景音效：根据场景选择合适音效
- 动作音效：根据动作选择合适音效
- 环境音效：添加环境氛围音效

来源：
- 音效库：Freesound、Freesound Effects、Mixkit
- 音效生成：AI 生成特定音效

阶段四：AI 生成

平台选择

1. 根据需求选择

需求映射：
- 电影级制作 → Sora 2
- 专业广告 → Runway Gen-4.5
- Google 生态 → Veo 3.1
- 趣味内容 → Pika 2.0
- 电商/虚拟人 → Kling AI 2.0
- 快速创意 → Pika 2.0 / Kling AI 2.0

2. 成本考虑

成本对比：
- Sora 2：$10-20（30秒）
- Runway Gen-4.5：$15-30（30秒）
- Veo 3.1：$12-25（30秒）
- Pika 2.0：$5-15（30秒）
- Kling AI 2.0：$3-8（30秒）

选择策略：
- 高预算：Sora 2、Runway Gen-4.5
- 中等预算：Veo 3.1、Runway Gen-4.5
- 低预算：Pika 2.0、Kling AI 2.0

生成执行

1. 提示词构建

构建方法：
- 基于脚本：将脚本转换为提示词
- 结构化描述：使用提示词结构
- 权重控制：重要部分加大权重

示例：
根据脚本构建提示词：
"特写镜头，浅景深，侧光照明，暖色调，电影感。一位穿着白色婚纱的25岁新娘，在充满鲜花的教堂里站立，阳光从窗户射入，营造神圣、浪漫的氛围。新娘神情幸福，眼神温柔，双手交叠在胸前。背景是教堂内的鲜花装饰和彩色玻璃窗。"

2. 批量生成

生成策略：
- 多版本：一次生成多个版本
- 多平台：同时在不同平台生成
- 多参数：使用不同参数组合

生成数量：
- 每个镜头：生成 3-5 个版本
- 对比选择：人工对比后选择最佳
- 优化迭代：针对问题优化后重新生成

3. 质量筛选

筛选标准：
- 脚本符合度：是否符合脚本要求
- 质量评估：视觉质量、物理真实性、一致性
- 技术评估：分辨率、帧率、码率
- 成本评估：是否符合预算要求

筛选方法：
- 人工筛选：团队成员人工观看筛选
- 技术评估：使用专业软件评估
- 团队决策：集体决策最佳版本

输出：
- 每个镜头的最佳版本
- 质量评估报告
- 成本统计

问题处理

1. 常见问题识别

常见问题：
- 模糊：画面不清晰
- 伪影：生成算法产生的人工痕迹
- 一致性：角色、场景不一致
- 物理：物理规律不真实
- 时长：不满足时长要求

2. 问题解决

解决方法：
- 提示词优化：优化提示词描述
- 参数调整：调整生成参数
- 重新生成：优化后重新生成
- 后期修复：使用后期工具修复

具体方案：
- 模糊问题：提高分辨率、增加"清晰"提示词、后期超分辨率
- 伪影问题：增加"无伪影"负面提示词、后期修复
- 一致性问题：使用参考帧、分段生成拼接
- 物理问题：使用支持物理规则的平台、后期调整
- 时长问题：调整参数、分段生成拼接

阶段五：后期处理

剪辑处理

1. 剪辑软件选择

专业软件：
- Premiere Pro：最主流，功能全面
- Final Cut Pro：Mac 平台，性能优秀
- DaVinci Resolve：免费，调色强大
- After Effects：特效强大

轻量软件：
- 剪映：移动端，简单易用
- 必剪：移动端，功能全面
- CapCut：免费，功能不错

选择建议：
- 专业项目：Premiere Pro、DaVinci Resolve
- 中等项目：Final Cut Pro、After Effects
- 轻量项目：剪映、必剪、CapCut

2. 剪辑流程

标准流程：
1. 素材导入：导入所有镜头和素材
2. 粗剪：按照脚本拼接镜头
3. 精剪：微调每个镜头的起止点
4. 转场：添加转场效果
5. 调速：调整视频节奏
6. 输出：导出最终视频

技巧：
- 多轨道：使用多轨道组织素材
- 锁定轨道：锁定已完成的轨道
- 快捷键：熟练使用快捷键提高效率
- 自动保存：定时保存避免意外丢失

调色处理

1. 调色软件

专业软件：
- DaVinci Resolve：调色功能最强大
- Premiere Pro：内置调色工具
- Final Cut Pro：内置调色功能

调色插件：
- Colorista：强大的调色插件
- Magic Bullet：好莱坞风格调色
- FilmConvert：胶片风格调色

2. 调色流程

标准流程：
1. 白平衡：调整白平衡
2. 曝光：调整亮度和对比度
3. 色彩：调整色调和饱和度
4. 曲线：使用曲线微调
5. 风格：应用风格化调色
6. 管理器：使用调色管理器

调色风格：
- 电影感：对比度高，饱和度适中
- 暖色调：色温偏暖
- 冷色调：色温偏冷
- 复古感：降低饱和度，增加噪点

音频处理

1. 音频软件

专业软件：
- Audition：专业音频处理
- Pro Tools：专业音频编辑
- Logic Pro：专业音乐制作

轻量软件：
- Audacity：免费开源
- Adobe Audition CC：功能全面
- GarageBand：Mac 平台，简单易用

2. 音频处理流程

标准流程：
1. 音频导入：导入语音、音乐、音效
2. 对齐：对齐音频和视频
3. 混音：混合多个音频轨道
4. 音量：调整各轨道音量平衡
5. 效果：添加音频效果（混响、EQ等）
6. 输出：混音后导出

技巧：
- 关键帧：在关键帧标记音频变化
- 分轨处理：语音、音乐、音效分轨道处理
- 监听：多次监听不同设备效果
- 自动化：使用自动化功能提高效率

字幕处理

1. 字幕工具

专业软件：
- Subtitle Edit：专业字幕编辑
- Aegisub：开源免费
- 轻量软件：剪映、必剪内置字幕功能

AI 字幕：
- 自动识别：自动识别语音生成字幕
- 翻译：自动翻译字幕
- 语音合成：AI 生成多语言字幕

2. 字幕制作流程

标准流程：
1. 自动识别：自动识别语音生成字幕
2. 手动校对：校对字幕文本和时间码
3. 翻译（如需）：翻译成目标语言
4. 排版：调整字幕字体、大小、颜色、位置
5. 导出：导出字幕文件（SRT、ASS等）

技巧：
- 分段处理：逐段处理提高准确性
- 参考翻译：使用翻译工具辅助
- 风格统一：保持字幕风格统一
- 测试观看：测试观看效果

阶段六：质量验收与交付

质量验收

1. 验收标准

视觉质量：
- 分辨率：达到目标分辨率
- 帧率：达到目标帧率
- 清晰度：画面清晰，无模糊
- 色彩：色彩真实，无偏色
- 噪点：无明显噪点

内容质量：
- 脚本符合：符合脚本要求
- 核心信息：核心信息传达清晰
- 品牌规范：符合品牌规范
- 合规要求：符合内容合规要求

技术质量：
- 文件大小：符合文件大小要求
- 兼容性：目标平台可播放
- 编码标准：符合编码标准

2. 验收方法

验收方法：
1. 人工观看：团队成员观看验收
2. 多设备测试：不同设备测试播放
3. 不同网络测试：不同网络环境测试
4. 用户测试：目标用户测试反馈
5. 合规检查：合规部门检查（如需）

验收流程：
- 多轮修改：根据反馈多轮修改
- 最终确认：所有相关方最终确认
- 归档：归档所有版本和修改记录

交付

1. 交付格式

视频格式：
- MP4：最通用格式
- MOV：高质量格式
- WebM：网页优化格式

分辨率：
- 1080p：通用高清
- 2K：高清+
- 4K：超高清

音频格式：
- AAC：通用音频编码
- MP3：通用音频格式
- WAV：无损音频格式

2. 交付文件

必要文件：
- 最终视频文件
- 字幕文件（如有）
- 项目文件（如需）

附加文件：
- 故事板
- 脚本
- 素材清单
- 制作说明

3. 交付方式

交付渠道：
- 云盘：百度网盘、Google Drive、OneDrive
- 传输：WeTransfer、百度网盘传输、FTP
- 平台：直接上传到目标平台
- 现场：现场交付并安装

交付说明：
- 文件说明：说明每个文件的用途
- 使用说明：说明如何使用视频
- 注意事项：重要注意事项

本章小结

通过本节学习，你应该掌握了：

✅ 完整创作流程

6 个阶段的完整流程
每个阶段的具体内容
阶段之间的衔接关系

✅ 各阶段方法

创意开发方法
脚本撰写方法
素材准备方法
AI 生成方法
后期处理方法
质量验收方法

✅ 工具使用

各阶段推荐工具
工具选择方法
工具使用技巧

✅ 问题处理

常见问题识别
问题解决方法
优化迭代方法

下一步：在下一节中，我们将了解 AI 视频生成在各行业的商业应用案例。

← 返回章节目录 | 继续学习：商业应用 →

创作流程 ​

流程概述 ​

阶段一：创意开发 ​

需求分析 ​

创意生成 ​

阶段二：脚本与故事板 ​

脚本撰写 ​

故事板制作 ​

阶段三：素材准备 ​

视觉素材 ​

音频素材 ​

阶段四：AI 生成 ​

平台选择 ​

生成执行 ​

问题处理 ​

阶段五：后期处理 ​

剪辑处理 ​

调色处理 ​

音频处理 ​

字幕处理 ​

阶段六：质量验收与交付 ​

质量验收 ​

交付 ​

本章小结 ​