Skip to content

创作流程

学习目标:掌握从 idea 到成品的完整 AI 视频创作流程

预计时间:60 分钟

难度:⭐⭐⭐


流程概述

AI 视频创作的完整流程可以分为以下几个阶段:

创意阶段 (1-2 小时)

脚本与故事板 (1-2 小时)

素材准备 (30 分钟 - 1 小时)

AI 生成 (1-3 小时)

后期处理 (2-8 小时)

质量验收与交付 (30 分钟)

总计:5-17 小时(根据项目复杂度)


阶段一:创意开发

需求分析

1. 明确项目目标

问题:
- 视频的用途是什么?
  • 广告宣传
  • 品牌展示
  • 产品介绍
  • 内容创作
- 目标受众是谁?
  • 年龄段:20-30岁、30-50岁等
  • 性别:男性、女性、不限
  • 兴趣偏好:科技、时尚、生活等
- 传播渠道是什么?
  • 平台:抖音、B站、朋友圈、视频号等
  • 形式:横屏、竖屏
  • 时长:15秒、30秒、60秒等

2. 确定项目约束

约束条件:
- 预算限制:时间、成本
- 时长要求:15秒、30秒、60秒等
- 分辨率要求:1080p、4K等
- 风格要求:写实、卡通、电影感等
- 品牌要求:品牌色、Logo位置、品牌调性等
- 合规要求:内容合规、版权合规等

创意生成

1. 头脑风暴

方法:
- 快速生成多个创意方向
- 不设限,自由发散
- 数量优先,质量其次

工具:
- AI 辅助:使用 ChatGPT、Claude 等生成创意
- 传统工具:思维导图、白板讨论
- 参考案例:观看同行业优秀案例

示例创意方向:
- 方向1:产品功能展示
- 方向2:生活场景应用
- 方向3:情感化叙事
- 方向4:幽默趣味内容
- 方向5:科技未来感

2. 创意筛选

筛选标准:
- 与目标匹配度
- 与受众匹配度
- 可实现性
- 成本可控性
- 差异化程度

筛选方法:
- 团队讨论:集体评估创意方向
- 用户调研:快速验证创意接受度
- A/B 测试:小规模测试不同创意

输出:
- 选出1-2个主创意方向
- 明确每个创意的要点

3. 创意细化

细化内容:
- 具体场景设计
- 人物设定(如有)
- 情节发展
- 视觉风格
- 音乐风格

细化方法:
- 故事板:绘制分镜故事板
- 文案:撰写具体文案
- 风格参考:收集风格参考图
- 音乐参考:收集音乐参考

输出:
- 详细的创意方案
- 故事板草图
- 风格和音乐参考

阶段二:脚本与故事板

脚本撰写

1. 脚本结构

标准脚本结构:
1. 标题
2. 时长
3. 核心信息
4. 画面描述(分镜头)
5. 文案
6. 音乐建议

示例:
标题:品牌手机广告
时长:30秒
核心信息:产品高性能、拍照清晰、续航持久

镜头1(0-5秒):
画面:特写手机,手指滑动屏幕
文案:快,更快,更流畅
音乐:轻快电子乐

镜头2(5-10秒):
画面:全景,多人用手机拍照,快乐表情
文案:记录每一个精彩瞬间
音乐:高潮音乐

镜头3(10-15秒):
画面:中景,手机在阳光下,展现外观设计
文案:优雅设计,手感舒适
音乐:柔和音乐

镜头4(15-20秒):
画面:特写,手机夜景模式拍照,夜景清晰
文案:夜景模式,依然清晰
音乐:温馨音乐

镜头5(20-25秒):
画面:全景,手机在旅行场景,展现续航
文案:超长续航,陪你走得更远
音乐:激励音乐

镜头6(25-30秒):
画面:产品Logo,品牌标语
文案:[品牌名称] - 定义未来
音乐:品牌音乐

2. AI 辅助脚本生成

工具:
- ChatGPT:快速生成脚本初稿
- Claude:优化脚本语言和节奏
- 文心一言:中文脚本优化

提示词示例:
"为[品牌名称]的手机写一个30秒的广告脚本,核心信息是高性能、拍照清晰、续航持久,受众是20-30岁年轻人,风格是科技感、时尚感,需要6个镜头,每个镜头5秒,包含画面描述和文案"

优化方法:
- 生成后人工修改
- 多轮对话优化
- 调整语气和节奏

3. 脚本优化

优化要点:
- 节奏:前3秒抓住注意力,中间展示信息,最后强化记忆
- 文案:简洁有力,避免冗长
- 画面:视觉化,避免抽象描述
- 音乐:配合画面,增强情感

优化方法:
- 多次朗读:测试脚本朗读效果
- 模拟演练:模拟实际观看体验
- 朋友反馈:获取客观反馈

输出:
- 优化后的脚本
- 明确的镜头划分
- 画面和音乐的详细描述

故事板制作

1. 故事板类型

类型1:简单草图
- 快速绘制每个镜头的草图
- 标注构图、运镜方式
- 标注人物位置、道具等

类型2:详细故事板
- 绘制详细的场景图
- 标注具体时间点
- 标注转场方式
- 标注灯光、色彩等

类型3:AI 故事板
- 使用 AI 生成故事板图像
- 输入脚本,输出故事板
- 快速迭代多个版本

2. 故事板制作工具

工具推荐:
- 专业工具:Storyboarder、Toon Boom Storyboard Pro
- 设计软件:Photoshop、Figma、Sketch
- AI 工具:Kling AI、Pika 等 AI 生成工具

使用建议:
- 根据项目复杂度选择工具
- 简单项目:AI 工具快速生成
- 复杂项目:专业工具精确绘制
- 结合使用:AI 快速生成 + 专业工具优化

3. 故事板优化

优化要点:
- 构图:每个镜头构图清晰明确
- 流畅:镜头之间衔接自然
- 视觉:整体视觉风格统一
- 时长:每个镜头时长合理

优化方法:
- 团队评审:团队共同评审故事板
- AI 生成:AI 生成多个版本对比
- 参考对比:与优秀案例对比

输出:
- 最终故事板
- 镜头时长表
- 转场方式说明
- 视觉风格说明

阶段三:素材准备

视觉素材

1. 角色素材

如需角色:
- 角色设计:绘制或收集角色设计图
- 角色参考:收集角色参考图片
- 角色动作:设计角色动作参考

AI 生成:
- 参考图:使用角色参考图
- 一致性:多次生成保持角色一致
- 多角度:生成不同角度的角色图

2. 环境素材

环境参考:
- 地点参考:收集目标地点的参考图片
- 光照参考:收集不同光照的参考图
- 风格参考:收集风格参考图

AI 生成:
- 环境生成:生成不同环境背景
- 风格一致:保持环境风格一致
- 光照一致:保持光照风格一致

3. 产品素材

如需产品:
- 产品图片:准备产品多角度图片
- 产品视频:准备产品展示视频(如有)
- 3D 模型:准备产品 3D 模型(如有)

应用:
- 产品展示:在 AI 生成视频中展示产品
- 场景融入:将产品融入 AI 生成场景
- 风格匹配:产品风格与视频风格匹配

音频素材

1. 语音素材

AI 语音生成:
- 工具:Suno、Udio、ElevenLabs 等
- 方法:输入脚本,AI 生成语音
- 优化:调整语速、语调、情感

人工配音:
- 专业配音:找专业配音员
- 配音指导:提供配音要求和方向
- 多版配音:生成多个版本对比

2. 背景音乐

音乐选择:
- 风格匹配:音乐风格与视频风格匹配
- 节奏匹配:音乐节奏与视频节奏匹配
- 情感匹配:音乐情感与视频情感匹配

来源:
- 音乐库:Epidemic Sound、Artlist、PremiumBeat
- 免费音乐:YouTube Audio Library、Free Music Archive
- AI 生成:Suno、Udio 等 AI 音乐生成

3. 音效

音效选择:
- 场景音效:根据场景选择合适音效
- 动作音效:根据动作选择合适音效
- 环境音效:添加环境氛围音效

来源:
- 音效库:Freesound、Freesound Effects、Mixkit
- 音效生成:AI 生成特定音效

阶段四:AI 生成

平台选择

1. 根据需求选择

需求映射:
- 电影级制作 → Sora 2
- 专业广告 → Runway Gen-4.5
- Google 生态 → Veo 3.1
- 趣味内容 → Pika 2.0
- 电商/虚拟人 → Kling AI 2.0
- 快速创意 → Pika 2.0 / Kling AI 2.0

2. 成本考虑

成本对比:
- Sora 2:$10-20(30秒)
- Runway Gen-4.5:$15-30(30秒)
- Veo 3.1:$12-25(30秒)
- Pika 2.0:$5-15(30秒)
- Kling AI 2.0:$3-8(30秒)

选择策略:
- 高预算:Sora 2、Runway Gen-4.5
- 中等预算:Veo 3.1、Runway Gen-4.5
- 低预算:Pika 2.0、Kling AI 2.0

生成执行

1. 提示词构建

构建方法:
- 基于脚本:将脚本转换为提示词
- 结构化描述:使用提示词结构
- 权重控制:重要部分加大权重

示例:
根据脚本构建提示词:
"特写镜头,浅景深,侧光照明,暖色调,电影感。一位穿着白色婚纱的25岁新娘,在充满鲜花的教堂里站立,阳光从窗户射入,营造神圣、浪漫的氛围。新娘神情幸福,眼神温柔,双手交叠在胸前。背景是教堂内的鲜花装饰和彩色玻璃窗。"

2. 批量生成

生成策略:
- 多版本:一次生成多个版本
- 多平台:同时在不同平台生成
- 多参数:使用不同参数组合

生成数量:
- 每个镜头:生成 3-5 个版本
- 对比选择:人工对比后选择最佳
- 优化迭代:针对问题优化后重新生成

3. 质量筛选

筛选标准:
- 脚本符合度:是否符合脚本要求
- 质量评估:视觉质量、物理真实性、一致性
- 技术评估:分辨率、帧率、码率
- 成本评估:是否符合预算要求

筛选方法:
- 人工筛选:团队成员人工观看筛选
- 技术评估:使用专业软件评估
- 团队决策:集体决策最佳版本

输出:
- 每个镜头的最佳版本
- 质量评估报告
- 成本统计

问题处理

1. 常见问题识别

常见问题:
- 模糊:画面不清晰
- 伪影:生成算法产生的人工痕迹
- 一致性:角色、场景不一致
- 物理:物理规律不真实
- 时长:不满足时长要求

2. 问题解决

解决方法:
- 提示词优化:优化提示词描述
- 参数调整:调整生成参数
- 重新生成:优化后重新生成
- 后期修复:使用后期工具修复

具体方案:
- 模糊问题:提高分辨率、增加"清晰"提示词、后期超分辨率
- 伪影问题:增加"无伪影"负面提示词、后期修复
- 一致性问题:使用参考帧、分段生成拼接
- 物理问题:使用支持物理规则的平台、后期调整
- 时长问题:调整参数、分段生成拼接

阶段五:后期处理

剪辑处理

1. 剪辑软件选择

专业软件:
- Premiere Pro:最主流,功能全面
- Final Cut Pro:Mac 平台,性能优秀
- DaVinci Resolve:免费,调色强大
- After Effects:特效强大

轻量软件:
- 剪映:移动端,简单易用
- 必剪:移动端,功能全面
- CapCut:免费,功能不错

选择建议:
- 专业项目:Premiere Pro、DaVinci Resolve
- 中等项目:Final Cut Pro、After Effects
- 轻量项目:剪映、必剪、CapCut

2. 剪辑流程

标准流程:
1. 素材导入:导入所有镜头和素材
2. 粗剪:按照脚本拼接镜头
3. 精剪:微调每个镜头的起止点
4. 转场:添加转场效果
5. 调速:调整视频节奏
6. 输出:导出最终视频

技巧:
- 多轨道:使用多轨道组织素材
- 锁定轨道:锁定已完成的轨道
- 快捷键:熟练使用快捷键提高效率
- 自动保存:定时保存避免意外丢失

调色处理

1. 调色软件

专业软件:
- DaVinci Resolve:调色功能最强大
- Premiere Pro:内置调色工具
- Final Cut Pro:内置调色功能

调色插件:
- Colorista:强大的调色插件
- Magic Bullet:好莱坞风格调色
- FilmConvert:胶片风格调色

2. 调色流程

标准流程:
1. 白平衡:调整白平衡
2. 曝光:调整亮度和对比度
3. 色彩:调整色调和饱和度
4. 曲线:使用曲线微调
5. 风格:应用风格化调色
6. 管理器:使用调色管理器

调色风格:
- 电影感:对比度高,饱和度适中
- 暖色调:色温偏暖
- 冷色调:色温偏冷
- 复古感:降低饱和度,增加噪点

音频处理

1. 音频软件

专业软件:
- Audition:专业音频处理
- Pro Tools:专业音频编辑
- Logic Pro:专业音乐制作

轻量软件:
- Audacity:免费开源
- Adobe Audition CC:功能全面
- GarageBand:Mac 平台,简单易用

2. 音频处理流程

标准流程:
1. 音频导入:导入语音、音乐、音效
2. 对齐:对齐音频和视频
3. 混音:混合多个音频轨道
4. 音量:调整各轨道音量平衡
5. 效果:添加音频效果(混响、EQ等)
6. 输出:混音后导出

技巧:
- 关键帧:在关键帧标记音频变化
- 分轨处理:语音、音乐、音效分轨道处理
- 监听:多次监听不同设备效果
- 自动化:使用自动化功能提高效率

字幕处理

1. 字幕工具

专业软件:
- Subtitle Edit:专业字幕编辑
- Aegisub:开源免费
- 轻量软件:剪映、必剪内置字幕功能

AI 字幕:
- 自动识别:自动识别语音生成字幕
- 翻译:自动翻译字幕
- 语音合成:AI 生成多语言字幕

2. 字幕制作流程

标准流程:
1. 自动识别:自动识别语音生成字幕
2. 手动校对:校对字幕文本和时间码
3. 翻译(如需):翻译成目标语言
4. 排版:调整字幕字体、大小、颜色、位置
5. 导出:导出字幕文件(SRT、ASS等)

技巧:
- 分段处理:逐段处理提高准确性
- 参考翻译:使用翻译工具辅助
- 风格统一:保持字幕风格统一
- 测试观看:测试观看效果

阶段六:质量验收与交付

质量验收

1. 验收标准

视觉质量:
- 分辨率:达到目标分辨率
- 帧率:达到目标帧率
- 清晰度:画面清晰,无模糊
- 色彩:色彩真实,无偏色
- 噪点:无明显噪点

内容质量:
- 脚本符合:符合脚本要求
- 核心信息:核心信息传达清晰
- 品牌规范:符合品牌规范
- 合规要求:符合内容合规要求

技术质量:
- 文件大小:符合文件大小要求
- 兼容性:目标平台可播放
- 编码标准:符合编码标准

2. 验收方法

验收方法:
1. 人工观看:团队成员观看验收
2. 多设备测试:不同设备测试播放
3. 不同网络测试:不同网络环境测试
4. 用户测试:目标用户测试反馈
5. 合规检查:合规部门检查(如需)

验收流程:
- 多轮修改:根据反馈多轮修改
- 最终确认:所有相关方最终确认
- 归档:归档所有版本和修改记录

交付

1. 交付格式

视频格式:
- MP4:最通用格式
- MOV:高质量格式
- WebM:网页优化格式

分辨率:
- 1080p:通用高清
- 2K:高清+
- 4K:超高清

音频格式:
- AAC:通用音频编码
- MP3:通用音频格式
- WAV:无损音频格式

2. 交付文件

必要文件:
- 最终视频文件
- 字幕文件(如有)
- 项目文件(如需)

附加文件:
- 故事板
- 脚本
- 素材清单
- 制作说明

3. 交付方式

交付渠道:
- 云盘:百度网盘、Google Drive、OneDrive
- 传输:WeTransfer、百度网盘传输、FTP
- 平台:直接上传到目标平台
- 现场:现场交付并安装

交付说明:
- 文件说明:说明每个文件的用途
- 使用说明:说明如何使用视频
- 注意事项:重要注意事项

本章小结

通过本节学习,你应该掌握了:

完整创作流程

  • 6 个阶段的完整流程
  • 每个阶段的具体内容
  • 阶段之间的衔接关系

各阶段方法

  • 创意开发方法
  • 脚本撰写方法
  • 素材准备方法
  • AI 生成方法
  • 后期处理方法
  • 质量验收方法

工具使用

  • 各阶段推荐工具
  • 工具选择方法
  • 工具使用技巧

问题处理

  • 常见问题识别
  • 问题解决方法
  • 优化迭代方法

下一步:在下一节中,我们将了解 AI 视频生成在各行业的商业应用案例。


← 返回章节目录 | 继续学习:商业应用 →

最近更新

基于 MIT LICENSE 许可发布