主流平台详解

学习目标：深入了解 Midjourney、DALL-E 3、Adobe Firefly、Stable Diffusion 3 / FLUX 四大主流 AI 绘画平台的核心特性、优劣势和适用场景
预计时间：50 分钟
难度：⭐⭐

平台选型的重要性

选择正确的平台往往比掌握复杂的提示词技巧更重要。当前的 AI 绘画市场呈现出"术业有专攻"的特性——每个平台都有自己最擅长的领域和最适用的场景：

平台	一句话定位	最擅长
Midjourney	艺术美感的极致追求者	创意概念、广告视觉、艺术设计
DALL-E 3	最精准的提示词理解者	快速原型、插画、教育内容
Adobe Firefly	版权安全的商业设计助手	商业设计、品牌物料、企业级应用
Stable Diffusion / FLUX	完全可控的开源自由派	自定义部署、批量生成、精细化控制

选型建议

如果你是初次接触 AI 绘画，建议从 Midjourney 或通义万相开始，体验最佳的开箱即用效果。如果你有明确的商业化需求，重点关注 Adobe Firefly 的版权安全性。如果你是开发者或技术爱好者，Stable Diffusion 和 FLUX 的开源生态将给你最大的自由度。

1. Midjourney

一句话定位

Midjourney 是当前 AI 绘画领域艺术美感最强的平台，以其独特的审美风格和极高的图像质量，成为创意设计师的首选工具。

核心能力

最新版本：V8 Alpha（2026 年 3 月）

Midjourney V8 Alpha 是迄今为止最大的一次版本更新，建立在全新的 GPU 原生代码基础上：

5 倍速度提升：单张图像生成从 V7 的 30-60 秒降至 10 秒以内
原生 2K 分辨率：通过 --hd 参数直接输出原生 2K 图像，无需额外放大步骤
实时模式：V8.1 Alpha（2026 年 4 月）已将 HD 模式设为默认，原生 2K 图像无需显式 upscale
改进的文本渲染：引号内的文字字符串在图像中渲染更可靠
更好的提示词理解：复杂多元素提示词的跟随精度显著提升
Style Creator：从参考图像中提取可复用的视觉风格，生成可分享的风格代码

版本演进

版本	发布时间	核心改进
V6.1	2024 年 7 月	图像连贯性、提示词理解、文本渲染初步改进
V7	2025 年 6 月	新架构、默认模型，显著提升质量和一致性和个性化能力
V8 Alpha	2026 年 3 月	全新 GPU 原生代码、5 倍速度、原生 2K 分辨率
V8.1 Alpha	2026 年 4 月	默认 HD 模式，原生 2K 无需显式放大
Niji 7	2026 年 1 月	动漫/二次元风格专用模型

交互方式

Midjourney 最初完全基于 Discord 运行，但从 2025 年开始提供了完整的 Web 界面：

Discord 命令：传统方式，在 Discord 服务器中使用 /imagine 等斜杠命令
Web UI：访问 midjourney.com 使用完整功能的 Web 界面，Discord 已变为可选
Alpha 版本：alpha.midjourney.com 提供了 V8 Alpha 的访问入口

参数系统

Midjourney 拥有最丰富的参数体系，允许用户精细控制生成结果：

参数	全称	作用	常用值
`--ar`	Aspect Ratio	宽高比	`16:9`, `4:3`, `1:1`, `9:16`
`--s` / `--stylize`	Stylize	风格化强度	0-1000（默认 100）
`--c` / `--chaos`	Chaos	结果多样性	0-100
`--v`	Version	模型版本	`6.1`, `7`, `8`
`--iw`	Image Weight	参考图权重	0.5-2.0（图生图时）
`--no`	Negative Prompt	排除元素	`--no text, watermarks`
`--cref`	Character Reference	角色一致性参考	图像 URL
`--sref`	Style Reference	风格一致性参考	图像 URL
`--p` / `--personalize`	Personalization	个性化风格	启用/禁用
`--hd`	HD Mode	原生 2K 输出	V8 专用，消耗 4 倍额度
`--q 4`	Quality 4	增强连贯性	复杂场景专用，消耗 4 倍额度
`--weird`	Weird	创意怪异度	0-3000
`--raw`	Raw Mode	减少 Midjourney 风格干预	启用/禁用

特色功能

Blend（混合）：将 2-5 张图像混合，融合各自视觉特征
Describe（描述）：上传图像让 AI 反推提示词（"以图生文"）
Pan / Reframe（平移/重新构图）：延展画布任意方向，自动补全新内容
Character Reference（角色参考）：使用 --cref 参数，跨图像保持角色面部和服装一致
Style Reference（风格参考）：使用 --sref 参数，将参考图像的风格应用于新生成
Moodboard（情绪板）：V8 新增，组合多张参考图像进行风格融合

定价方案（2026 年 4 月）

套餐	月付	年付（折合月付）	快速 GPU 时长	Relax 模式	隐身模式	适用人群
Basic	$10	$8	3.3 小时（约 200 张）	无	无	爱好者
Standard	$30	$24	15 小时（约 900 张）	无限	无	设计师
Pro	$60	$48	30 小时（约 1800 张）	无限	有	代理/客户工作
Mega	$120	$96	60 小时（约 3600 张）	无限	有	高产工作室

年付可节省 20%
所有付费套餐均包含 商业使用权
年营收超过 100 万美元的企业必须使用 Pro 或 Mega 套餐
额外 GPU 时间：$4/小时
无免费版：免费版已于 2024 年底停用

Premium 功能消耗

V8 的部分高级功能消耗更多计算资源：

功能	消耗倍数	速度影响
标准生成	1x	基准
`--hd`（2K 分辨率）	4x	比标准慢 4 倍
`--q 4`（增强连贯性）	4x	比标准慢 4 倍
风格参考 `--sref`	4x	比标准慢 4 倍
情绪板参考	4x	比标准慢 4 倍

优势与局限

优势	局限
✅ 最佳美学质量：艺术感和构图能力无人能及	❌ 无免费版：最低 $10/月
✅ 活跃社区：Discord 和 Web 社区创作氛围浓厚	❌ 无公开 API：企业 API 需邀请
✅ 持续快速更新：V8 的重写彰显长期投入	❌ 文字渲染仍不完美：虽然 V8 改进，但仍不如 DALL-E 3
✅ 商业授权友好：所有付费套餐皆含	❌ 封闭生态：无法像 SD 那样深度定制
✅ 个性化系统：`--p` 参数可学习个人审美偏好	❌ 隐私有限：需要隐身模式（Pro 以上）

适用场景

创意概念设计：游戏角色、电影场景、建筑前期概念
广告视觉：品牌海报、社交媒体创意内容
艺术设计：插画、数字艺术、平面设计
灵感获取：快速生成多个创意方向供参考

快速上手

text

1. 访问 midjourney.com 注册账号（需付费套餐）
2. 选择 Standard 或 Pro 套餐（建议 Standard 起步）
3. 进入 Web UI 或加入 Discord 服务器
4. 输入你的第一个提示词：
   /imagine prompt: a serene mountain landscape at sunset, cinematic lighting, --ar 16:9 --v 8
5. 使用 U1-U4 放大图像，V1-V4 生成变体
6. 使用 --sref 或 --cref 探索风格/角色控制

新手提示

Midjourney 的 Web UI 比 Discord 更适合初学者，界面更直观。但 Discord 社区的氛围和分享机制仍然是 Midjourney 体验的重要组成部分。建议 Web UI 创作 + Discord 社区学习的双通道使用方式。

2. DALL-E 3

一句话定位

DALL-E 3 是提示词理解最精准的 AI 绘画平台，能够以极高的忠实度执行复杂的文本描述，特别擅长在图像中嵌入文字。

核心能力

集成方式

DALL-E 3 由 OpenAI 开发，深度集成在 ChatGPT 生态中：

ChatGPT 集成：通过对话界面直接生成图片，支持多轮编辑
API 接口：提供标准 API（已于 2026 年 5 月 12 日停止服务）
技术架构：自回归图像合成，原生构建在 ChatGPT / GPT-4o 基础设施之上

API 已停用

OpenAI 于 2026 年 5 月 12 日停止了 DALL-E 3 API 服务。开发者需要迁移到 FLUX、Stable Diffusion 3.5 或 ModelsLab 等替代方案。ChatGPT 内的图像生成功能不受影响。

核心技术优势

文字渲染能力：DALL-E 3 是目前在图像中渲染文字最可靠的模型——标签、标志、海报文字等都能准确呈现
复杂指令遵循：能够理解并执行包含多个对象、位置关系、属性描述的复杂提示词
ChatGPT 提示词优化：GPT-4 自动优化用户提示词后再传给 DALL-E 3，大幅提升生成质量
HD 质量模式：可选 "vivid"（超现实、电影感，ChatGPT 默认）和 "natural"（写实、摄影风）
多轮对话编辑：在 ChatGPT 中通过对话进行局部重绘（Inpainting），无需手动遮罩

支持尺寸

尺寸	比例
1024×1024	1:1 正方形
1024×1792	9:16 竖版（最适合社交媒体故事/海报）
1792×1024	16:9 横版（最适合封面/演示）

局限性

严格的内容政策：拒绝生成公众人物、在世艺术家风格、暴力/成人内容
风格控制有限：无法像 Midjourney 的 --sref 或 SD 的 LoRA 那样精细控制风格
无变异/图生图 API：API 不支持生成变体或图像到图像的操作
API 已停用（2026 年 5 月 12 日），开发者需寻找替代方案
作为独立工具能力有限：离开了 ChatGPT 对话界面，DALL-E 3 的编辑和迭代体验大打折扣

定价方案

访问方式	价格	生成限额
ChatGPT 免费版	$0/月	每天 2 张图像
ChatGPT Plus	$20/月	无限量（含 GPT-4o、数据分析等）
ChatGPT Team	$25/人/月	无限量（含团队协作功能）
ChatGPT Enterprise	自定义	无限量 + 企业级管理

优势与局限

优势	局限
✅ 最佳提示词理解：复杂指令忠实执行	❌ API 已停用：不再适用于开发集成
✅ 最佳文字渲染：图像中文字最可靠	❌ 风格控制弱：无法精细调整风格
✅ ChatGPT 深度集成：对话式编辑体验流畅	❌ 内容政策严格：创作自由度受限
✅ 免费可用：每天 2 张，零成本入门	❌ 独立性弱：离开 ChatGPT 功能减半
✅ 提示词自动优化：GPT-4 自动润色描述	❌ 输出尺寸有限：最大 1792×1024

适用场景

快速原型：产品概念、UI/UX 方案快速可视化
插画创作：绘本、儿童书籍、科普插图
教育内容：教学插图、信息图表、知识可视化
社交媒体：封面图、配图、含文字的传播内容
故事板：分镜设计、场景概念速写

快速上手

text

1. 访问 chat.openai.com 注册账号
2. 免费用户每天 2 次，Plus 用户无限量
3. 在聊天框中输入描述（支持中文）：
   "请生成一张海报，主题是夏日水果茶，主视觉为玻璃杯装的水果茶，
   杯中有柠檬片、草莓和薄荷叶，背景是温暖的阳光和木质桌面。
   在海报下方显示文字'夏日限定·清爽一夏'"
4. 如不满意，可在对话中进一步修改：
   "把背景换成渐变粉色，文字改成金色"
5. 使用 vivid（生动）或 natural（自然）模式切换风格取向

提示词技巧

DALL-E 3 最适合具象、细节丰富的描述。不需要写 MJ 式的艺术词汇，清晰地说出"画面里有什么、什么颜色、什么位置、什么风格"即可。GPT-4 会自动把你的描述优化成 DALL-E 3 能最佳理解的格式。

3. Adobe Firefly

一句话定位

Adobe Firefly 是版权最安全的 AI 绘画平台，其训练数据基于 Adobe Stock 等经过授权的图像，适合商业和企业级应用。

核心能力

产品定位

Adobe 将 Firefly 定位为"一站式创意 AI 工作室"，不仅仅是一个图像生成工具，而是 Adobe 整个生态系统（Photoshop、Premiere Pro、Illustrator、Express、Acrobat）的 AI 能力内核。

集成生态

Firefly 最独特的优势在于与 Adobe 专业设计工具的深度集成：

工具	集成方式	核心功能
Photoshop	内置 Generative Fill	局部填充、扩展、去除对象、参考图支持
Illustrator	矢量图形 AI 增强	文本到矢量图形、颜色方案生成
Express	快速设计模板	AI 辅助社交媒体内容、海报、传单创作
Premiere Pro	视频 AI 编辑	Quick Cut、音频增强、色彩调整
Acrobat	PDF 文档处理	AI 视觉内容增强
Figma	插件	设计稿 AI 图像生成

30+ 合作伙伴模型生态

Firefly 最大的亮点之一是其开放的模型选择策略——用户不再只能使用 Adobe 自家的模型，而是可以从 30+ 合作伙伴模型中选择：

Adobe 版权安全 Firefly 模型
Google Nano Banana 2 & Veo 3.1
OpenAI GPT Image Generation / GPT Image 2
Runway Gen-4.5
Black Forest Labs FLUX.2 [pro]
Kling 3.0 & Kling 3.0 Omni
Luma AI Ray3.14
ElevenLabs Multilingual v2
Topaz Lab Topaz Astra

Firefly AI Assistant（2026 年 4 月公开测试版）

Firefly AI Assistant 是 Adobe 最具野心的 AI 功能，能够：

跨 Photoshop、Premiere、Firefly 等工具编排多步骤工作流
访问 60+ 专业级工具
执行"从图库选一张图 → 用 AI 扩展画布 → 添加文字 → 导出为海报"等连贯操作

图像编辑功能（2026 年 3 月更新）

功能	描述
Generative Fill（生成式填充）	添加、替换或优化元素，结果符合上下文语境
Generative Remove（生成式移除）	快速消除不需要的物体
Generative Expand（生成式扩展）	无缝适应图像到新的尺寸和比例
Generative Upscale（生成式放大）	提高分辨率，锐化细节
Remove Background（移除背景）	一键抠图
Precision Flow（精确流）	滑块式浏览同一提示词的多个变体
AI Markup（AI 标记）	直接在图像上用画笔/矩形绘制指定区域

2026 年 Photoshop Generative Fill 更新

重新设计的界面，支持参考图像
上下文任务栏中的模型选择器
默认模型：Firefly Fill & Expand
合作伙伴模型：Gemini 3 (Nano Banana Pro)、FLUX.2 pro
界面内可实时查看 AI 信用余额

版权优势

Firefly 最大的差异化优势是其版权安全性：

训练数据基于 Adobe Stock 授权内容和公开领域内容
为商业使用设计的版权保障框架
Adobe 对生成的图像提供版权赔偿保护（针对付费用户）
特别适合品牌物料、广告投放、企业级设计等对版权敏感的场景

定价方案

套餐	月费	特点
免费版	$0	有限生成次数，基础功能
Firefly Premium	~$5-10/月	更多生成额度，AI 标记等功能
Creative Cloud 含 Firefly	$5-55/月	取决于 CC 套餐，含深度集成功能
Photoshop 网页版 (免费)	$0	20 次免费 Generative Fill
Photoshop 网页版 (付费)	套餐内含	无限次 Generative Fill

2026 年 2 月起，Firefly 推出了无限生成推广，付费用户可使用行业领先模型（Google Nano Banana Pro、GPT Image Generation、Runway Gen-4 Image、Adobe Firefly 模型）无限生成，且支持 2K 分辨率。

优势与局限

优势	局限
✅ 版权最安全：授权训练数据 + 版权赔偿	❌ 独立使用体验中等：最佳体验需 Adobe 生态
✅ Photoshop 深度集成：专业设计师无缝衔接	❌ 学习曲线：要善用 Firefly，最好熟悉 Adobe 工具
✅ 30+ 模型选择：自由切换不同 AI 模型	❌ 生成质量：部分场景不及 Midjourney 的艺术性
✅ 企业级功能：团队协作、品牌资产管理	❌ 高价套餐：完整功能需 CC 订阅，费用较高
✅ AI Assistant：跨应用自动化工作流	❌ 独立网页版功能有限：高级功能需下载软件

适用场景

商业设计：品牌 VI、企业宣传物料、产品包装
商业化敏感的版权项目：广告投放、电商主图、出版物
Photoshop 用户增效：在现有设计工作流中嵌入 AI 能力
照片编辑和后期：扩展画布、移除物体、智能填充
批量营销素材：广告创意的快速多版本生成

快速上手

text

1. 访问 firefly.adobe.com 免费注册（可用 Google/Apple ID 登录）
2. 首次使用：免费体验 Text to Image
3. 输入提示词（支持中文）：
   "A modern minimalist living room with large windows, 
    warm natural light, beige sofa, green plants, 
    wooden floor, bright and airy atmosphere"
4. 使用 Precision Flow 滑块浏览同一提示词的多个变体
5. 如需编辑：将图像发送到 Photoshop，使用 Generative Fill
6. 尝试 AI Markup：在图像上画一个矩形，输入 "a vase of flowers"
7. 进阶：在 Photoshop 中使用 Reference Image 功能控制生成方向

Firefly 的独特价值

如果你已经在使用 Adobe Creative Cloud，Firefly 是最自然的选择——它不只是一个独立的生成工具，而是嵌入到 Photoshop、Illustrator 等工作流程中的 AI 能力。对于纯图像生成，Midjourney 可能质量更高；但对于"生成后还需要编辑加工"的专业工作流，Firefly 的集成优势无可替代。

4. Stable Diffusion 3 / FLUX

一句话定位

Stable Diffusion 和 FLUX 代表了 AI 绘画的"开源自由派"——它们提供最大化的控制自由度和定制能力，让技术用户能够做到商业平台无法实现的事情。

背景：两脉同源

Stable Diffusion 和 FLUX 有着共同的基因——FLUX 的创始团队正是 Stable Diffusion 核心算法的原始创建者：

维度	Stability AI（SD 3.5）	Black Forest Labs（FLUX.2）
成立时间	2020 年	2024 年
总部	伦敦，英国	弗莱堡，德国
创始人	Emad Mostaque（原 CEO）	Robin Rombach、Andreas Blattmann 等
核心贡献	Stable Diffusion 系列普及化	SD 核心算法的原始创建者
模型架构	MMDiT（Multi-Modal DiT）	Latent Flow Matching + Mistral VLM
开源理念	开源权重，限制性许可证	分层开源，Apache 2.0 / 非商业 / 商业
2026 最新	SD 3.5 Medium/Large	FLUX.2 [pro]/[flex]/[dev]/[klein]

FLUX.2 模型家族（2025 年 11 月）

FLUX.2 是一个生产级图像生成和编辑系统，核心特性包括：

多参考编辑：同时参考最多 10 张图像
精确色彩控制：指定精确的颜色值
结构化提示词：支持结构化输入格式
最高 4MP 输出：四百万像素级别的输出
角色和风格一致性：跨参考图像保持一致性
文字渲染准确率：92%（复杂布局）
空间关系错误率：降低 37%

模型	参数量	许可证	最适合
FLUX.2 [pro]	-	商业 API	生产环境，最高质量
FLUX.2 [flex]	-	商业 API	开发者控制，可调步数和引导强度
FLUX.2 [dev]	32B	非商业（开源权重）	研究、微调
FLUX.2 [klein] 4B	4B	Apache 2.0	本地部署、亚秒级推理、消费级 GPU
FLUX.2 [klein] 9B	9B	非商业	更高质量的本地部署

FLUX.2 [klein] 的历史意义

2026 年 1 月发布的 FLUX.2 [klein] 4B 模型，仅需约 8GB VRAM（RTX 3090/4070+），即可在消费级显卡上实现亚秒级图像生成。它还将文生图、单参考编辑、多参考编辑集成到一个模型中，并以 Apache 2.0 协议开源。这意味着：你可以在自己的电脑上毫秒级生成高质量图像，完全不需要联网，也无需支付任何 API 费用。

Stable Diffusion 3.5 模型家族

SD 3.5 是 Stability AI 的最新版本，采用 MMDiT（Multi-Modal Diffusion Transformer）架构：

模型	参数量	VRAM 需求	特点
SD 3.5 Medium	~2B	9.9GB	专为消费级硬件设计
SD 3.5 Large	~8B	>12GB	最强的提示词遵循能力和质量
SD 3.5 Large Turbo	~8B（蒸馏版）	>12GB	蒸馏加速，速度更快

开放权重（社区许可证）
SD 3.5 Large 已有 ControlNet 支持
自托管、本地定制、构建者优先工作流的最佳选择

生态对比：FLUX vs Stable Diffusion

维度	FLUX	Stable Diffusion
图像质量	当前最佳（pro 模型）	优秀，但略逊 FLUX
文字渲染	优秀（92% 准确率）	良好
提示词遵循	流匹配架构，非常优秀	MMDiT，表现良好
照片级真实感	两者均优秀	两者均优秀
社区生态	较新，快速成长中	成熟，LoRA/检查点最丰富
开源程度	分层开源	权重更开放
商业 API	明确的费率卡，生产就绪	Stable Image Ultra/Core
本地速度	klein 4B 亚秒级	需要更高配置
微调生态	LoRA 支持已就绪	最大规模的 LoRA 生态系统

Sub-second 推理

FLUX.2 [klein] 4B 的发布标志着 AI 绘画进入"实时生成"时代：

单张图像生成时间 < 1 秒（消费级 GPU）
仅需约 8GB VRAM（RTX 3090/4070+）
Apache 2.0 许可证，完全自由使用
文生图、单参考编辑、多参考编辑三合一

这意味着用户可以做到：

text

原本的流程（SD 1.5/XL）：
输入提示词 → 等待 3-10 秒 → 查看结果 → 不满意 → 修改提示词 → 再等 3-10 秒

FLUX.2 [klein] 的流程：
输入提示词 → 不到 1 秒出图 → 不满意 → 修改 → 再不到 1 秒出图
（迭代速度提升了 10 倍，创作体验从"等待"变成"互动"）

优势与局限

优势	局限
✅ 最大化控制：参数、模型、流程完全自由	❌ 需要技术基础：搭建 ComfyUI、配置环境有一定门槛
✅ 离线可用：本地运行，无需联网，隐私无忧	❌ 硬件要求：消费级方案需要 RTX 3090/4070+
✅ 零成本（开源模型）：自部署无需平台订阅费	❌ 效果需调优：开箱效果不如 MJ，需搭配模型/LoRA
✅ 无限扩展：LoRA、ControlNet、自定义训练	❌ 社区分散：模型、工具来自不同社区，需自行整合
✅ 批量生成：适合大规模自动化生产任务	❌ 版权不确定性：训练数据来源存在争议

适用场景

自部署需求：企业内部数据安全要求，不能使用云端服务
自定义训练：需要用自己的数据集微调模型
批量生成：电商产品图、游戏素材等大规模生产
精细化控制：使用 ControlNet 精确控制构图、姿态、深度
研究与开发：模型调优、架构实验、学术研究
工作流集成：嵌入到现有的内容生产管线中

快速上手

text

方案一：云端免配置体验（推荐新手）
1. 访问 replicate.com 或 civitai.com 在线体验
2. 搜索 FLUX.2 或 SD 3.5 模型
3. 直接输入提示词生成，无需本地配置
4. 下载其他用户分享的 LoRA 模型体验定制效果

方案二：本地部署（推荐开发者）
1. 安装 ComfyUI（comfy.org）
2. 下载 FLUX.2 [klein] 4B 模型
3. 启动 ComfyUI，加载默认工作流
4. 在 ComfyUI 中构建或导入工作流
5. 使用 ControlNet、LoRA 等高级功能

方案三：企业 API（推荐商用）
1. 注册 Black Forest Labs API（FLUX.2 [pro]）
2. 或使用 Stability AI API（Stable Image Ultra/Core）
3. 按使用量付费，无需管理基础设施

本地部署的需求评估

在投入时间搭建本地部署之前，请先评估你的真实需求：是否真的需要离线运行？是否确实需要 ControlNet 级别的控制？如果是初学者，建议先使用云端体验验证效果满意后，再决定是否投入本地部署。

5. 平台对比总览

核心维度对比

维度	Midjourney	DALL-E 3	Adobe Firefly	SD 3.5 / FLUX
图像质量	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐
提示词遵循	⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐
文字渲染	⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐（FLUX）
风格可控性	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐⭐
定制化程度	⭐⭐⭐	⭐⭐	⭐⭐⭐	⭐⭐⭐⭐⭐
商业版权友好	✅ 付费版	⚠️ 视情况	✅ 最友好	⚠️ 取决于模型许可证
易用性	⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐
免费方案	❌	✅ 每天 2 张	✅ 有限次数	✅ 自部署免费

商业维度对比

维度	Midjourney	DALL-E 3	Adobe Firefly	SD 3.5 / FLUX
月费	$10-120	$0 / $20	$0 / $5-55	$0（自部署）
年费优惠	20% 折扣	无	包含在 CC 年费	不适用
API 可用	❌ 无公开 API	❌ 已停用	✅ 支持	✅ FLUX/SD API
隐身/隐私模式	✅ Pro 以上	✅ ChatGPT	✅ 企业版	✅ 本地运行
批量生产能力	一般	一般	中等	最佳
离线可用	❌	❌	❌	✅

场景推荐

如果你需要...	推荐平台
最强的艺术美感和创意灵感	Midjourney
快速将想法可视化，含文字	DALL-E 3
商业用途，版权安全优先	Adobe Firefly
完全控制，自定义工作流	SD 3.5 / FLUX
在 Photoshop 中编辑	Adobe Firefly
低成本的批量生成	FLUX（自部署）
零花钱开始体验 AI 绘画	DALL-E 3（免费版）
学习和研究 AI 绘画技术	SD 3.5 / FLUX（开源版）

6. 新手入门指南

分步推荐路径

不同背景的用户可以按照不同的路径入门：

路径 A：零基础小白（最推荐）

text

第一步：DALL-E 3 免费版（Day 1，30 分钟）
- 注册 ChatGPT 免费账号
- 体验每天 2 张免费图像
- 重点感受：AI 绘画的能力边界

第二步：Midjourney Standard（Day 2-7，2 小时）
- 订阅 $30/月 Standard 套餐
- 学习基础提示词语法和参数
- 重点感受：AI 绘画的最好效果

第三步：Firefly 免费版（Day 7-14，1 小时）
- 注册 Adobe 账号
- 体验 Photoshop Generative Fill
- 重点感受：AI 与设计工具的集成

路径 B：设计师/创意从业者

text

第一步：Midjourney Standard（立即订阅）
- 投入时间学习参数系统（--ar, --s, --sref, --cref）
- 建立个人提示词库和风格库

第二步：Adobe Firefly（配合现有工作流）
- 如果你的工作流包含 Photoshop，安装 Firefly
- 使用 Generative Fill 加速设计迭代

第三步：按需学习 FLUX / SD（进阶）
- 当需要特定风格或更精细控制时
- 从 ComfyUI 云端体验开始

路径 C：开发者/技术用户

text

第一步：云端体验 FLUX / SD
- 访问 replicate.com 或 civitai.com
- 测试不同模型的效果差异

第二步：本地部署 ComfyUI + FLUX.2 [klein]
- 安装 ComfyUI
- 下载 FLUX.2 [klein] 4B 模型
- 构建第一个工作流

第三步：深入高级功能
- 尝试 ControlNet 精确控制构图
- 训练自己的 LoRA 模型
- 接入 API 实现自动化生成

免费体验总结

平台	免费体验内容	体验地址
DALL-E 3	每天 2 张图像	chat.openai.com
Adobe Firefly	有限生成次数	firefly.adobe.com
FLUX / SD	云端免费体验（部分平台）	replicate.com / civitai.com
通义万相	注册送灵感值，每日签到	tongyi.aliyun.com/wanxiang
即梦 AI	每日 60-100 积分	jimeng.jianying.com
可灵 AI	免费积分制	klingai.com

7. 本章小结

核心要点回顾

通过本节学习，你应该掌握了四大主流平台的核心特征：

Midjourney -- 艺术美感之王

V8 Alpha 带来 5 倍速度和原生 2K
丰富的参数体系（--sref、--cref 等）
最适合创意设计、广告视觉、艺术创作

DALL-E 3 -- 提示词理解冠军

与 ChatGPT 深度集成，文字渲染最佳
免费可用（每天 2 张），API 已停用
最适合快速原型、插画、含文字的内容

Adobe Firefly -- 商业版权最安全

30+ 合作伙伴模型生态，Photoshop 深度集成
授权训练数据 + 版权赔偿保护
最适合企业设计、品牌物料、商业应用

SD 3.5 / FLUX -- 开源自由派

FLUX.2 [klein] 4B 亚秒级消费级推理
ControlNet、LoRA 实现的像素级控制
最适合自部署、自定义、批量生成

选型决策树

text

你是哪种用户？
├── 零基础，想快速体验最佳效果
│   ├── 有预算 → Midjourney
│   └── 无预算 → DALL-E 3 免费版 / 通义万相
├── 设计师，需要与设计软件配合
│   ├── Adobe 用户 → Firefly + Photoshop
│   └── 独立创作 → Midjourney
├── 开发者，需要自动化/批量
│   ├── 需要完全控制 → FLUX / SD + ComfyUI
│   └── 需要 API → FLUX.2 [pro] API
└── 企业用户，版权安全优先
    ├── Adobe 生态用户 → Firefly 企业版
    └── 需要专用模型 → FLUX API + 定制训练

拓展阅读

提示词工程：提示词工程与创作 -- 学会写出高质量的提示词
开源生态：开源生态与本地部署 -- 深入 ComfyUI、ControlNet、LoRA
中国平台：中国 AI 绘画平台 -- 了解国产平台的独特优势
设计系统集成：商业应用与案例 -- AI 绘画的实际商业应用

下一步：在下一节中，我们将深入开源生态，了解 ComfyUI 工作流、ControlNet 空间控制和 LoRA 风格微调的核心技术。

← 返回章节目录 | 继续学习：开源生态与本地部署 →

主流平台详解 ​

平台选型的重要性 ​

1. Midjourney ​

一句话定位 ​

核心能力 ​

最新版本：V8 Alpha（2026 年 3 月） ​

版本演进 ​

交互方式 ​

参数系统 ​

特色功能 ​

定价方案（2026 年 4 月） ​

Premium 功能消耗 ​

优势与局限 ​

适用场景 ​

快速上手 ​

2. DALL-E 3 ​

一句话定位 ​

核心能力 ​

集成方式 ​

核心技术优势 ​

支持尺寸 ​

局限性 ​

定价方案 ​

优势与局限 ​

适用场景 ​

快速上手 ​

3. Adobe Firefly ​

一句话定位 ​

核心能力 ​

产品定位 ​

集成生态 ​

30+ 合作伙伴模型生态 ​

Firefly AI Assistant（2026 年 4 月公开测试版） ​

图像编辑功能（2026 年 3 月更新） ​

2026 年 Photoshop Generative Fill 更新 ​

版权优势 ​

定价方案 ​

优势与局限 ​

适用场景 ​

快速上手 ​

4. Stable Diffusion 3 / FLUX ​

一句话定位 ​

背景：两脉同源 ​

FLUX.2 模型家族（2025 年 11 月） ​

Stable Diffusion 3.5 模型家族 ​

生态对比：FLUX vs Stable Diffusion ​

Sub-second 推理 ​

优势与局限 ​

适用场景 ​

快速上手 ​

5. 平台对比总览 ​

核心维度对比 ​

商业维度对比 ​

场景推荐 ​

6. 新手入门指南 ​

分步推荐路径 ​

路径 A：零基础小白（最推荐） ​

路径 B：设计师/创意从业者 ​

路径 C：开发者/技术用户 ​

免费体验总结 ​

7. 本章小结 ​

核心要点回顾 ​

选型决策树 ​

拓展阅读 ​

主流平台详解

平台选型的重要性

1. Midjourney

一句话定位

核心能力

最新版本：V8 Alpha（2026 年 3 月）

版本演进

交互方式

参数系统

特色功能

定价方案（2026 年 4 月）

Premium 功能消耗

优势与局限

适用场景

快速上手

2. DALL-E 3

一句话定位

核心能力

集成方式

核心技术优势

支持尺寸

局限性

定价方案

优势与局限

适用场景

快速上手

3. Adobe Firefly

一句话定位

核心能力

产品定位

集成生态

30+ 合作伙伴模型生态

Firefly AI Assistant（2026 年 4 月公开测试版）

图像编辑功能（2026 年 3 月更新）

2026 年 Photoshop Generative Fill 更新

版权优势

定价方案

优势与局限

适用场景

快速上手

4. Stable Diffusion 3 / FLUX

一句话定位

背景：两脉同源

FLUX.2 模型家族（2025 年 11 月）

Stable Diffusion 3.5 模型家族

生态对比：FLUX vs Stable Diffusion

Sub-second 推理

优势与局限

适用场景

快速上手

5. 平台对比总览

核心维度对比

商业维度对比

场景推荐

6. 新手入门指南

分步推荐路径

路径 A：零基础小白（最推荐）

路径 B：设计师/创意从业者

路径 C：开发者/技术用户

免费体验总结

7. 本章小结

核心要点回顾

选型决策树

拓展阅读