DeepSeek 与国产大模型
学习目标:了解国产大模型的整体格局,掌握 DeepSeek、Qwen、豆包、Kimi 等主流模型的能力和选型方法
预计时间:4-5 小时
前置知识:完成模块二「大语言模型基础」学习
最后更新:2026 年 5 月
模块介绍
国产大模型不是"国产平替",是实打实的全球玩家。
2026 年的今天,中国的 AI 大模型已经从"追赶者"变成了"并跑者"。DeepSeek V4 在推理和代码上追平 GPT,Qwen 开源家族覆盖 119 种语言,豆包日活用户数亿,Kimi 在超长上下文上杀出一条血路。
本模块不讲虚的。7 篇文章,每个模型给你"能力-场景-使用-成本"四件套,最后一张选型对比表,你拿去直接用。
本模块包含以下内容:
- 国产大模型崛起背景 - 市场格局、发展脉络、竞争态势
- DeepSeek 深度解析 - V4、R1、开源生态、API 使用
- 通义千问与 Qwen 生态 - 模型家族、百炼平台、ModelScope
- 豆包与字节 AI 矩阵 - 火山引擎、扣子(Coze)、字节系集成
- Kimi 与其他国产模型 - Kimi K2.5、文心、GLM、讯飞、MiniMax
- 选型指南 - 能力对比、成本分析、场景推荐
为什么要学这个模块?
说三个事实:
- 国产 API 价格是海外的 1/5 到 1/10。个人开发者做 MVP,国产模型是性价比首选。
- 中文能力不是差不多,是好很多。写中文文案、做中文客服、处理中文文档,国产模型天然优势。
- 开源生态活跃。Qwen、DeepSeek、GLM 都在 GitHub 上开源了核心模型权重,你能本地部署,能看明白它怎么想的。
不是"因为国产所以选",而是"因为好用所以选"。
学习方法
- 先看格局 - 01 讲整体背景,建立认知框架
- 逐个了解 - 02-05 每个模型的深度分析,挑你感兴趣的看
- 最终决策 - 06 选型对比表,直接对照需求选择
- 动手试试 - 每个模型都有 API 免费额度,去注册一个试试
章节列表
- 国产大模型崛起背景 - 2023-2026 发展脉络、市场规模、竞争格局
- DeepSeek 深度解析 - V4 能力、R1 推理、开源生态、API 使用
- 通义千问与 Qwen 生态 - Qwen 家族、百炼平台、ModelScope
- 豆包与字节 AI 矩阵 - 火山引擎、扣子、字节系集成
- Kimi 与其他国产模型 - Kimi K2.5、文心、GLM、星火、MiniMax
- 选型指南 - 能力对比、成本分析、场景推荐
学习检验
完成本模块学习后,你应该能够:
- [ ] 说出国产大模型从 2023 到 2026 年的三个关键里程碑
- [ ] 在 DeepSeek 官网注册并调用一次 API,完成文本生成
- [ ] 区分 Qwen、DeepSeek、豆包、Kimi 的核心定位和优势场景
- [ ] 根据任务需求(翻译、编程、长文档、创意写作)推荐合适的国产模型
- [ ] 对比国产模型和海外模型的 API 定价,估算一次典型任务的成本
- [ ] 知道在哪找到 Qwen/DeepSeek/GLM 的开源权重并本地部署
扩展阅读
官方平台:
- DeepSeek 官网 - V4 模型体验和 API
- 通义千问 - Qwen 在线体验
- 火山方舟 - 豆包 API 平台
- Kimi - 超长上下文对话
社区资源:
- ModelScope - 阿里开源模型社区
- Hugging Face 中国镜像 - 国内加速下载
- GitHub - DeepSeek - DeepSeek 开源项目
- GitHub - QwenLM - Qwen 开源项目
