Skip to content

DeepSeek 与国产大模型

学习目标:了解国产大模型的整体格局,掌握 DeepSeek、Qwen、豆包、Kimi 等主流模型的能力和选型方法

预计时间:4-5 小时

前置知识:完成模块二「大语言模型基础」学习

最后更新:2026 年 5 月

模块介绍

国产大模型不是"国产平替",是实打实的全球玩家。

2026 年的今天,中国的 AI 大模型已经从"追赶者"变成了"并跑者"。DeepSeek V4 在推理和代码上追平 GPT,Qwen 开源家族覆盖 119 种语言,豆包日活用户数亿,Kimi 在超长上下文上杀出一条血路。

本模块不讲虚的。7 篇文章,每个模型给你"能力-场景-使用-成本"四件套,最后一张选型对比表,你拿去直接用。

本模块包含以下内容:

  • 国产大模型崛起背景 - 市场格局、发展脉络、竞争态势
  • DeepSeek 深度解析 - V4、R1、开源生态、API 使用
  • 通义千问与 Qwen 生态 - 模型家族、百炼平台、ModelScope
  • 豆包与字节 AI 矩阵 - 火山引擎、扣子(Coze)、字节系集成
  • Kimi 与其他国产模型 - Kimi K2.5、文心、GLM、讯飞、MiniMax
  • 选型指南 - 能力对比、成本分析、场景推荐

为什么要学这个模块?

说三个事实:

  1. 国产 API 价格是海外的 1/5 到 1/10。个人开发者做 MVP,国产模型是性价比首选。
  2. 中文能力不是差不多,是好很多。写中文文案、做中文客服、处理中文文档,国产模型天然优势。
  3. 开源生态活跃。Qwen、DeepSeek、GLM 都在 GitHub 上开源了核心模型权重,你能本地部署,能看明白它怎么想的。

不是"因为国产所以选",而是"因为好用所以选"。

学习方法

  1. 先看格局 - 01 讲整体背景,建立认知框架
  2. 逐个了解 - 02-05 每个模型的深度分析,挑你感兴趣的看
  3. 最终决策 - 06 选型对比表,直接对照需求选择
  4. 动手试试 - 每个模型都有 API 免费额度,去注册一个试试

章节列表

  1. 国产大模型崛起背景 - 2023-2026 发展脉络、市场规模、竞争格局
  2. DeepSeek 深度解析 - V4 能力、R1 推理、开源生态、API 使用
  3. 通义千问与 Qwen 生态 - Qwen 家族、百炼平台、ModelScope
  4. 豆包与字节 AI 矩阵 - 火山引擎、扣子、字节系集成
  5. Kimi 与其他国产模型 - Kimi K2.5、文心、GLM、星火、MiniMax
  6. 选型指南 - 能力对比、成本分析、场景推荐

学习检验

完成本模块学习后,你应该能够:

  • [ ] 说出国产大模型从 2023 到 2026 年的三个关键里程碑
  • [ ] 在 DeepSeek 官网注册并调用一次 API,完成文本生成
  • [ ] 区分 Qwen、DeepSeek、豆包、Kimi 的核心定位和优势场景
  • [ ] 根据任务需求(翻译、编程、长文档、创意写作)推荐合适的国产模型
  • [ ] 对比国产模型和海外模型的 API 定价,估算一次典型任务的成本
  • [ ] 知道在哪找到 Qwen/DeepSeek/GLM 的开源权重并本地部署

扩展阅读

官方平台:

社区资源:


← 返回课程目录 | 继续学习:国产大模型崛起背景 →

最近更新

基于 MIT LICENSE 许可发布