序言

不是给你一张地图让你背下来，是让你知道从哪开始、往哪走、能走到哪。

公众号

先说几个事儿

第一，这个目录完全基于实际项目结构生成的。sidebar里有就是有，没有就是没有。我不画饼。

第二，学习顺序不强制。我的建议：零基础的从模块一走到模块十五——这是最简单的路径，每个模块5-6篇文章，不深，但够你站住脚。有基础的直接跳深度指南或者你感兴趣的模块，遇到不懂的再回头翻。

第三，先做出来比什么都重要。看100篇文章不如动手跑一个Agent。这个课程的设计理念就是：每个模块都有"检验标准"和"实践建议"，别跳过。

基础知识（20个模块）

目标：零基础到能干活。预计3-6个月。适合：所有想系统性理解AI Agent的人。

AI 概述与 Agent 概念

路径：ai-basics/01-ai-overview/4篇文章：什么是AI → AI发展简史 → 什么是AI Agent → 为什么Agent是未来

从最根上开始。不讲数学，不讲算法，就讲清楚三件事：AI是什么、Agent是什么、为什么这两个东西结合在一起是大事。

检验标准：能用大白话跟朋友解释清楚AI Agent是啥。过了这关再往下走。

大语言模型基础

路径：ai-basics/02-llm-fundamentals/5篇文章：什么是LLM → LLM如何工作 → 主流模型介绍 → 核心能力 → 挑战

LLM是Agent的"大脑"。这个模块不让你搞懂Transformer的内部数学——说实话大部分不需要懂——但让你明白Token是什么、Temperature调了有什么用、为什么模型会"幻觉"。

检验标准：能解释Token、Temperature、上下文窗口这三个概念。

提示词工程

路径：ai-basics/03-prompt-engineering/5篇文章：提示词基础 → 提示词模式 → 进阶技巧 → 不同任务的设计 → 工具与资源

我花了很多时间研究这个。提示词不是"好好说话"，是有模式有结构的。思维链、ReAct、角色扮演——这些模式学会了，跟AI沟通效率翻倍。

检验标准：能设计稳定输出指定格式的提示词。

Agent 基础与架构

路径：ai-basics/04-agent-fundamentals/5篇文章：Agent架构 → Agent类型 → 记忆系统 → 工具使用 → 规划与推理

Agent的核心组件：感知、记忆、工具、规划、行动。这个模块讲清楚这些组件怎么拼在一起工作。

检验标准：能画出一个Agent的架构图，说出每部分干啥的。

RAG 与知识增强

路径：ai-basics/05-rag-knowledge/6篇文章：什么是RAG → RAG流程 → 向量化 → 向量数据库 → 进阶RAG → RAG实践

RAG是目前最实用的Agent增强技术——没有之一。给Agent喂外部知识，让它不只靠训练数据活着。文档分块、向量检索、混合搜索，这些都是搭RAG系统的必修课。

检验标准：能搭一个基于文档的问答系统。

AI 编程工具

路径：agent-ecosystem/06-ai-coding-tools/8篇文章：AI编程概述与趋势 → Cursor → Claude Code → Windsurf/Antigravity → Codex与Kiro → Trae与国内工具 → 工具组合最佳实践 → 从零搭建实战

这块我熟。2026年的AI编程工具格局已经大变样了——Cursor 3.x 的Agent模式、Claude Code 2.1的Skills/Hooks、Windsurf被Google收购、OpenAI出了Codex CLI、字节的Trae免费可用。竞争越激烈，对咱们越有利。我的经验："Cursor做手、Claude Code做脑、Codex做腿"——不同工具打不同位置。

检验标准：能根据不同场景选择合适的 AI 编程工具组合，并用工具从零完成一个完整项目。

Agent 生态与协议

路径：agent-ecosystem/07-agent-ecosystem/6篇文章：Agent框架 → Agent平台 → MCP协议 → Skills系统 → Function Calling → Agent编排

MCP（Model Context Protocol）是Agent生态里最重要的协议，没有之一。LangChain/LangGraph是框架里生态最大的。这个模块帮你搞清楚整个Agent世界的地图。

检验标准：能搭一个MCP Server，能用LangGraph搭一个多Agent流程。

模型训练与优化

路径：ai-basics/08-model-training/6篇文章：微调基础 → 准备 → 实践 → 优化 → 部署 → 评估

对大部分人来说，这个模块更多是"了解"而不是"上手"。但你得知道微调和RAG的区别、什么时候该微调什么时候不该、LoRA和QLoRA是什么。

检验标准：能判断一个场景该用RAG还是微调。

Agent Skills 系统

路径：agent-ecosystem/09-agent-skills/5篇文章：什么是Skills → 技术架构 → 主流框架实现 → 设计与实战 → 生态与安全

Skills是给Agent装"技能包"的机制。Claude Code的Skills系统、OpenClaw的Skills系统、LangChain的工具链——本质都是给Agent划定行为边界和能力范围。

检验标准：能写一个基础的Skill文件并在Claude Code或OpenClaw中使用。

OpenClaw 开源 AI 助手

路径：agent-ecosystem/10-openclaw/5篇文章：概览 → 架构 → 上手 → Skills与记忆 → 社区与展望

OpenClaw是一个开源AI Agent框架。它的Skill系统、四层记忆体系、Gateway架构很值得学习。

检验标准：能部署OpenClaw并跑通一个自定义Skill。

WorkBuddy 数字员工实践

路径：agent-ecosystem/11-workbuddy/6篇文章：概览 → 通用办公 → 市场销售 → 技术研发 → 创意设计 → 用前必读

WorkBuddy是一个工作场景的Agent实践集。不做理论，全是怎么用AI干具体活——写周报、做竞品分析、调代码bug、画设计图。

检验标准：能用WorkBuddy完成一个日常工作流程的AI化改造。

AI 视频生成

路径：agent-ecosystem/12-ai-video-generation/6篇文章：概述 → 主流平台 → 核心技术 → 实战指南 → 创作工作流 → 商业应用

Sora、Runway、可灵、Pika——AI视频生成的爆发速度比我想象的快。这个模块不教你做导演，教你理解这些工具能干什么、怎么用在工作流里。

检验标准：能用至少一个AI视频工具生成30秒以上的可用视频。

多模态 AI 技术

路径：ai-basics/13-multimodal-ai/6篇文章：核心概念 → 模型架构 → 跨模态对齐 → 多模态Transformer → 应用场景 → Agent集成

能看懂文字、图片、音频、视频的模型——多模态是Agent从"聊天机器人"变成"能理解世界的助手"的关键一步。

检验标准：能说清楚多模态模型怎么对齐不同模态的信息，以及怎么集成到Agent里。

AI 图像生成

路径：agent-ecosystem/14-ai-image-generation/6篇文章：概述 → 主流平台 → 开源生态 → 国内平台 → 提示词工程 → 商业应用

Midjourney、Stable Diffusion、DALL·E、文心一格、通义万相——AI做图已经被广泛接受了。我自己的经验：工具不重要，提示词的工程方法重要。

检验标准：能稳定生成符合需求的图像，理解不同平台的能力边界。

Markdown 阅读工具

路径：tools-recommendation/15-markdown-reading-tools/6篇文章：Obsidian → Logseq → MarkText → Joplin → Zettlr → 横向对比

这是AI学习者的"基础知识管理器"。我的选择：Obsidian。原因？插件生态、纯本地、Markdown原生。但工具是手段不是目的。

检验标准：选定一个工具，建立自己的AI学习知识库体系。

AI 音频与音乐生成

路径：agent-ecosystem/16-ai-audio-generation/6篇文章：概述 → 文本转语音 → AI 音乐生成 → 声音克隆 → 商业场景 → 工具横评

ElevenLabs、Suno、Boomy——AI不只是能写字和画图了，还能说话、唱歌、作曲。从文本转语音到AI音乐生成到声音克隆，这个模块带你把这些工具全用一遍。

检验标准：能用至少一个 AI 音频工具生成可用的语音或音乐素材。

AI 搜索与知识获取

路径：agent-ecosystem/17-ai-search-knowledge/6篇文章：概述 → Perplexity → 国内搜索工具 → Deep Research → 搜索方法论 → 工具横评

搜索已经从"找链接"变成"直接给答案"了。Perplexity、秘塔、纳米AI、Kimi搜索——这个模块帮你建立AI时代的搜索思维，不是教你怎么搜，是教你怎么问。

检验标准：能用 AI 搜索工具完成一次完整的研究任务，并说清楚它与传统搜索的区别。

零代码 Agent 构建

路径：agent-ecosystem/18-nocode-agent-building/6篇文章：概述 → Coze上手 → Dify实践 → 知识库与工作流 → 插件工具 → 完整案例

不写代码也能搭Agent。Coze、Dify、FastGPT——从"用AI"到"造AI"的思维转变。这个模块带你从零搭建一个带知识库和工作流的Agent，不需要写一行代码。

检验标准：能用零代码平台搭建一个具备知识库和工作流的 Agent，并成功部署。

DeepSeek 与国产大模型

路径：ai-basics/20-domestic-llm/6篇文章：背景 → DeepSeek → 通义千问 → 豆包 → Kimi与其他 → 选型指南

国产模型已经不是"平替"了，是实打实的头部玩家。DeepSeek V4/R1、通义千问、豆包、Kimi——这个模块帮你理清每家的核心优势和适用场景。这套课程就是用DeepSeek写的，你学完也该知道它多能打。

检验标准：能说清至少 3 个国产大模型的核心优势和适用场景，能根据需求选择合适的模型。

AI 自动化工作流

路径：agent-ecosystem/21-ai-automation-workflow/6篇文章：概述 → Zapier → n8n → Make → 流水线设计 → 个人AI工作站

整个基础模块的毕业课。Zapier、n8n、Make——把前面学的AI工具全串起来，变成7×24小时自动跑的流水线。从单独用工具到造流水线，这才是AI效率的终极形态。

检验标准：能搭建一个包含 3 个以上节点的 AI 自动化工作流，并实际运行出结果。

深度指南（3个专题）

目标：从"知道"到"理解"。适合有基础后进阶学习。每个指南10-14篇文章，可以单独学习。

专题一：Agent Skills 系统深度指南

路径：deep-dive/agent-skills/14篇文章

从认知科学基础到企业级治理，系统拆解Skills的设计原理、形式化分析、跨框架互操作性、设计模式目录、Token优化、安全模型。

如果你要做自己的Agent或想深度理解Claude Code的Skills工作机制，这是必须读的。

和基础模块的关系：模块九（Agent Skills）是概览和实操，这里讲的是Why和How背后的设计逻辑。建议先读模块九，再有选择地读深度指南。

专题二：大模型上下文管理深度指南

路径：deep-dive/context-management/14篇文章

Claude Code 51万行代码里我最吃惊的一个发现：它没有用向量数据库做记忆，而是用纯文本加grep搜索。为什么？因为上下文的本质不是"存多少"，是"怎么让AI在需要的时候拿到对的信息"。

这个专题从原理解析到工具链全景，覆盖Wiki系统、代码即文档、RAG深度实践、多Agent上下文管理、安全与隐私——如果你想解决"AI记不住"这个核心痛点，值得花时间看完。

专题三：OpenClaw 深度指南

路径：deep-dive/openclaw/14篇文章

从Gateway架构到Brain组件、Hands执行引擎、四层记忆体系到高级部署、安全模型、Live Canvas与A2UI协议。

如果你想把OpenClaw用在生产环境，或者想理解一个完整Agent框架的设计哲学，这个专题是很好的参考。

和基础模块的关系：模块十（OpenClaw）是入门上手，这里是架构级理解。

附录（6个参考页）

不是课程，是工具箱。用到的时候来翻。

页面	路径	用途
术语表	`appendix/glossary`	忘了概念回来查
工具清单	`appendix/tools-list`	选工具的时候翻
提示词模板库	`appendix/prompts-library`	写提示词没思路时抄
常见问题	`appendix/faq`	卡住了先看这
资源推荐	`appendix/resources`	学完了还想深入
更新日志	`appendix/changelog`	看我改了啥

学习路径建议

零基础

按顺序走模块一→十五 → 挑一个感兴趣的深度指南 → 遇到问题查附录

有基础（会用ChatGPT/Claude）

先看模块四（Agent架构）和模块七（生态协议）→ 直接冲深度指南 → 回头补不熟的模块

快速上手（不想看太多理论）

模块四（Agent架构）→ 模块七（生态协议）→ 模块十（OpenClaw上手）→ 模块十一（WorkBuddy实践）
→ 做完这个就够你开始干活了，遇到不懂的再翻其他模块

走独立开发路线（我的建议）

模块六（AI编程工具）→ 模块四（Agent架构）→ 模块七（生态+MCP）→ 深度指南一（Skills系统）
→ 然后直接动手做产品。代码不够让AI补，需求不对就改。先做出来。

几个提醒

这个目录跟项目sidebar是对应的。代码结构里没有的模块，课程目录里不会有。真实，不画饼。
每个模块的"检验标准"是硬门槛。过不了就别急着往下走——不是考试，是你真的听懂了。
深度指南不着急读。把15个基础模块过一遍再进深度——相当于先认识地图再研究地质。
附录是"用到再看"的。不用从头读到尾，那是工具书。

先读起来，再动手，再回头读。循环三次，你就不是新手了。

返回首页 | 开始学习

序言 ​

先说几个事儿 ​

基础知识（20个模块） ​

AI 概述与 Agent 概念 ​

大语言模型基础 ​

提示词工程 ​

Agent 基础与架构 ​

RAG 与知识增强 ​

AI 编程工具 ​

Agent 生态与协议 ​

模型训练与优化 ​

Agent Skills 系统 ​

OpenClaw 开源 AI 助手 ​

WorkBuddy 数字员工实践 ​

AI 视频生成 ​

多模态 AI 技术 ​

AI 图像生成 ​

Markdown 阅读工具 ​

AI 音频与音乐生成 ​

AI 搜索与知识获取 ​

零代码 Agent 构建 ​

DeepSeek 与国产大模型 ​

AI 自动化工作流 ​

深度指南（3个专题） ​

专题一：Agent Skills 系统深度指南 ​

专题二：大模型上下文管理深度指南 ​

专题三：OpenClaw 深度指南 ​

附录（6个参考页） ​

学习路径建议 ​

零基础 ​

有基础（会用ChatGPT/Claude） ​

快速上手（不想看太多理论） ​

走独立开发路线（我的建议） ​

几个提醒 ​

序言