序言
不是给你一张地图让你背下来,是让你知道从哪开始、往哪走、能走到哪。
先说几个事儿
第一,这个目录完全基于实际项目结构生成的。sidebar里有就是有,没有就是没有。我不画饼。
第二,学习顺序不强制。我的建议:零基础的从模块一走到模块十五——这是最简单的路径,每个模块5-6篇文章,不深,但够你站住脚。有基础的直接跳深度指南或者你感兴趣的模块,遇到不懂的再回头翻。
第三,先做出来比什么都重要。看100篇文章不如动手跑一个Agent。这个课程的设计理念就是:每个模块都有"检验标准"和"实践建议",别跳过。
基础知识(15个模块)
目标:零基础到能干活。预计3-6个月。 适合:所有想系统性理解AI Agent的人。
AI 概述与 Agent 概念
路径:ai-basics/01-ai-overview/4篇文章:什么是AI → AI发展简史 → 什么是AI Agent → 为什么Agent是未来
从最根上开始。不讲数学,不讲算法,就讲清楚三件事:AI是什么、Agent是什么、为什么这两个东西结合在一起是大事。
检验标准:能用大白话跟朋友解释清楚AI Agent是啥。过了这关再往下走。
大语言模型基础
路径:ai-basics/02-llm-fundamentals/5篇文章:什么是LLM → LLM如何工作 → 主流模型介绍 → 核心能力 → 挑战
LLM是Agent的"大脑"。这个模块不让你搞懂Transformer的内部数学——说实话大部分不需要懂——但让你明白Token是什么、Temperature调了有什么用、为什么模型会"幻觉"。
检验标准:能解释Token、Temperature、上下文窗口这三个概念。
提示词工程
路径:ai-basics/03-prompt-engineering/5篇文章:提示词基础 → 提示词模式 → 进阶技巧 → 不同任务的设计 → 工具与资源
我花了很多时间研究这个。提示词不是"好好说话",是有模式有结构的。思维链、ReAct、角色扮演——这些模式学会了,跟AI沟通效率翻倍。
检验标准:能设计稳定输出指定格式的提示词。
Agent 基础与架构
路径:ai-basics/04-agent-fundamentals/5篇文章:Agent架构 → Agent类型 → 记忆系统 → 工具使用 → 规划与推理
Agent的核心组件:感知、记忆、工具、规划、行动。这个模块讲清楚这些组件怎么拼在一起工作。
检验标准:能画出一个Agent的架构图,说出每部分干啥的。
RAG 与知识增强
路径:ai-basics/05-rag-knowledge/6篇文章:什么是RAG → RAG流程 → 向量化 → 向量数据库 → 进阶RAG → RAG实践
RAG是目前最实用的Agent增强技术——没有之一。给Agent喂外部知识,让它不只靠训练数据活着。文档分块、向量检索、混合搜索,这些都是搭RAG系统的必修课。
检验标准:能搭一个基于文档的问答系统。
AI 编程工具
路径:agent-ecosystem/06-ai-coding-tools/6篇文章:Cursor → Claude Code → 其他工具 → 最佳实践 → 环境搭建 → CC Switch配置
这块我熟。Cursor和Claude Code是目前最能打的两个AI编程工具。我的经验:Cursor更适合做产品原型,Claude Code更适合做复杂工程。CC Switch是我自己也在用的配置管理工具。
检验标准:能用AI编程工具从零搭一个Web应用。
Agent 生态与协议
路径:agent-ecosystem/07-agent-ecosystem/6篇文章:Agent框架 → Agent平台 → MCP协议 → Skills系统 → Function Calling → Agent编排
MCP(Model Context Protocol)是Agent生态里最重要的协议,没有之一。LangChain/LangGraph是框架里生态最大的。这个模块帮你搞清楚整个Agent世界的地图。
检验标准:能搭一个MCP Server,能用LangGraph搭一个多Agent流程。
模型训练与优化
路径:ai-basics/08-model-training/6篇文章:微调基础 → 准备 → 实践 → 优化 → 部署 → 评估
对大部分人来说,这个模块更多是"了解"而不是"上手"。但你得知道微调和RAG的区别、什么时候该微调什么时候不该、LoRA和QLoRA是什么。
检验标准:能判断一个场景该用RAG还是微调。
Agent Skills 系统
路径:agent-ecosystem/09-agent-skills/5篇文章:什么是Skills → 技术架构 → 主流框架实现 → 设计与实战 → 生态与安全
Skills是给Agent装"技能包"的机制。Claude Code的Skills系统、OpenClaw的Skills系统、LangChain的工具链——本质都是给Agent划定行为边界和能力范围。
检验标准:能写一个基础的Skill文件并在Claude Code或OpenClaw中使用。
OpenClaw 开源 AI 助手
路径:agent-ecosystem/10-openclaw/5篇文章:概览 → 架构 → 上手 → Skills与记忆 → 社区与展望
OpenClaw是一个开源AI Agent框架。它的Skill系统、四层记忆体系、Gateway架构很值得学习。
检验标准:能部署OpenClaw并跑通一个自定义Skill。
WorkBuddy 数字员工实践
路径:agent-ecosystem/11-workbuddy/6篇文章:概览 → 通用办公 → 市场销售 → 技术研发 → 创意设计 → 用前必读
WorkBuddy是一个工作场景的Agent实践集。不做理论,全是怎么用AI干具体活——写周报、做竞品分析、调代码bug、画设计图。
检验标准:能用WorkBuddy完成一个日常工作流程的AI化改造。
AI 视频生成
路径:agent-ecosystem/12-ai-video-generation/6篇文章:概述 → 主流平台 → 核心技术 → 实战指南 → 创作工作流 → 商业应用
Sora、Runway、可灵、Pika——AI视频生成的爆发速度比我想象的快。这个模块不教你做导演,教你理解这些工具能干什么、怎么用在工作流里。
检验标准:能用至少一个AI视频工具生成30秒以上的可用视频。
多模态 AI 技术
路径:ai-basics/13-multimodal-ai/6篇文章:核心概念 → 模型架构 → 跨模态对齐 → 多模态Transformer → 应用场景 → Agent集成
能看懂文字、图片、音频、视频的模型——多模态是Agent从"聊天机器人"变成"能理解世界的助手"的关键一步。
检验标准:能说清楚多模态模型怎么对齐不同模态的信息,以及怎么集成到Agent里。
AI 图像生成
路径:agent-ecosystem/14-ai-image-generation/6篇文章:概述 → 主流平台 → 开源生态 → 国内平台 → 提示词工程 → 商业应用
Midjourney、Stable Diffusion、DALL·E、文心一格、通义万相——AI做图已经被广泛接受了。我自己的经验:工具不重要,提示词的工程方法重要。
检验标准:能稳定生成符合需求的图像,理解不同平台的能力边界。
Markdown 阅读工具
路径:tools-recommendation/15-markdown-reading-tools/6篇文章:Obsidian → Logseq → MarkText → Joplin → Zettlr → 横向对比
这是AI学习者的"基础知识管理器"。我的选择:Obsidian。原因?插件生态、纯本地、Markdown原生。但工具是手段不是目的。
检验标准:选定一个工具,建立自己的AI学习知识库体系。
深度指南(3个专题)
目标:从"知道"到"理解"。适合有基础后进阶学习。 每个指南10-14篇文章,可以单独学习。
专题一:Agent Skills 系统深度指南
路径:deep-dive/agent-skills/14篇文章
从认知科学基础到企业级治理,系统拆解Skills的设计原理、形式化分析、跨框架互操作性、设计模式目录、Token优化、安全模型。
如果你要做自己的Agent或想深度理解Claude Code的Skills工作机制,这是必须读的。
和基础模块的关系:模块九(Agent Skills)是概览和实操,这里讲的是Why和How背后的设计逻辑。建议先读模块九,再有选择地读深度指南。
专题二:大模型上下文管理深度指南
路径:deep-dive/context-management/14篇文章
Claude Code 51万行代码里我最吃惊的一个发现:它没有用向量数据库做记忆,而是用纯文本加grep搜索。为什么?因为上下文的本质不是"存多少",是"怎么让AI在需要的时候拿到对的信息"。
这个专题从原理解析到工具链全景,覆盖Wiki系统、代码即文档、RAG深度实践、多Agent上下文管理、安全与隐私——如果你想解决"AI记不住"这个核心痛点,值得花时间看完。
专题三:OpenClaw 深度指南
路径:deep-dive/openclaw/14篇文章
从Gateway架构到Brain组件、Hands执行引擎、四层记忆体系到高级部署、安全模型、Live Canvas与A2UI协议。
如果你想把OpenClaw用在生产环境,或者想理解一个完整Agent框架的设计哲学,这个专题是很好的参考。
和基础模块的关系:模块十(OpenClaw)是入门上手,这里是架构级理解。
附录(6个参考页)
不是课程,是工具箱。用到的时候来翻。
| 页面 | 路径 | 用途 |
|---|---|---|
| 术语表 | appendix/glossary | 忘了概念回来查 |
| 工具清单 | appendix/tools-list | 选工具的时候翻 |
| 提示词模板库 | appendix/prompts-library | 写提示词没思路时抄 |
| 常见问题 | appendix/faq | 卡住了先看这 |
| 资源推荐 | appendix/resources | 学完了还想深入 |
| 更新日志 | appendix/changelog | 看我改了啥 |
学习路径建议
零基础
按顺序走模块一→十五 → 挑一个感兴趣的深度指南 → 遇到问题查附录有基础(会用ChatGPT/Claude)
先看模块四(Agent架构)和模块七(生态协议)→ 直接冲深度指南 → 回头补不熟的模块快速上手(不想看太多理论)
模块四(Agent架构)→ 模块七(生态协议)→ 模块十(OpenClaw上手)→ 模块十一(WorkBuddy实践)
→ 做完这个就够你开始干活了,遇到不懂的再翻其他模块走独立开发路线(我的建议)
模块六(AI编程工具)→ 模块四(Agent架构)→ 模块七(生态+MCP)→ 深度指南一(Skills系统)
→ 然后直接动手做产品。代码不够让AI补,需求不对就改。先做出来。几个提醒
这个目录跟项目sidebar是对应的。代码结构里没有的模块,课程目录里不会有。真实,不画饼。
每个模块的"检验标准"是硬门槛。过不了就别急着往下走——不是考试,是你真的听懂了。
深度指南不着急读。把15个基础模块过一遍再进深度——相当于先认识地图再研究地质。
附录是"用到再看"的。不用从头读到尾,那是工具书。
先读起来,再动手,再回头读。循环三次,你就不是新手了。
