Skip to content

序言

不是给你一张地图让你背下来,是让你知道从哪开始、往哪走、能走到哪。

先说几个事儿

第一,这个目录完全基于实际项目结构生成的。sidebar里有就是有,没有就是没有。我不画饼。

第二,学习顺序不强制。我的建议:零基础的从模块一走到模块十五——这是最简单的路径,每个模块5-6篇文章,不深,但够你站住脚。有基础的直接跳深度指南或者你感兴趣的模块,遇到不懂的再回头翻。

第三,先做出来比什么都重要。看100篇文章不如动手跑一个Agent。这个课程的设计理念就是:每个模块都有"检验标准"和"实践建议",别跳过。


基础知识(15个模块)

目标:零基础到能干活。预计3-6个月。 适合:所有想系统性理解AI Agent的人。

AI 概述与 Agent 概念

路径ai-basics/01-ai-overview/4篇文章:什么是AI → AI发展简史 → 什么是AI Agent → 为什么Agent是未来

从最根上开始。不讲数学,不讲算法,就讲清楚三件事:AI是什么、Agent是什么、为什么这两个东西结合在一起是大事。

检验标准:能用大白话跟朋友解释清楚AI Agent是啥。过了这关再往下走。

大语言模型基础

路径ai-basics/02-llm-fundamentals/5篇文章:什么是LLM → LLM如何工作 → 主流模型介绍 → 核心能力 → 挑战

LLM是Agent的"大脑"。这个模块不让你搞懂Transformer的内部数学——说实话大部分不需要懂——但让你明白Token是什么、Temperature调了有什么用、为什么模型会"幻觉"。

检验标准:能解释Token、Temperature、上下文窗口这三个概念。

提示词工程

路径ai-basics/03-prompt-engineering/5篇文章:提示词基础 → 提示词模式 → 进阶技巧 → 不同任务的设计 → 工具与资源

我花了很多时间研究这个。提示词不是"好好说话",是有模式有结构的。思维链、ReAct、角色扮演——这些模式学会了,跟AI沟通效率翻倍。

检验标准:能设计稳定输出指定格式的提示词。

Agent 基础与架构

路径ai-basics/04-agent-fundamentals/5篇文章:Agent架构 → Agent类型 → 记忆系统 → 工具使用 → 规划与推理

Agent的核心组件:感知、记忆、工具、规划、行动。这个模块讲清楚这些组件怎么拼在一起工作。

检验标准:能画出一个Agent的架构图,说出每部分干啥的。

RAG 与知识增强

路径ai-basics/05-rag-knowledge/6篇文章:什么是RAG → RAG流程 → 向量化 → 向量数据库 → 进阶RAG → RAG实践

RAG是目前最实用的Agent增强技术——没有之一。给Agent喂外部知识,让它不只靠训练数据活着。文档分块、向量检索、混合搜索,这些都是搭RAG系统的必修课。

检验标准:能搭一个基于文档的问答系统。

AI 编程工具

路径agent-ecosystem/06-ai-coding-tools/6篇文章:Cursor → Claude Code → 其他工具 → 最佳实践 → 环境搭建 → CC Switch配置

这块我熟。Cursor和Claude Code是目前最能打的两个AI编程工具。我的经验:Cursor更适合做产品原型,Claude Code更适合做复杂工程。CC Switch是我自己也在用的配置管理工具。

检验标准:能用AI编程工具从零搭一个Web应用。

Agent 生态与协议

路径agent-ecosystem/07-agent-ecosystem/6篇文章:Agent框架 → Agent平台 → MCP协议 → Skills系统 → Function Calling → Agent编排

MCP(Model Context Protocol)是Agent生态里最重要的协议,没有之一。LangChain/LangGraph是框架里生态最大的。这个模块帮你搞清楚整个Agent世界的地图。

检验标准:能搭一个MCP Server,能用LangGraph搭一个多Agent流程。

模型训练与优化

路径ai-basics/08-model-training/6篇文章:微调基础 → 准备 → 实践 → 优化 → 部署 → 评估

对大部分人来说,这个模块更多是"了解"而不是"上手"。但你得知道微调和RAG的区别、什么时候该微调什么时候不该、LoRA和QLoRA是什么。

检验标准:能判断一个场景该用RAG还是微调。

Agent Skills 系统

路径agent-ecosystem/09-agent-skills/5篇文章:什么是Skills → 技术架构 → 主流框架实现 → 设计与实战 → 生态与安全

Skills是给Agent装"技能包"的机制。Claude Code的Skills系统、OpenClaw的Skills系统、LangChain的工具链——本质都是给Agent划定行为边界和能力范围。

检验标准:能写一个基础的Skill文件并在Claude Code或OpenClaw中使用。

OpenClaw 开源 AI 助手

路径agent-ecosystem/10-openclaw/5篇文章:概览 → 架构 → 上手 → Skills与记忆 → 社区与展望

OpenClaw是一个开源AI Agent框架。它的Skill系统、四层记忆体系、Gateway架构很值得学习。

检验标准:能部署OpenClaw并跑通一个自定义Skill。

WorkBuddy 数字员工实践

路径agent-ecosystem/11-workbuddy/6篇文章:概览 → 通用办公 → 市场销售 → 技术研发 → 创意设计 → 用前必读

WorkBuddy是一个工作场景的Agent实践集。不做理论,全是怎么用AI干具体活——写周报、做竞品分析、调代码bug、画设计图。

检验标准:能用WorkBuddy完成一个日常工作流程的AI化改造。

AI 视频生成

路径agent-ecosystem/12-ai-video-generation/6篇文章:概述 → 主流平台 → 核心技术 → 实战指南 → 创作工作流 → 商业应用

Sora、Runway、可灵、Pika——AI视频生成的爆发速度比我想象的快。这个模块不教你做导演,教你理解这些工具能干什么、怎么用在工作流里。

检验标准:能用至少一个AI视频工具生成30秒以上的可用视频。

多模态 AI 技术

路径ai-basics/13-multimodal-ai/6篇文章:核心概念 → 模型架构 → 跨模态对齐 → 多模态Transformer → 应用场景 → Agent集成

能看懂文字、图片、音频、视频的模型——多模态是Agent从"聊天机器人"变成"能理解世界的助手"的关键一步。

检验标准:能说清楚多模态模型怎么对齐不同模态的信息,以及怎么集成到Agent里。

AI 图像生成

路径agent-ecosystem/14-ai-image-generation/6篇文章:概述 → 主流平台 → 开源生态 → 国内平台 → 提示词工程 → 商业应用

Midjourney、Stable Diffusion、DALL·E、文心一格、通义万相——AI做图已经被广泛接受了。我自己的经验:工具不重要,提示词的工程方法重要。

检验标准:能稳定生成符合需求的图像,理解不同平台的能力边界。

Markdown 阅读工具

路径tools-recommendation/15-markdown-reading-tools/6篇文章:Obsidian → Logseq → MarkText → Joplin → Zettlr → 横向对比

这是AI学习者的"基础知识管理器"。我的选择:Obsidian。原因?插件生态、纯本地、Markdown原生。但工具是手段不是目的。

检验标准:选定一个工具,建立自己的AI学习知识库体系。


深度指南(3个专题)

目标:从"知道"到"理解"。适合有基础后进阶学习。 每个指南10-14篇文章,可以单独学习。

专题一:Agent Skills 系统深度指南

路径deep-dive/agent-skills/14篇文章

从认知科学基础到企业级治理,系统拆解Skills的设计原理、形式化分析、跨框架互操作性、设计模式目录、Token优化、安全模型。

如果你要做自己的Agent或想深度理解Claude Code的Skills工作机制,这是必须读的。

和基础模块的关系:模块九(Agent Skills)是概览和实操,这里讲的是Why和How背后的设计逻辑。建议先读模块九,再有选择地读深度指南。

专题二:大模型上下文管理深度指南

路径deep-dive/context-management/14篇文章

Claude Code 51万行代码里我最吃惊的一个发现:它没有用向量数据库做记忆,而是用纯文本加grep搜索。为什么?因为上下文的本质不是"存多少",是"怎么让AI在需要的时候拿到对的信息"。

这个专题从原理解析到工具链全景,覆盖Wiki系统、代码即文档、RAG深度实践、多Agent上下文管理、安全与隐私——如果你想解决"AI记不住"这个核心痛点,值得花时间看完。

专题三:OpenClaw 深度指南

路径deep-dive/openclaw/14篇文章

从Gateway架构到Brain组件、Hands执行引擎、四层记忆体系到高级部署、安全模型、Live Canvas与A2UI协议。

如果你想把OpenClaw用在生产环境,或者想理解一个完整Agent框架的设计哲学,这个专题是很好的参考。

和基础模块的关系:模块十(OpenClaw)是入门上手,这里是架构级理解。


附录(6个参考页)

不是课程,是工具箱。用到的时候来翻。

页面路径用途
术语表appendix/glossary忘了概念回来查
工具清单appendix/tools-list选工具的时候翻
提示词模板库appendix/prompts-library写提示词没思路时抄
常见问题appendix/faq卡住了先看这
资源推荐appendix/resources学完了还想深入
更新日志appendix/changelog看我改了啥

学习路径建议

零基础

按顺序走模块一→十五 → 挑一个感兴趣的深度指南 → 遇到问题查附录

有基础(会用ChatGPT/Claude)

先看模块四(Agent架构)和模块七(生态协议)→ 直接冲深度指南 → 回头补不熟的模块

快速上手(不想看太多理论)

模块四(Agent架构)→ 模块七(生态协议)→ 模块十(OpenClaw上手)→ 模块十一(WorkBuddy实践)
→ 做完这个就够你开始干活了,遇到不懂的再翻其他模块

走独立开发路线(我的建议)

模块六(AI编程工具)→ 模块四(Agent架构)→ 模块七(生态+MCP)→ 深度指南一(Skills系统)
→ 然后直接动手做产品。代码不够让AI补,需求不对就改。先做出来。

几个提醒

  1. 这个目录跟项目sidebar是对应的。代码结构里没有的模块,课程目录里不会有。真实,不画饼。

  2. 每个模块的"检验标准"是硬门槛。过不了就别急着往下走——不是考试,是你真的听懂了。

  3. 深度指南不着急读。把15个基础模块过一遍再进深度——相当于先认识地图再研究地质。

  4. 附录是"用到再看"的。不用从头读到尾,那是工具书。

先读起来,再动手,再回头读。循环三次,你就不是新手了。

返回首页 | 开始学习

最近更新

基于 MIT LICENSE 许可发布