FREE PREVIEW
觉然
JORAN

AI 101

从零开始理解 AI — 概念 · 工具 · 实操 · 未来

关于 AI 的文章铺天盖地,但大多数要么是程序员写给程序员看的,要么是营销号在贩卖焦虑。真正从普通人的视角出发,把 Agent、模型、工具这些概念讲明白的内容,一直很少。

这个领域变化很快,快到任何一份文档写完就可能过时。但有些东西不会过时——对概念的理解、对新工具底层框架的直觉、对变化的判断。

这本书想带给你的是后者。不需要技术背景,迭代二十余版,每一版都给不同背景的人读过——读到大家都说"看得懂了",才放出来。

2026 年 3 月 · v1.0

目录

第一章   AI Agent 篇 — 从终局开始理解
  1. 从 OpenClaw 说起 — 什么是 AI Agent
  2. Computer Use — 看起来很美,为什么现在不行
  3. 给 Agent 装上手和脚 — MCP · API
第二章   认知篇 — 理解 AI
  1. LLM 是什么?两个比喻看清本质 + 上下文窗口与 Token
  2. 两条技术路线 + Scaling Law
第三章   工具篇 — 使用 AI
  1. 笔者的 Agent 实验与工具推荐
  2. 本地模型 + 国内环境限制
第四章   实战篇 — 终端上手操作
  1. 从 App 到终端 — 工具选择与安装
  2. Skills — 给 Agent 装"外挂"
第一章

AI Agent 篇 — 从终局开始理解

Agent 能帮你干什么活?先看全貌,再拆开每个零件。

1从 OpenClaw 说起 — 什么是 AI Agent
OpenClaw 火了
2026 年初,你大概刷到过一只龙虾。

不是真龙虾——是一个叫 OpenClaw 的开源项目。Logo 是一只龙虾,所以整个科技圈都管它叫"龙虾"。GitHub 上星标一路飙到超过 30 万,超越 React 成为最受关注的开源项目。国内腾讯、阿里、字节、智谱、月之暗面等近十家大厂争先推出兼容产品或一键部署工具,社交媒体上铺天盖地都是"龙虾教程"和"龙虾实战"。

人们管它叫"私人秘书""AI 管家""数字员工"——说是装好之后,它能像真人助理一样操作你的电脑:回邮件、填表格、做 PPT、搜资料、甚至网上购物。
一个真实的故事
我有个朋友,被这些教程刷得心痒难耐。她前前后后折腾了好几天——查教程、配环境、踩了不少坑,总算把龙虾装上了。装好之后她先拿简单的事试了试手,让它整理个文件、写封邮件,感觉还行。于是她踌躇满志地给龙虾下了一条真正的指令:

"帮我去赚钱吧,你可以访问我的账户进行操作。"

结果龙虾回了一段话,大意是:"这个我做不了。不过如果你想赚钱的话,我可以帮你找工作。"

她把截图发给我的时候,我俩都乐了。赚钱的事没成,AI 倒是给了个挺实在的建议。
笑归笑,这个故事背后有个值得想想的问题:一个号称"能操作电脑干活"的 AI,为什么却没办法像人一样去炒股呢?不是说 AI 要替代人工吗,它怎么连这都做不了?

要回答这个问题,得先搞清楚这只龙虾——也就是 AI Agent——到底是个什么东西。
OpenClaw 是什么 — 一层一层拆开看
OpenClaw 属于一种叫 AI Agent(智能体)的东西。听着挺唬人,其实概念很简单。

你平时用的 ChatGPT、DeepSeek、豆包,本质上都是 Chatbot(聊天机器人)——你问一句,它答一句;你要它改个图、写段话,它就给你改、给你写。但让它自己去拆解一个复杂任务、找合适的工具、一步步执行到底?做不到。你问一步,它走一步,你不说话它就停了。

Agent(智能体)不一样。你给它一个目标,它自己拆任务、找工具、执行、检查结果、决定下一步——全程不需要你盯着。

打个比方:Chatbot 是那种你不发消息就绝不会主动干活的同事;Agent 是你说一句"把这个项目跟进一下",它就自己拆分任务、协调资源、一路推到底的项目经理。
你的指令
"帮我做个网站"
规划
拆成 5 步
调工具
写代码、读文件
自检
测试、修 bug
交付
可运行的网站
OpenClaw 和 Claude Code、Trae 一样,都是 Agent。如果把 Agent 想象成一个人,它由三个部分组成:大脑(模型)+ 手脚(工具)+ 记忆(上下文)。OpenClaw 本身是一个框架——它不绑定任何特定模型,你可以把不同的模型"插"进去当大脑。
模型(你选的)
大脑:理解 + 推理
OpenClaw 框架
骨架:规划 + 调度
工具(MCP/Skills 等)
手和脚:执行任务
Agent 的三个支柱
🧠 大脑:LLM

推理、理解、决策。模型越强 Agent 越聪明。(第二章详讲)

🔧 手脚:工具调用

连接外部世界。没有手脚只能说不能做。(本章第 2-3 节详讲)

💭 记忆:上下文

记住进度和目标。长上下文让 Agent 能处理复杂任务。

最关键的一点:模型是天花板你听到的所有 Agent 产品——Claude Code、OpenClaw、Trae——它们的核心都是一个模型。模型不够聪明,给它再多工具也没用——就像一个毫无乐感的人,你给他一架施坦威钢琴,他也弹不出动听的曲子。

Agent 用来思考和推理的是文字模型(LLM)。但当任务涉及图片或视频时,Agent 会接入其他类型的模型——比如用 Nano Banana(Google)生图,用 Seedance(字节)生视频。不同任务调不同模型,Agent 负责调度,你只管提需求
为什么 OpenClaw 让人兴奋,又为什么现在还不够好
龙虾之所以火,是因为它第一次让普通人看到了一种真实的可能性:Agent 不只是跟你聊天,它能动手帮你干活了。

以前你问 AI 一个问题,它给你一段文字,然后就没有然后了——执行还是你自己的事。Agent 打破了这个边界。你给它一个目标,它自己去找路、找工具、一路干到出结果。从"嘴"到"手",这是一个质的变化。
OpenClaw 和 Claude Code 到底什么关系?
用三根支柱来看就很清楚:大脑、手脚、记忆,两者基本一样——都能接 Claude 模型当大脑,都通过 MCP / API 调工具,都受上下文窗口限制。区别在外面那层壳……
Computer Use — 看起来很美,为什么现在不行
Computer Use = Agent 像人一样操作电脑:看屏幕、移鼠标、点按钮、打字。不需要 API 接口,直接"看屏幕操作"。先澄清一个常见误解:Computer Use 是一种能力,不是 OpenClaw 的专属功能……
📖

继续阅读完整内容

以上是第一章第一节的试读内容。
完整版包含 4 章 9 节 + 3 篇附录,涵盖 Agent、模型本质、工具选择、终端实操。

AI 101 完整版 · PDF + EPUB 双格式
零基础友好
迭代 20+ 版
贴合国内环境
即买即下载