Learning with AI | Daniel X

从线性的阅读，到结构化的知识 🧠

我是 MarginNote 的忠实粉丝。我一直觉得，它有一个非常厉害、但很多人没有意识到的设计：它让我可以在阅读的过程中，就顺便把知识整理了，而不是读完之后，再回头重新整理一遍。

这个差异其实非常大。因为大部分笔记软件，本质上还是把“阅读”和“整理”拆成了两个动作。你先读，读完之后再摘录；先理解，再总结；先高亮，再组织。但 MarginNote 不一样，它真正核心的设计，其实是在解决这样一个问题：

| 如何去 Bridge 阅读（线性）和知识整理（网状） |

阅读的过程是线性的

人类阅读，本质上永远是线性的。

你不管是看书、看论文、看 PDF、听课程，还是现在刷 AI 的回答，最终其实都是一句一句看、一段一段理解、一个信息接一个信息地消费。比如你在学习 NLP 的时候，教材可能会先讲词向量，再讲 RNN，再讲 LSTM，然后开始讲 Attention，最后才进入 Transformer。

但真实世界里的知识关系，其实根本不是这样的。

Attention 会影响 Transformer 的理解，Transformer 又和上下文长度有关，上下文长度会影响 RAG 的效果，RAG 又会影响 Agent 的长期记忆，而长期记忆最后又会回到 embedding 的表达能力上。甚至你研究 Agent 的时候，又会重新回到 Prompt Engineering、Reasoning、Tool Use、Memory Architecture 这些东西。

也就是说，书本的结构是线性的，但知识本身其实是网状的。人类只是被迫沿着一条路径阅读，而最后真正留在脑子里的东西，从来不是“第几页第几段写了什么”，而是概念之间的连接关系。

所以我一直觉得，知识管理真正困难的地方，从来不是“记录”，而是：

如何把线性的阅读过程，慢慢转化成结构化的知识网络。

而 MarginNote 是少数真正意识到这一点的产品。

AI 学习与传统阅读的差异 🤖

AI 出现之后，学习这件事情其实发生了很大的变化。

以前学习更像是在“爬楼梯”。你必须按顺序往前。不会词向量，就很难理解 embedding；不会 embedding，就很难理解 Attention；不会 Attention，又很难真正理解 Transformer。整个学习过程是高度路径依赖的。

但 AI 出现之后，学习开始变成一种“跳跃式探索”。

比如你正在学 Transformer，突然问 AI：

“为什么 Attention 能替代 RNN？”

于是 AI 开始给你解释：

长距离依赖
并行训练
信息衰减
上下文窗口
Token 关系建模

接着你又突然想到：

“那上下文窗口为什么会有限制？”

于是又跳去了：

KV Cache
推理成本
显存占用
Flash Attention
稀疏注意力

然后你又会开始联想到：

长文本 RAG
Agent Memory
Context Engineering
MCP
Tool Use

整个学习过程已经不再是：

Chapter 1 → Chapter 2 → Chapter 3

而更像是：

Transformer
 ├── Attention
 │     ├── 长距离依赖
 │     ├── Context Window
 │     │       ├── KV Cache
 │     │       ├── Flash Attention
 │     │       └── 推理成本
 │
 ├── RAG
 │     ├── Embedding
 │     ├── Retrieval
 │     └── Chunking
 │
 └── Agent
       ├── Memory
       ├── Tool Use
       └── Context Engineering

知识会不断分叉、连接、重新关联，最后形成一个动态扩展的知识网络。

这其实是 AI 学习和传统阅读最大的区别。传统阅读是作者决定路径，而 AI 学习变成了你的好奇心决定路径。知识不再是固定顺序展开的，而是随着问题不断发散、生长、连接。

但问题也恰恰出现在这里。

AI 知识整理的问题 💥

AI 非常会“讲”。

它会举例、会类比、会换说法、会补背景、会不断调整表达方式来让你听懂。所以很多时候你会有一种感觉：自己好像真的懂了。

但后来我慢慢发现，AI 最大的问题其实也恰恰在这里：

AI 太会改写了。

同一个概念，它每次都能换一种方式重新描述。第一次 AI 说：

“RAG 是通过外部检索增强模型知识。”

第二次 AI 说：

“RAG 本质上是在模型外部增加长期记忆。”

第三次又变成：

“RAG 是一种降低 hallucination 的方式。”

第四次又开始讲：

“RAG 是 Context Engineering 的组成部分。”

这些话都没错。

但问题在于，知识结构在变化，描述方式也在变化。这两件事情如果同时发生，人脑会非常痛苦。因为你需要不断重新建立映射关系，不断确认“这些东西是不是其实在讲同一个概念”。

于是最后会出现一个很经典的问题：你每次都看懂了，但知识就是留不下来。你需要反复重新阅读，认知负担越来越重。因为 AI 在帮助你理解，但没有帮助你建立稳定的知识锚点。

后来我越来越觉得，AI 知识整理真正核心的问题，其实不是“生成”，而是：

如何建立稳定的锚点。

AI 知识整理真正重要的是：锚点 ⚓

首先需要稳定的，其实是知识结构本身。

哪些节点属于哪个主题，哪些概念之间存在连接，哪些是主干，哪些是细节，这些东西应该尽可能稳定。因为人真正记住的，从来不是一段文字，而是结构。你记住的是“这个概念属于哪一类”“它和谁有关”“它解决什么问题”，而不是一句具体的话。

第二个非常重要的东西，是流程边界。

以前很多 AI 产品有一个问题：AI 会不断改写所有东西。最后你根本不知道哪些是原始输入，哪些是 AI 改写，哪些是总结，哪些是抽象，哪些又是结构变化。整个系统会越来越混乱。

所以后来我给 Criminals 定了一个很重要的原则：

每一步只允许变化一件事情。

整个流程会变成：

聊天对话
    ↓
生成节点（不改写内容）
    ↓
节点列表 → 树状结构（不改内容，只改连接方式）
    ↓
知识树 → 内容简化（不改结构，只揭示内容变化）

也就是说，先稳定内容，再稳定结构，最后才允许摘要和改写。这样认知负担会小很多，因为用户永远知道当前变化的到底是什么。

最后一个非常重要的锚点，是“原文”。

因为 AI 非常容易偷偷改写内容。所以后来我甚至用了类似 Git Diff 的方式。你永远可以看到哪一句被改了、哪个概念被合并了、哪些内容被简化了，而不是 AI 直接给你一个“新的版本”。

因为人类对“变化”其实是非常敏感的。如果变化不可追踪，认知成本会急剧上升。

你应该怎么用这个系统 🧩

后来我发现，这个系统其实特别适合一种场景：探索式学习。

比如你最近突然想学 AI Agent。传统方式可能是找教程、找课程、从头往后看。但现实情况往往是，你会不停跳问题。你可能先问 Multi-Agent 为什么容易收敛，然后跳去 Context Engineering，再跳去 Agent Memory，又跳去 Tool Use，最后开始研究 MCP 和 Function Calling 的区别。

于是整个学习过程，其实已经变成了不断和 AI 对话、不断发散、不断建立连接。

而 Criminals 做的事情，其实是：

在你聊天的时候，自动帮你长出知识结构。

比如你聊到 Multi-Agent、Planning、Tool Use、Reasoning、Memory，系统会自动形成知识节点。接着它会发现 Planning 和 Reasoning 有关联，Tool Use 和 Agent Memory 有关联，Multi-Agent 又和 Context Isolation 有关联。

于是一个知识树开始慢慢长出来。

而且最重要的是，这个过程并不是“聊天结束之后再总结”，而是：

你思考的过程本身，正在变成知识结构。✨