上下文工程

过去几年，人工智能领域最聪明的人都在专注于一件事：造一个更大的大脑。他们追逐更多的参数、更好的数据和更巧妙的架构。他们这么做是对的。没有强大的引擎，你什么有趣的东西都造不出来。

但既然我们已经有了这些引擎，游戏规则正在改变。最有趣的工作，正在从“如何让引擎更强大”转向“如何用它来造出有用的东西”。这项新工作有个名字，尽管很多人还没这么叫它：上下文工程。它是一门围绕引擎来设计机器的手艺。

如果你眯起眼睛看，这台新机器和一台旧机器非常像。

LLM 是 CPU。核心的“思考”单元。
上下文 (Context) 是 RAM。CPU 的工作内存。
工具 (Tools) 是 外设 (Peripherals)。机器与世界对话的方式。
Agent 是 操作系统和应用。使用硬件来完成工作的软件。

一旦你这么看问题，你就会发现，所有应用的设计，都可以归结为四种主要的架构策略。

四种架构

1. 手动内存管理 (HLC) 第一种架构是命令行模式。用户通过对话框，直接与一个裸的 LLM 交互。这本质上是 HLC（人类, LLM, 对话）的纯粹形式。此时，用户就像一个程序员，在手动管理机器的内存（上下文）。它强大而灵活，但也很费劲。

2. 引入操作系统 (HLCAT) 第二种架构是为机器安装一个操作系统。这就是 Agentic 模式，即 HLCAT，在 HLC 的基础上增加了 Agent (A) 和 Tools (T)。你给 Agent 一个高阶目标，它会自行判断何时需要调用外设（工具）来丰富自己的内存（上下文）。这是个巨大的飞跃。

3. 隐式工程 (AI-Enhanced) 第三种架构将复杂性完全隐藏起来，我们称之为 AI-Enhanced 应用。用户只看到一个他们熟悉的按钮。当他们点击时，应用本身扮演了一位聪明的工程师，在后台完美地装配出正确的上下文，然后把它交给 CPU。这感觉就像魔法。

4. 打开引擎盖 (Hybrid) 然而，最强大的架构，或许是第四种——一种Hybrid模式。它从一个优雅的 AI-Enhanced 应用开始，完成初步的上下文构建。然后，它提供一个“在聊天中优化”的链接，让你进入一个已经预加载了完美上下文的 HLCAT 命令行。这让你既享受到便利，又不失控制的深度，也是为现有应用赋予超能力的最佳路径。

机器里的幽灵

但这里有一个诡异之处。我们当下的所有工作，都像是在隔靴搔痒。因为我们始终是通过一台经典计算机的屏幕，去使用一台全新的计算机。

我们的笔记本和手机，连同它们上面的 Windows 和 iOS，是我们通往这台“新计算机”的笨拙终端。我们用着旧机器的键盘和鼠标，去操作那个由 LLM、上下文和 Agent 构成的、看不见的“新机器”。

这种分离不会永远持续下去。二者终将融合。未来的操作系统本身，就是一个核心的 Agent。未来的硬件会为上下文而设计。那时，你不会去‘运行’一个 AI，你只会与你的电脑交谈，而电脑会理解。到那一天，新旧两台计算机将合二为一。

新物理学

即便在那样的未来，这台新计算机依然要遵循它自己的物理法则。

第一是内存墙。RAM 不是无限的。你往上下文里塞的东西越多，CPU 就越难找到正确的信息。上下文工程的手艺，在很大程度上就是内存管理的手艺。

第二是驱动地狱。给操作系统装上太多驱动程序混乱的外设，就会导致灾难。一个好的操作系统需要一小套可靠的驱动程序。

那么，你应该做什么？

工作不再是构建 CPU 本身，而是成为使用它的那台机器的架构师。

你可以为专家构建更好的 HLC 工具；你可以构建一个更鲁棒的 HLCAT 操作系统；或者，在那些可能蕴藏着最大机遇的地方，你可以去构建优雅的 AI-Enhanced 应用，然后，作为神来之笔，加上那个“打开引擎盖”的Hybrid入口。

最持久的优势，将来自对这门新手艺的精通。你不仅是在设计软件，你也在为那台终将到来的、真正融合的计算机，铺设道路。

前沿阵地已经不再是更大的模型，而是更好的架构。CPU 设计的黄金时代或许正在成熟，但系统架构师的时代才刚刚开始。

四种架构#

机器里的幽灵#

新物理学#

那么，你应该做什么？#

四种架构

机器里的幽灵

新物理学

那么，你应该做什么？