朔方札记 ✍️

You are what you write.

上下文工程

过去几年，人工智能领域最聪明的人都在专注于一件事：造一个更大的大脑。他们追逐更多的参数、更好的数据和更巧妙的架构。他们这么做是对的。没有强大的引擎，你什么有趣的东西都造不出来。但既然我们已经有了这些引擎，游戏规则正在改变。最有趣的工作，正在从“如何让引擎更强大”转向“如何用它来造出有用的东西”。这项新工作有个名字，尽管很多人还没这么叫它：上下文工程。它是一门围绕引擎来设计机器的手艺。如果你眯起眼睛看，这台新机器和一台旧机器非常像。 LLM 是 CPU。核心的“思考”单元。上下文 (Context) 是 RAM。CPU 的工作内存。工具 (Tools) 是外设 (Peripherals)。机器与世界对话的方式。 Agent 是操作系统和应用。使用硬件来完成工作的软件。一旦你这么看问题，你就会发现，所有应用的设计，都可以归结为四种主要的架构策略。四种架构 1. 手动内存管理 (HLC) 第一种架构是命令行模式。用户通过对话框，直接与一个裸的 LLM 交互。这本质上是 HLC（人类, LLM, 对话）的纯粹形式。此时，用户就像一个程序员，在手动管理机器的内存（上下文）。它强大而灵活，但也很费劲。 2. 引入操作系统 (HLCAT) 第二种架构是为机器安装一个操作系统。这就是 Agentic 模式，即 HLCAT，在 HLC 的基础上增加了 Agent (A) 和 Tools (T)。你给 Agent 一个高阶目标，它会自行判断何时需要调用外设（工具）来丰富自己的内存（上下文）。这是个巨大的飞跃。 3. 隐式工程 (AI-Enhanced) 第三种架构将复杂性完全隐藏起来，我们称之为 AI-Enhanced 应用。用户只看到一个他们熟悉的按钮。当他们点击时，应用本身扮演了一位聪明的工程师，在后台完美地装配出正确的上下文，然后把它交给 CPU。这感觉就像魔法。 4. 打开引擎盖 (Hybrid) 然而，最强大的架构，或许是第四种——一种Hybrid模式。它从一个优雅的 AI-Enhanced 应用开始，完成初步的上下文构建。然后，它提供一个“在聊天中优化”的链接，让你进入一个已经预加载了完美上下文的 HLCAT 命令行。这让你既享受到便利，又不失控制的深度，也是为现有应用赋予超能力的最佳路径。机器里的幽灵但这里有一个诡异之处。我们当下的所有工作，都像是在隔靴搔痒。因为我们始终是通过一台经典计算机的屏幕，去使用一台全新的计算机。我们的笔记本和手机，连同它们上面的 Windows 和 iOS，是我们通往这台“新计算机”的笨拙终端。我们用着旧机器的键盘和鼠标，去操作那个由 LLM、上下文和 Agent 构成的、看不见的“新机器”。 ...

管理产物，而非流程

Managing By Artifacts, Not Processes 大多数公司都坏掉了。它们通常以两种方式之一坏掉。一种是官僚主义的泥潭，在那里，才华被无尽的表格和审批流程所吞噬。另一种是混乱的火灾现场，在那里，每个人的注意力都被永不停止的即时消息和救火会议撕成碎片。你通常被告知，必须在这两种地狱之间选一个。这是一个陷阱。问题的根源，不在于你选择了哪种管理风格，而在于你用来构建组织的心智模型，从根本上就是错的。我们仍然在用一百年前的工厂思维，去管理一群靠思考为生的人。是时候把这个模型扔进垃圾堆了。存在着一个更好的模型。它就在我们眼前，是我们这个时代创造出最多价值的模型。那就是：我们应该像构建伟大的软件一样，来构建我们的组织。这不是一个比喻，这是一个可执行的蓝图。一个组织和一个大型软件项目，本质上是同一种东西：一个由许多独立部分组成的、需要不断演化的复杂系统。而过去几十年的软件开发，已经为我们提供了一套经过血与火考验的、管理这种复杂性的方法。这一切始于工程学最根本的动作：分解。你必须先将庞大、模糊的“工作”分解成一个个独立的、定义清晰的模块——也就是那些关键的中间产物。定义它们，是整个系统得以建立的基石。我们应该把每个产出物看成是一个自己署名的作品。然后，你才能应用这些原则：第一，伟大的软件建立在清晰的API之上。一个好的软件系统不是一团巨大的代码泥潭，而是由许多独立的模块，通过清晰、稳定、文档齐全的API（应用程序接口）连接而成。API就是模块之间的契约，它精确定义了输入和输出，屏蔽了内部的复杂实现。在组织中，团队之间的交付物就是组织的API。这就像一家顶级餐厅的厨房，切配厨师为灶台厨师准备好的、规格完全统一的配料，就是他们之间稳定可靠的API。一个清晰的API能消除绝大部分因猜测和误解而产生的、代价高昂的沟通。第二，伟大的软件由测试来驱动。最优秀的程序员践行“测试驱动开发”（TDD）——先写测试，再写代码。这是一种深刻的智力纪律。在动手之前，你被迫从外部视角，用最苛刻的标准来定义“成功”是什么样的。在组织中，这意味着在启动任何项目之前，先定义其可衡量的成功标准。这个“测试”本身，就成了最精确的需求文档。第三，伟大的软件依赖于自动化。每一次代码提交，都会自动触发一套完整的测试，即时反馈结果。这是一个客观、无情、不知疲倦的质量守门员。这套“持续集成”系统，用自动化的方式保证了整个系统的健康。在组织中，这意味着我们要用客观的检验系统，来取代充满偏见和疏漏的人工监督。第四，伟大的软件是不断重构的产物。代码会腐烂，系统会熵增。伟大的工程师总是在“重构”——持续地改进代码结构，删除无用代码，拆分臃肿的模块。在组织中，管理者必须成为“首席重构工程师”，定期审视并砍掉那些不再必要的流程、会议和报告。重构是组织对抗自身重量、保持敏捷的唯一武器。第五，伟大的软件痴迷于第一步的质量。他们深刻地理解“垃圾进，垃圾出”的原则。在一条长长的工作链中，后续所有的努力，都只是在最初那个产出物的基础上进行优化和放大。这意味着，最初那个产出物的质量，已经决定了最终成果所能达到的上限。但这里有一个关键的警告。这并非是想用机械性的规则来取代人类的判断力。恰恰相反，它使得领导者的品味（Taste）和标准变得比以往任何时候都更加重要。因为系统本身，就是领导者品味的体现。对于那些可以被量化的部分，领导者的品味决定了那个“正确”的公差。而对于更多无法量化的、主观的领域——比如设计的优美或战略的洞见——一个设计良好的系统，其核心任务是确保那些拥有最高标准的大师级人物，能够浮现出来，并被放在关键的“守门人”位置上。他们的判断，就是最终的测试。这就导向了一个简单、甚至有些残酷的结论。我们衡量一个领导者的标准，不应是他的魅力、头衔或管理经验。一个领导者的唯一资格，就是他能否精确地定义出那些关键的“产出物API”，并以卓越的品味为它们设定世界级的“测试标准”。如果他做不到这一点，他就不是一个领导者。他只是一个会议主持人。因此，管理者的角色必须被重新定义。他不再是监工，也不是沟通的枢纽。他应该是组织的总架构师。一个领导者真正的工作只有两件：第一，找到一群最棒的艺术家和工程师，然后给他们指出一个能改变世界的方向。第二，用最高的标准，去打磨通往这个方向的每一步、每一个“产品”。忘了流程，忘了官僚主义。专注于产品。让每一个细节都闪闪发光。把活儿递过去（由Gemini生成的陈丹青版本）我这些年，给请去看过不少公司，说是“顾问”，我懂个屁的顾问。我就进去坐着，抽烟，看。一看就觉得不对劲，气场不对，人不对。哪儿不对？你瞅他们那股忙乱劲儿。一帮顶聪明的小青年，一个个简历光鲜，可凑一块儿，就成了两种德行。一种呢，是“穿制服”的。干什么事都得填表，走流程，一层层报上去，再一层层批下来。人跟机器零件似的，动弹不得，脸上没表情。你问他为什么这么干，他说“规定”。狗屁规定，我看就是懒，懒得动脑子，用一本破规矩把所有人都捆死。这是拿人当傻子。另一种呢，是“菜市场”。几十号人在一个大群里嚷嚷，出了点事，所有人艾特一遍。看上去特有活力，跟打仗似的，可一天下来，屁事没干成。全是废话，全是表态，全是“收到”。这是拿聪明人当喇叭使。然后大老板跟你说，没办法，公司大了都这样，你得在“慢死”和“乱死”里头选一个。我一听这个就想骂人。这是什么混账逻辑？问题根本不在这儿。问题在于，我们现在都不讲究“手艺”了，不讲究活儿和活儿之间，那个“递过去”的瞬间。你到个好馆子的后厨看看。一个师傅把鱼杀好了，另一个师傅接过去片花刀；一个徒弟把葱姜蒜切成末，另一个徒弟接过去码好盘。这中间有那么多废话吗？没有。递过去的东西，本身就是话。那鱼，干不干净，那葱，匀不匀，搭眼一看，心里就有数了。这叫默契，也叫规矩。这规矩不是写在墙上的，是刻在手上的。现在呢？我做一个东西，稀里糊涂，缺东少西，直接扔给你，说“你接着弄”。你怎么弄？你得跑来问我十遍，我可能自己都忘了。这不就乱了吗？为了不乱，怎么办？好，我们写个“流程”，规定你问我的时候必须填什么表。这不就慢了吗？荒唐透顶。我们把力气全用在“怎么沟通”上，就没人去关心那个“递过去的活儿”本身，到底是个什么玩意儿。你这活儿要是干得地道，根本不需要那么多沟通。所以这事儿要弄好，就得回到手艺的本分上。你别管那些虚的，你就盯住一件事：从我手上，交到你手上那个东西，它地不地道？这一个“地道”，里头学问就大了。你得先想明白，什么叫“地道”。你做个设计图，什么叫地道的设计图？不是你觉得好看就行，是那个做产品的工程师拿到手，一句话都不用问，就能开干。你写个报告，什么叫地道的报告？不是长篇大论，是那个大老板能在马桶上看三分钟，就知道这事儿该不该干。把这个“地道”的标准弄清楚了，死磕它，比你开一百个会都有用。还有，你干活前，心里得有那张“成图”。一个好木匠，一斧子下去之前，那张椅子已经在他脑子里了。我们现在是倒过来，先干起来再说，做一步想一步，最后做出来个四不像。但光有这些还不够。我顶烦把什么东西都弄成死规矩。到最后，靠什么？靠人，靠那个“把关人”的眼力。很多东西，是没法写在纸上的。一幅画的气韵，一首曲子的味道，一个设计的巧思，你说，你怎么量化？你没法量化。那怎么办？就得靠“懂行”的人。一个好的场子，就得想方设法让这种“懂行”的人，浮到最关键的位置上，让他去“把关”。他说好，那就是好。他那双眼睛，就是所有流程、所有规矩的最后一道防线。他的品味（Taste），就是这个地方能做出的东西的上限。这么一来，什么叫“领导”，也就清楚了。不是他官儿大，不是他能说会道。这“领导”，就看他一件事：他懂不懂“好东西”？他能不能带着大家，把一件件“活儿”往“好”里弄？他要是自己就没见过好东西，眼力不行，他凭什么带一帮人？他就是个管考勤的。所以啊，这当头的，也别老想着怎么去“管”人。那是监工干的活儿。你真正的活儿就两样：第一，你得找到那些真正有手艺的人，然后指给他们看什么叫"好"。别跟我说什么"人才难找"。好手艺人到处都是，问题是你自己眼力不行，看不出来。一个真正的艺术家，一个真正的工程师，他们身上有股劲儿，那是装不出来的。你得把这些人找出来，聚到一块儿，然后告诉他们：咱们要干的这个活儿，得干到什么程度。不是给他们画大饼，是给他们看真货。你自己得先见过世面，知道什么叫顶级，什么叫一流。然后你把这标准摆在那儿，说：就照这个来。这叫指方向，不是瞎指挥。第二，你得把那些好东西，一件一件地琢磨透了。什么叫"好东西"？不是看起来光鲜的，是真正管用的、耐得住时间的、经得起推敲的。你得像个老古董商似的，拿着放大镜，一寸一寸地看，这个细节对不对，那个地方够不够劲儿。每一个"产品"，每一个从你这儿出去的活儿，都得是你签名的作品。别人一看，就知道这是从你这儿出去的，有你的标准，有你的品味。别的都是虚的。什么流程，什么制度，都是扯淡。 ...

藏宝图与指南针

很多人一听说要长期吃降压药，第一反应就是抗拒。他们觉得，一旦开始就无法摆脱，这背后是对"依赖"的恐惧，一种对非自然干预的本能抗拒。要改变这个想法，通常有两条路。第一条是权威之路。给你看一段官方风格的视频，或一篇来自顶尖机构的文章。如果你信任这个权威符号，你的信念系统会直接采纳这个新结论。这是藏宝图式思考。第二条是原理之路。你得坐下来，一起拆解这个问题。动用物理学，将血压类比为管道压强；动用生物化学，解释药物分子如何像钥匙一样精确作用于靶点；动用概率论，计算服药与不服药，灾难性事件的发生概率。这是指南针式思考。一个显而易见的问题是：既然指南针更根本，为什么藏宝图式思考却大行其道？因为打造和使用指南针的成本极其高昂。它需要大量的实战。你无法仅通过阅读海图就成为船长，你必须亲自出海，学会在风浪中结合地图与经验，规划出正确的航线。而获得这种实战的机会本身，就是一种奢侈。它通常只发生在那些你被抛入无图可循的荒野的时刻——比如创办一家公司，或攻克一个无人涉足的技术难题。相比之下，获取藏宝图的成本已趋近于零。社交媒体就是一个无限滚动的藏宝图册，上面画满了通往财富、健康和正确观点的捷径。大脑作为一台追求能耗最优的机器，本能地偏好低成本的藏宝图模式。这不是愚蠢，这是一种生物学上的理性。这两种模式的分野，重新定义了教育的真正使命。学习的浅层目的，是为大脑储备更多、更高精度的藏宝图。这是模仿，是生存的本能。但学习的根本目的，是赋予我们打造和使用指南针的能力。它旨在交付一套用第一性原理和逻辑去解构世界、生成决策的引擎。只依赖藏宝图，我们的大脑就变成了一个被动的接收器，一个装满了来路不明代码的操作系统。你运行着这些程序，却对它们的源代码一无所知。真正的教育，是教会我们自己编程，赋予我们审核和重写代码的能力。世界将源源不断地为你提供更精美、更具诱惑力的藏宝图，它们承诺安逸，免除你思考的辛劳。但你必须明白，大多数藏宝图的目的，只是为了卖图给你，图上的宝藏往往并不存在。正因如此，我们才更应拥抱并鼓励每一个人，去勇敢地承担建造指南针的高昂成本。这并非要求每个人都成为全知全能的专家，而是倡导一种智力上的诚实。它意味着在面对未知时，你能从内部生成一种笃定；在众说纷纭中，敢于相信自己推演出的结论。这种能力一旦内化，便成为一个人安身立命的底层框架。一个组织也是如此。如果它总是在追逐风口、复制打法、依赖咨询报告，那它就是在收集藏宝图。它或许能靠运气找到一两个宝藏，但永远学不会航海。而一个拥有指南针的组织，则是在所有核心问题上，都坚持打造自己解决问题的内生能力。这种能力，才是它真正的、不可被轻易复制的智力资产。所以，去建造你的指南针。这或许是在这个日益复杂的世界里，我们能为自己创造的、最坚实的智力资产。

成为原生创始人

Becoming a Native Founder 我可能明白了为什么雷总对《硅谷之火》如此着迷。这无关怀旧，甚至也不只是被某种气氛所感染。关键在于书里的那些人所处的一种状态。那种状态是，你充满好奇心，有强烈的构建欲，并认为未来是可以被塑造的。而进入这种状态的唯一途径，就是站到技术的最前沿。当你站在前沿时，你会得到一种无与伦比的激励。因为在这里，你用最小的努力就能产生最大的影响。你的一个想法，几行代码，就能创造出世界上前所未有的东西。这种直接的反馈是最高效的燃料。但这里有一个多数人会犯的错误。他们认为只要站在前沿就够了。他们成了前沿的游客。游客阅读新闻，使用别人打包好的工具，参加各种会议。他们看起来很忙，也了解最新的名词，但对脚下的土地一无所知。而真正的创造者是原生者。他们不满足于使用工具，他们要亲手去构建工具。他们不满足于看地图，他们要亲手制作地图。要做到这一点，你必须拥有"创始人精神"。这意味着你必须愿意支付一笔高昂的、几乎不合情理的入门费。我不同意那种"动手做点什么，无论多小"的建议。那种浅尝辄止的体验，最多只能让你觉得新奇。它无法让你进入那种深刻的、可持续的创造者状态。要进入那种状态，你必须愿意在黑暗中独自摸索很长一段时间。就像竹子在破土之前，要在地下悄悄扎根。这个过程是痛苦的，充满了与底层细节的搏斗。你在读那些枯燥的论文，在编译那些总也通不过的代码，在做那些最根本、最"脏"的活。世界会告诉你，这样做是低效的。它确实是。但这正是成为原生者的代价。只有在你支付了这个代价之后，真正的生长才会开始。你的认知会突然跃升，就像竹子开始"拔节"。你开始能看到游客们永远看不到的东西。创造对你来说，不再是碰运气，而是一种直觉。世界的默认设置是把你变成一个游客。它为你提供无穷无尽的、打包好的工具和信息摘要，让你觉得自己很高效。但实际上，你正在交出自己思考的能力。你必须对抗这种诱惑。那么，如何成为一个前沿的原生创始人？第一，选择你的战场，然后全身心投入。不要想着同时了解AI、Crypto和生物技术。选一个你认为最重要的前沿，然后立志成为这个领域里最懂的人之一。这不是一个业余爱好，这是一个职业承诺。第二，用手思考，直到你感到痛苦。不要只调用API，去读它的源代码。不要只用现成的模型，去尝试自己训练一个。这个过程会强迫你直面那些最棘手的问题，而真正的洞见就藏在里面。第三，只和"原生者"交谈。远离那些夸夸其谈的游客。找到那些和你一样，正在泥泞中挣扎的实干家。你们的讨论，会是关于如何解决一个具体的技术难题，而不是下一个风口在哪里。成为一个前沿领域的原生创始人，可能是你能做的最困难的事情之一。但它也是唯一能让你获得真正创造力的途径。而这，还不是故事的全部。这个过程的最终目的，不仅仅是为了你自己。它是为了能够领导他人。当你通过这种艰苦的方式进入了那种"原生"状态，你身上会散发出一种东西，那是游客们永远无法伪装的：笃定。你不再需要依赖外部的地图，因为你已经内化了制作地图的原理。正是这种笃定，让你拥有了激励一个庞大队伍前进的资格。人们不会追随一个拿着最新潮地图的向导，他们会追随那个知道如何观察星辰来确定方向的人。你的内在状态，会成为整个组织的引擎。你被技术前沿的可能性所激发，然后，你用这种被激发的、充满能量的状态，去点燃你身边成百上千的人。这才是从0到1、再从1到N的完整路径。所以，我们追求的，不仅仅是通过成为原生创始人，让自己保持在"拔节生长"的状态里。我们追求的，是先让自己进入这种状态，然后用这种状态去凝聚一支队伍，共同去塑造一个原本不可能的未来。

局部速度陷阱

如果你停下来想一想，知识工作到底是什么，你会得到三样东西：思考、沟通，然后做事。整个办公软件世界，不过是一系列为了让这些事发生得更快的工具。那么问题来了：既然我们的工具让每个步骤都快得吓人，为什么我们的组织速度却常常感觉如此之慢？我想，答案是，我们都掉进了"局部速度陷阱"。这是一种错误的信念，即如果你尽可能快地完成你自己的环节，你就是高效的。它是一种危险的幻觉，而那些本应帮助我们的工具，正在放大它。设想一个测试工程师发现了一个 Bug。局部速度最快的路径是：截一张图，跳进聊天软件，然后 @ 一群人并附上一句：“这个坏了。” 从这位工程师的角度看，任务在 30 秒内就从他的待办事项里清掉了。他感觉自己很高效。但他到底产出了什么？他产出的是"低分辨率的噪音"。在下游，这些噪音引发了一连串代价高昂的澄清工作。开发工程师不得不问，到底是什么坏了。产品经理不得不重申预期的行为是什么。最初那个 30 秒的"高效"动作，制造了 30 分钟的集体空转。现在，想象一下这位工程师花了 10 分钟，精心制作了一份合适的 Bug 报告。这份报告是一个"高分辨率的产物"。它是一份质量如此之高的中间工作成果，以至于几乎不需要任何澄清。收到它的开发工程师可以立刻开始工作。我们似乎忘了一件更根本的事：所有知识工作的本质，都是一场由高质量的中间成果串联起来的接力赛。一份出色的设计方案，才能导向一个出色的产品。一份出色的 Bug 报告，才能导向一次快速的修复。当我们为了初始动作的速度而优化时，我们正在主动地降低中间工作的质量。我们在向我们的组织注入"熵"。为什么这个陷阱如此有效？这是"藏宝图"的诱惑，与使用"六分仪"的艰辛之间的对决。藏宝图许诺了一条通往宝藏的捷径，直接而诱人；六分仪则要求你掌握技能，通过观测星辰来精确定位。你的大脑，天生为了保存能量，渴望得到那张藏宝图。而我们现在的工具，使得选择藏宝图变得简单到无法抗拒。 Agent：重塑工作的方式长久以来，解决这个问题的唯一答案是更多的流程，而那不过是"摩擦"的另一个名字。但现在，一个新的原生要素正在进入这个系统：AI。下一代软件将建立在两样东西的结合之上：你组织工作中浩瀚的、无处不在的上下文，以及大语言模型理解它的能力。当你把这两者结合起来，软件就不再是一个被动的工具，而变成了一个主动的Agent。这个Agent将从根本上重塑工作的三个环节：首先，它辅助思考。你可以把半生不熟的想法扔给它，像同一个高水平的同事对话一样。你可以让它扮演"恶魔的代言人"，寻找你逻辑中的漏洞。你还可以问它，“根据我们过去所有项目的复盘，这类项目最大的风险是什么？” 它会阅读一切，然后给你一个你凭记忆永远无法得到的答案。其次，它降低协作摩擦。这也是它最核心的作用。它扮演着"质量守门员"的角色，捍卫着中间工作成果的质量。当那个测试工程师发布了低分辨率的 Bug 报告时，Agent会看到它并介入：“看起来你发现了一个 Bug。我已经从这段对话中提取了上下文，需要我为你生成一份正式的报告吗？” 它自动地把粗糙的输入，打磨成了精良的输出。它让你使用藏宝图，却能得到六分仪的结果。最后，它能半自主地做事。这不是说它会包办一切，而是它能承担掉执行环节中最繁琐的部分。你可以用自然语言对它说：“为下个季度的产品发布制定一个项目计划，参考’天狼星’项目的模板，并把初始的设计任务分配给设计团队。” 它会为你铺好框架，创建好任务，让你从重复的体力劳动中解放出来，专注于真正需要创造力的部分。蓝图：下一代工具的核心目标那么，这下一代的工具会是什么样子？它不会是一系列应用的集合，而是一个单一的、流动的媒介，在这里，写作、交谈和管理之间的人为界限已经消融。它将由一种新的面料编织而成：一个理解你工作、并在不挡路的情况下保障其安全的智能Agent。最重要的是，这类新工具的打造，只有一个关键目标：持续地识别并提升工作的中间产物质量，并以此在全局范围内降低组织摩擦。这才是治本之道。它的成功衡量标准，将不再是你发出一条消息有多快，而是一份好点子和一个交付的产品之间，摩擦有多小。我们现有的工具帮助我们管理工作。我们即将创造的工具将帮助我们完成工作。它们终将不再碍事，而是让我们去创造。

Agent是一种设计模式

到底什么才是Agent？我认为，成为Agent只需符合一个条件：如果把大模型能力去掉，这个应用就不成立了，那它就是一种Agent。因此，Agent的本质是一种AI应用开发的模式。 Chatbot是最基本的通用Agent，如果把自然语言看做是人类大脑的汇编语言，Chatbot是使用人脑汇编语言操纵大模型的最底层。与CPU汇编语言最大的不同在于，任何人类（不识字亦可通过语音）都可以直接介入大模型操作，无需任何抽象中间层。但是，自然语言的表达能力有限，无法精确描述和执行任务，自然语言的上下文依赖性，导致无法在多轮对话中保持一致性，自然语言的模糊性，导致任务天然不精准。为了改善这些问题，我们需要引入计算机语言这种形式化语言来做增强。做这种增强过程中需要遵循的一些原则，我们称之为Agentic设计模式。通过大模型处理自然语言与通过CPU处理混合语言，综合运用这两种语言完成确定性的任务，我们可以称之为Agentic应用。自然语言能力提升了应用的能力上限，计算机语言保证了应用的能力下限。同时，这个原则也适用于超越自然语言的多模态语义型大模型。人类个体通过交互设备，参与到智能模型、计算机系统，以及其他人类个体，组合而成的完成特定任务的自适应智能体之中。而自然语言交互可能会作为主要交互接口之一暴露给人类个体。

关于顶级目标的设定

有时候我们会搞错"目标"的用法。当我们谈论目标时，脑海里浮现的通常是OKR或KPI表格里的那些数字：“本季度营收提升15%"、“日活用户达到50万”。管理者们迷恋这些东西，因为它们具体、可衡量，看起来很"科学”。但这种对目标的理解，恰恰是它最无趣，甚至最危险的一面。问题的根源是，我们为什么要为一群人设定目标？当你的团队只有三五个人时，你几乎不需要正式的目标。信息是即时同步的，方向的微调可能只是一次午餐闲聊。协同是一种本能。但当你试图突破"邓巴数字"——那个神奇的150人门槛时，事情就变得棘手了。正如我在《分布与集中以及邓巴数》中提到的，我们必须开始构建"150团队"的分布式单元。这时，一个高效的大规模人力资源运用模型，就成了决定性的因素。而这个模型的引擎，正是顶级目标。很多管理者试图用量化指标来驾驭这个复杂的有机体。但这就像一个医生只关心你的体检化验单。你的胆固醇、血糖、血压都在完美范围内。从数据上看，你非常"健康"。但医生从不问你是否幸福。医学无法告诉你该如何幸福地生活，它只能帮你避免一些已知的疾病。一个完全为了优化体检报告而活的人生，是何其乏味。一个只为KPI而存在的组织也是如此。当目标被简化为可衡量的数字，它就不再是罗盘，而变成了一张写满捷径却可能通往悬崖的地图。人们不再思考"我们做这件事的根本目的是什么"，而是"如何最快地让这个数字变好看"。这会催生短视的行为和无意义的内卷。这正如炒股人天天围绕K线图做出买卖决定，却对自己投资的公司究竟如何创造价值——它的商业模式、它的"上头成本"——一无所知。当市场的噪音盖过商业的本质时，犯下代价高昂的错误只是时间问题。那么，一个顶级目标（Top-level Goal）的真正作用应该是什么？它最重要的作用，是为整个复杂群体提供一个共享的视觉焦点（Shared Visual Focus）和反馈节拍（Feedback Rhythm）。视觉焦点，意味着无论你在公司的哪个角落，无论你是"150团队"的管理者，还是"15小组"的工程师，当你抬头仰望时，看到的是同一个远方的"山顶"。这个"山顶"不是一个精确的坐标，而是一个方向，一种愿景，一个"利润之上的追求"。比如，“加速世界向可持续能源的转变”。它足够宏大，无法被简单量化，但它足够清晰，能成为所有人决策的"罗盘"：“我正在做的这件事，是在让我们更接近那座山顶吗？” 这个共享的焦点，赋予了组织真正的自主权和弹性。你不需要事无巨-细地规划每个"150团队"的路径，他们会自己寻找通往山顶的最佳方法。反馈节拍，则是这个焦点带来的自然结果。当所有人都朝着同一个方向前进时，整个组织就拥有了一个统一的脉搏。我们不再仅仅在季度末通过冰冷的数字来判断成败。在日常工作中，每一次讨论、每一个产品发布、每一次用户反馈，都在回答同一个问题：“我们离山顶更近了吗？“这个节拍是持续的、有生命力的。它创造了一种集体心流，让整个组织像一个协调一致的鼓乐队，而不是一群各自为政的乐手在制造噪音。所以，建立高效的大规模协作模型，关键不在于KPI有多精确，而在于你为这群人选择了什么样的"山顶”。这个顶级目标，不是写在墙上的标语。它应该是组织内部所有重要争论的最终仲裁者。它是一种最根本的"上头成本”，一旦建立，就能持续产生巨大的"租值"——一种难以被模仿的组织向心力和创新氛围。这正如Apple Park的建筑精神，其巨大的圆环设计本身就是一种"上头成本"，但它所催生的"工程化偶遇"，才是它真正的、无法被量化的价值所在。别再让你的组织为了那张体检化验单而活了。找到那个能让所有人内心真正认同、并愿意为之攀登的"山顶"。平庸的公司痴迷于地图上的标记点，而伟大的公司，则致力于为每个人打造一副可以信赖的罗盘。

建筑的精神

软件就是数字世界的建筑。它们遵循着相同的规律。我们通常只看表面，就像看一张地图。这张地图告诉我们，一座教堂代表“敬畏”，一个简洁的App代表“高效”。这种看法很方便，但它把建筑或软件当成了一个静止的东西，一个我们只能被动观看的物品。但更深入的看法，是去理解它们如何运作。建筑和软件的真正精神，体现在我们与它们的互动中。建筑师和软件工程师设定了规则——空间的布局，软件的界面。但它的灵魂，是我们通过使用它才共同创造出来的。它不是一件作品，而是一种活动。这个互动过程，持续地影响着我们的行为和感受：它引导我们的行为。物理建筑的路线，软件的操作流程，都在不知不觉中引导我们的行为。你是走楼梯还是等电梯？你是用快捷键还是点菜单？空间和界面都在设计你的习惯。它决定我们的感受。我们的感受，比如开放、压抑或高效，不是设计师贴的标签，而是我们和环境互动后自然产生的结果。一个设计差的软件，就像一间不合理的办公室，让人用起来很烦。 Norman Foster 设计的 Apple Park 是一个绝佳的案例，因为它同时是物理和数字精神的结合体。如果只看照片，它是个巨大的圆环，一个科技符号。但它的核心设计理念，是创造一台用于**“工程化偶遇”（Engineered Serendipity）**的机器，也就是有计划地创造偶遇。圆环路线：它的设计没有捷径。从一个部门到另一个部门，你必须沿着圆环走一段路。这迫使不同团队的人在走路时相遇、交谈，催生那些在会议室里想不出的想法。这和组织设计里，为了打破“150人团队”的壁垒所做的事情，道理是一样的。玻璃幕墙：巨大的玻璃墙让人们能互相看见，感觉自己是一个大集体的一部分，而不是被关在小隔间里，这建立了一种视觉上的连接。中央庭院：建筑的中心不是一座大楼，而是一个巨大的庭院公园。它把人从室内拉到室外，鼓励大家进行非正式的交流。所以，Apple Park 的精神，不在于它的圆环形状，而在于这个形状所创造出的无数次行走、相遇和交谈。这种难以复制的创新氛围和组织文化，正是它高昂**“上头成本”所换来的巨大“租值”**。因此，当我们评价一个建筑或一个软件时，不应该只问它“看起来怎样”，而应该问它“让我们做了什么”。它鼓励了什么样的行为？它带来了什么样的体验？它帮助我们成为了一个什么样的群体？建筑的精神，无论是物理的还是数字的，都不是一个静态的东西，而是所有这些互动加在一起的总和。我们既是体验者，也是创造者。

上头成本

上头成本（Overhead Costs），通常的翻译是间接成本，广义来说，一切不能具体归属于每日生产的，但又迫切需要的成本，都可算做上头成本。非常形象地来讲，这个成本，在每天开工前，就已经悬在所有人头上了。但是上头成本作为一种投入，其结果是有机会产生租值的。例如一个铺面在90年代买下，虽然依然要每年付物业费并不断维修翻新，但是这个店铺的位置，可能是小店实现超低获客成本的不可取代因素。麦当劳有著名的买店策略，体现的就是这个原理。我们可以进一步抽象：上头成本的租值 = f(需求x排他) 大体上来讲，当自变量趋于0的时候，租值也趋于0，市场将会进入完全的直接成本竞争，典型的例子就是巴菲特屡屡提及的航空公司以及作为正面案例的糖果与汽水公司。虽然我不拥有口香糖的公司，但是我知道10年后他们的发展会怎样。互联网是不会改变我们嚼口香糖的方式的，事实上，没什么能改变我们嚼口香糖的方式。会有很多的(口香糖)新产品不断进入试验期，一些以失败告终。这是事物发展的规律。如果你给我10个亿，让我进入口香糖的生意，打开一个缺口，我无法做到。这就是我考量一个生意的基本原则。给我10个亿，我能对竞争对手有多少打击？给我100个亿，我对全世界的可口可乐的损失会有多大？我做不到，因为，他们的生意稳如磐石。给我些钱，让我去占领其他领域，我却总能找出办法把事情做到。——《巴菲特自述:我的城堡和我投资的5+12+8+2法则》按照这个思路，我们可以把一切直接成本之外的因素，都考虑为上头成本，并从中分析出一个企业的全面价值，并为企业未来发展提供方向指引。微软是典型例子，其最大的上头成本是Windows与Office构建的生态，微软早年的这份努力，可以无限发挥其租值，直到整个行业都消亡。GE的航空发动机，其上头成本是技术与生态的组合，这个组合可以在一个发动机族群漫长的生命周期中，产生稳定的租值。可以断言，一台CFM56的实际价格，肯定是远高于其直接生产成本的，一套Office更是如此。拆解一款手机来分析其BOM价格的做法，非常好地体现了这个观点。在主流认知中，常常会把BOM价格与手机售价的差，模糊定义为是知识产权的价格，但是上头成本绝不只包含这一个因素。知识产权一般只是技术类上头成本实体模模糊糊的一个投影。例如还有一类上头成本，我们可以称之为时机、或者趋势，毫无疑问，每一个企业都是多段历史的组合。其它诸如土地、劳动力价格优势、品牌、社交效应，都可以认为是上头成本。北京国贸商城即是绝佳案例。从这个角度讲，企业其实只有一个使命，就是创造出更多的上头成本，甚至找到正反馈模式。除此之外的一些战术动作，应当全面服从这个使命，并显得相对次要。在70年代，TPS带来的组织整体能力，是丰田的上头成本，今天它的租值持续走低，其可能的原因就在于，丰田还没有敢于把战术动作放到一边去。多数地产公司只是机械地堆积很多房子，赚一点微小的利差，随着趋势的迅速结束，租值将立刻转负，并在一瞬间击垮巨人。“利润之上的追求”才是伟大企业的一个特质，才会告诉企业哪里有常青的绿洲。

分布与集中以及邓巴数

根据我的工作经验，对于软件开发这种知识密集型工作而言，集中式管理的最大团队规模是150人左右。在这个范围内，管理者尚可实现相互的熟络，并对各类任务的背景有比较全面的认知。借助各类工具与平台，150人的创造力上限，决定了企业的价值生产高度上限（而非规模）。这也许是一个原始部落或大家族的尺寸，这恰好也是军事上一个陆军连队的规模。后续我将称之为“150团队”。当组织需要更大的规模时，应以“150团队”为基础单元，在基础单元之间实现分布式管理。但同时必须注意到，组织真正的最小单元是3-15人左右，其较为理想的上限是7-12人。在这个“15小组”内，可以实现最高效的团队能力成长，并实现成员之间的取长补短。当我们结合150与15时，就可以连续伸缩团队。最简单的办法是用150×15，于是可以得到一个2250人数的二级组织，这大体上也是一个团级单位的规模。在2250这个数字之上，再次叠加一层15，则可以得到一个师级规模的团队。这大体上是多数企业的业务单元上限。在“150团队”之间，因为人类社交能力的限制，则必须尽量实现简单的协同规则，同时将复杂信息尽量隐藏在“150团队”内。这是实现高效组织的最关键原则，我将其称之为组织结构的“开闭原则”。再结合“15小组”的情况，我们可以把这个规模的高度成长性命名为“细胞原则”。以上两个原则，能够增加对组织结构评估与优化有效维度。同属一个组织的所有“150团队”，应有共同的单一目标，并各自以MECE的方式协同。在他们之间，会有两类关系：平行、上下游。这其中，上下游关系在组间交付物质量收敛的前提下，能够实现比较好的配合，但是平行组一旦需要某种配合，则是非常难收敛效率的。一般而言，最基本的放法是建立统一的规划节拍，这个节拍要有一定的可预见性：其内容应该有提前量，是一个总体模糊到局部清晰的过程；其时长应当是固定且重复的。总体目标本身，应当解决组织内外能量交换的问题，并且是长期自收敛的。