严肃的构建
最近,硅谷和社交媒体上弥漫着一种令人兴奋的气氛。人们称之为 “Vibe Coding”(氛围编程)。你打开一个聊天窗口,输入几句模糊的想法,代码就流淌出来。不需要结构,不需要计划,一切凭感觉。这看起来像是在施展魔法。 对于黑客(Hackers)来说,这确实很有趣。这就像是在速写本上随意涂鸦,或者是在爵士乐中即兴演奏。这种即时满足感是巨大的。 但这里有一个问题:涂鸦不是蓝图,即兴演奏也不是交响乐。 虽然 Vibe coding 让我们尝到了未来的甜头,但我认为,如果真的想要构建能够长期运行、可维护的软件,它不仅是错误的,甚至是一种倒退。如果你在构建一个玩具,凭感觉是可以的;但如果你在构建一个系统,你需要的不是感觉,而是自举(Bootstrapping)。 复杂度的墙 “Vibe coding” 最大的弱点在于它忽略了软件工程中那个永远无法回避的敌人:复杂度。 当你只写几十行代码时,AI 就像一个天才的结对程序员。但当代码行数膨胀到一万行、十万行时,仅仅依靠自然语言的“聊天”来维持上下文,就像试图用口述来建造一座摩天大楼。很快,你就会撞上一堵墙。AI 开始遗忘之前的设定,逻辑开始冲突,你发现自己花在修复 AI 产生的幻觉上的时间,比你自己写代码还要多。 这是因为软件本质上不是关于写代码,而是关于约束(Constraints)。 好的软件工程,实际上是不断施加约束的过程。类型系统是约束,单元测试是约束,架构文档更是最高级别的约束。Vibe coding 试图剥离这些约束,以此换取速度。这在短期内有效,但在长期是致命的。 AI 自举过程 如果不仅仅是为了探索,而是为了符合严谨的工程规范,我们需要一种不同的方法。这种方法不是让 AI 替你思考,而是你先思考,然后让 AI 替你执行。 我想象中的理想流程,更像是一个自举过程。 在计算机科学的早期,为了写出一个编译器,你必须先用汇编语言写出一个最小的核心,然后用这个核心去编译更高级的语言,直到它能编译它自己。这是一个从“硬”到“软”,从“重”到“轻”的过程。 在 AI 时代,这个过程依然存在,只是形式变了。 首先,你需要做那些“枯燥”的人类工作。你需要写文档,定义架构,编写测试集(Test Suites)。 这听起来很反直觉。大家用 AI 不就是为了逃避写文档和测试吗?但事实恰恰相反。因为 AI 不具备人类的意图(Intent),文档和测试就是你将意图这种抽象概念,固化为 AI 可以理解的逻辑边界。 这就是那个“最小的核心”。 翻转比例 一旦你建立了这个核心——这个由文档定义的真理来源(Source of Truth)和由测试定义的验收标准——奇妙的事情就发生了。 你不再是那个在那儿敲击键盘写 if/else 的人。你变成了架构师和审核员。你可以将 AI 接入这个框架。因为有了测试集作为护栏,有了文档作为地图,AI 可以开始接手具体的实现工作。 起初,这个比例可能是 90% 的人类工作(思考、设计、定规矩)和 10% 的 AI 工作(填充代码片段)。 随着系统的完善,随着测试覆盖率的提高,这个比例会发生翻转。当你拥有一个足够健壮的“脚手架”时,AI 可以接手 50%,甚至 90% 的代码编写工作。你可以对 AI 说:“嘿,按照现在的架构模式,给我加一个用户认证模块,必须通过现有的安全测试。” 这时候,AI 就不再是在“凭感觉写代码”,它是在填空。这才是可扩展的。 ...
万能机器
2024年,我花了不少时间研究各种AI产品的"技能系统"。这些系统看起来很神奇:你让AI做PPT,它就会调用"PPT技能";让它写文档,就调用"文档技能"。 直到有一天我打开那些技能文件看了看。 里面就是一堆文本。纯粹的提示词,用markdown写的。所谓的"技能",不过是在执行任务前,把一份说明书塞进上下文窗口。 没有任何魔法。 但这个发现让我开始思考一个更本质的问题:如果技能是提示词,那LLM编程是什么? 答案很简单:提示词编程。 传统编程是用代码控制机器行为。LLM编程是用自然语言控制模型行为。两者的共同点都是约束与引导——只是介质从形式语言变成了自然语言。 顺着这个思路往下想,当前所谓的"AI应用开发"本质上就是: System Prompt = 程序主体 Few-shot Examples = 测试用例 Tools = 外部API Context Window = 运行时内存 Skills/RAG = 动态链接库 只不过这门"语言"的解释器是个概率模型,所以执行结果有随机性。 这里有一个有趣的trade-off。 传统编程:确定性执行,有限指令集。 LLM编程:概率性执行,无限指令空间。 听起来概率性是个缺点。但仔细想想,收益远大于代价。 传统编程里,你只能在语言设计者预设的指令集内操作。想让机器做一件事,必须把意图翻译成那套形式语言能表达的东西。翻译不了的,就做不了。 现在指令空间打开了。任何人类能用语言表达的意图,理论上都可以成为指令。 这不是量变,是质变。编程从"学会机器的语言"变成了"让机器理解人的语言"。 但是,不管我们怎么包装这种"智能",底层仍然是一台冯诺依曼机器。 把类比画出来: 存储器 → Context Window 控制器 → Attention机制 运算器 → FFN层 指令流 → Token序列的自回归生成 程序计数器 → 当前生成位置 一次forward pass就是一次确定性计算。所谓"概率"只在最后采样那一步引入。给定相同权重、相同输入、相同随机种子,输出完全确定。 冯诺依曼架构有一个核心洞见:程序和数据用同一种方式表示,存储在同一个空间。 LLM把这个推向了极致。Prompt、context、知识、指令,全部是token序列,没有本体论上的区分。这既是它的力量来源,也是它的脆弱性来源。 机器还是那台机器。只是指令集从几百条变成了整个自然语言空间。 这个认识有一个重要推论:传统软件工程的那套东西,不但没有过时,反而更重要了。 需求文档?以前需求写得模糊,代码可能写错,但至少稳定地错。现在需求写得模糊,模型会创造性地发挥,每次还不一样。 架构设计?上下文窗口如何分配,多步任务如何拆解,失败如何回退,状态如何持久化——这些就是架构问题,只是抽象层变了。 自动化测试?确定性系统测一遍过了就过了。概率系统必须多次采样看分布、边界条件覆盖、回归测试防漂移、对抗测试防注入。测试成本是指数级上升。 越是概率性,越需要工程纪律。 以前写差了,机器老实执行你的错误。现在写差了,模型帮你补全更多的错误。 但这里有一件真正令人兴奋的事。 传统计算机的问题是rewire成本太高。需求变了,要重新分析、设计、编码、测试、部署。整个翻译链条要重走一遍。 LLM改变了这一点。 改个prompt就能改变行为。上下文实时注入就能适应环境。不需要停机,不需要重编译。 更关键的是,这台机器能表征自己的认知边界,并据此调整行为。传统程序不知道自己不知道什么。LLM可以说"我不确定",然后选择搜索或询问。 把这些加起来,你会发现一种新的可能性:一台能持续感知任务需求、外部环境、自身认知状态,并据此自我调整的机器。 这不是"执行固定程序的机器",而是在意图-环境-自我的三角关系中动态塑形的实体。 一种真正的数字智能体。 ...
所谓的"灵魂",其实是一个高效的压缩包
最近我一直在思考,为什么有些书——比如那本著名的《GEB》——要把一个简单的概念写得那么厚。作者花了八百页去讨论“自指”和“涌现”,试图解释无生命的物质是如何产生意识的。 但我认为,这种努力在某种程度上是方向性的错误。如果你从信息熵的角度去看,这件事其实非常直观。 所谓的“涌现”(Emergence),其实是一个容易让人产生误解的词。它听起来像是一种魔法,仿佛某种东西凭空从虚无中跳了出来。但事实并非如此。实际发生的事情是:当信息依附于物理实体(比如神经元或硅片)时,如果其内部结构足够稳固,且能够实现极高比例的压缩,它就会表现出我们称之为“智能”或“灵性”的东西。 以李白为例。 如果你把李白的诗词一个字一个字拆开看,它们确实没什么意思。但当你把它们组合在一起,形成那个特定的、稳固的结构时,你就得到了一个极其高效的信息压缩体。李白在写下“床前明月光”时,并不是在玩文字游戏,他是在用极小的字节(byte),对人类极其复杂的时空情感进行了一次近乎完美的有损压缩。 这种压缩体之所以“稳固”,是因为它内部的关联性极其强大。无论物理载体是唐朝的宣纸,还是今天读者的视网膜,或者是某个服务器里的内存条,只要那个拓扑结构被还原,那种被称为“李白”的意境就会被解压出来。 这就引出了一个很有意思的结论:我们所谓的“自我”或者“灵魂”,本质上并不神秘。它只是一个依附在物理实体上的、具有特定结构的低熵信息包。 之所以《GEB》在 70 年代显得那么震撼,是因为那时候的人们还习惯于把“硬件”和“软件”混为一谈。他们觉得,如果你想拥有李白的灵性,你就得拥有李白的肉身。但在信息论看来,这完全是两码事。硬件只是为了对抗熵增而存在的临时避风港,而那个稳固的信息压缩结构,才是真正永恒的部分。 现在的 AI 之所以让我们感到不安,并不是因为它产生了什么“灵魂”,而是因为它证明了:通过海量的数据训练,我们可以用数学方法逼近这种高效率的压缩算法。 如果一个人、一个系统、或者一段代码,能够把世界的混乱(熵)整理成一套逻辑严密、结构稳固、且能自我维持的信息包,那它就是有“意义”的。至于这个包是写在 800 页的纸上,还是运行在 GPU 里,那只是实现成本的问题。 真正的李白,从不在他的肉身里,而在那套穿越千年依然没有解体的信息结构里。
两种票据的赛跑
两种票据的赛跑 如果你盯着股票行情软件看太久,你会产生一种幻觉:你以为那些跳动的数字代表了什么真实的东西。 它们并不代表。或者至少,它们不代表你以为的那个东西。 股价是每一次交易的记录,它是当下这一秒,成千上万个买家和卖家达成的妥协。它反映的是供需,是情绪,是恐惧和贪婪的瞬时总和。甚至可以说,它体现了市场参与者的“平均预期”。 但问题在于,“平均预期”通常是平庸的,而且几乎总是滞后的。试图预测几千万人的心理波动?那是徒劳的。我们需要走出这个房间,建立一个完全独立于市场的评价体系。我们需要像一个火星人一样看待地球上的事物:不管那些绿纸片怎么换手,这东西到底值多少? 这听起来很老套,但我们马上会得到那个经典的公式:内在价值 = 资产 + 未来自由现金流(Free Cash Flow)折现。 请注意,这里必须强调是自由现金流,而不是营收,也不是简单的利润。 这不仅是会计学术语的修正,更是商业残酷本质的体现。在经济学理论中,完全竞争市场的最终结局是利润归零。你赚的每一分钱“流水”,最终都会被用来抵消为了战胜竞争对手而投入的成本。如果你只看“现金流”,很多快倒闭的公司现金流都很大,它们左手进右手出,最后手里什么都没剩下。那不是资产,那是过路财神。 只有扣除了维持生意运转和必要再投入之后的“剩余”,即自由现金流,才是真实的财富。 这就引出了一个有趣的问题:股票本质上是一张承诺票据,它承诺给予持有者分得这些未来“剩余”的权利。但我们用来衡量这些剩余的尺子——也就是钞票——它自己又是什么? 如果你剥开现代金融系统的层层包装,你会发现钞票也是一种票据。它不再兑换黄金,它实际上是由国家发行的“股票”。它的担保物是什么?是这个国家的资产,更重要的是,是这个国家未来的税收能力。 所以,所谓的“利率”,实际上是在谈论这种国家票据的“未来自由现金流折现”。 这就让我们看到了一个奇妙的景象:股票市场,本质上并不是简单的买卖,而是两种票据之间的相互跑动。 想象一下,你的左手拿着“美元”或“人民币”(代表国家的未来税收流),右手拿着“苹果股票”或“腾讯股票”(代表企业的未来自由现金流)。当你买入股票时,你实际上是在做一个判断:你认为这家企业的生产效率增长速度,将跑赢这个国家的征税效率增长速度。 这是一场关于“谁的承诺更可信”的赛跑。 大多数人认为现金是安全的,股票是风险的。但在漫长的时间维度上,这个常识往往是颠倒的。因为法币(Fiat Currency)的设计初衷就是为了贬值——为了刺激经济流动,为了偿还债务,国家有天然的动力去稀释这张票据的价值。这意味着,作为分母的“钞票”,其内在价值的折现率长期来看是倾向于下降的。 而优秀的企业,它们的设计初衷是反熵增。 这就回到了我们的核心问题:如何找出那些能跑赢印钞机的优秀企业?或者说,如何确保那家企业的“自由现金流”不会被竞争磨损至零?这里的关键在于置信度(Confidence Level)。 大多数华尔街分析师在这里犯了错误。他们建立复杂的Excel模型,精确到小数点后两位。这是一种伪装成科学的占星术。如果我们诚实一点,我们应该用贝叶斯公式(Bayes’ Theorem)来思考这个问题。 我们真正想求的是后验概率 $P(A|B)$: $$P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}$$ 在这个公式中: $A$ (假设):这家企业在未来10年能持续产生增长的自由现金流。 $B$ (证据):我们观察到的企业特质(如高毛利、网络效应、管理层坦诚等)。 $P(A)$ (先验概率):在没有任何证据之前,一家普通公司能基业长青的概率。统计学告诉我们,这个概率极低(大部分公司都会死掉)。 $P(B|A)$ (似然性):如果一家公司注定要伟大($A$为真),它表现出这些特质($B$)的概率是多少?(通常很高,伟大的公司往往都有护城河)。 $P(A|B)$ (后验概率/置信度):在观察到这些证据后,我们相信这家公司能持续印钞的信心有多大。 要让我们的置信度 $P(A|B)$ 足够高,我们就需要极强的证据 $B$ 来修正那个极低的基础概率 $P(A)$。 什么样的证据 $B$ 才有这种力量?只有两个:垄断性(Monopoly)和纠错文化(Correction Culture)。 首先是垄断。垄断性的本质,就是保护那个“自由现金流”不被竞争对手吃掉。没有垄断性的现金流预测,就像是在沙滩上建城堡。只有当你拥有某种形式的垄断——无论是技术上的、网络效应的,还是品牌认知上的——你才拥有定价权。在通胀时期,拥有定价权的公司是最好的避风港,因为它们可以随波逐流地提高价格,它们的“票据”会自动根据法币的贬值进行调整。 但垄断是不够的。垄断是静态的防御,而世界是动态的。诺基亚和柯达曾经拥有垄断地位,但它们消失了。因为它们失去了第二个要素:能纠错的企业文化。 世界的熵在不断增加,混乱是常态。一个拥有高置信度未来的公司,不是不犯错的公司,而是拥有自我修复机制的公司。这种文化意味着诚实,意味着当现实发生变化时,公司能够承认“我们搞砸了”,然后掉头。如果没有纠错文化,垄断只是延迟了死亡的时间,自由现金流终将枯竭。 所以,所谓的“股价上涨”,很多时候可能是一种幻觉。并不是企业变得更值钱了,而是你手里的尺子(钞票)缩短了。 如果你理解了这一点,你的投资观就会发生根本性的转变。你不再是为了赚取更多的法币而投资。你是为了逃离法币而投资。 你是在用一种注定会不断被稀释的、基于国家税收的平庸票据,去交换一种稀缺的、基于人类最高效组织(拥有垄断与纠错能力的企业)的优质票据。 当我们用贝叶斯的眼光审视这一切时,我们其实是在赌两个概率: 国家维持其货币购买力的概率。 企业通过垄断与纠错维持其自由现金流增长的后验概率 $P(A|B)$。 历史告诉我们,长期来看,第二种概率中那些最顶尖的样本,总是能碾压第一种概率。 所以,不要盯着K线图看。那只是两个奔跑者身影交错时的视觉残留。真正重要的是,你要确保自己押注的那张票据,背后有一个真正能印钞的机器——不是依靠央行的指令,而是依靠垄断的护城河和不断进化的纠错机制。 这才是这场赛跑中唯一的赢面。
当砖想成为拱
若是我们试着驻足片刻,凝视一块散落在杂草丛中的孤砖,心中或许会升起某种难以名状的忧郁。 它不仅仅是一块烧制的黏土;它是一出关于可能性的悲剧。孤零零地躺在那里,既无联系也无目的,这块砖已然归属于瓦砾的国度。用物理学冷峻的语言来说,它代表了一种高熵的状态——它是这个世界趋向混乱、无序并终归尘土的一个碎片。它是迷失了方向的物质。 然而,路易斯·康,带着一位治疗师对待无生命物体般的敏锐,在那片死寂中听到了声音。他那句著名的发问——“砖,你想要什么?”(“What do you want, Brick?”)——以及随之而来的回答——“我喜欢拱”(“I like an arch.”),并不仅仅是一时的异想天开。他是在阐述某种关于存在本质的深刻真理。 因为,在一堆砖块转变为一座拱券的过程中,我们目睹了一种世俗的奇迹。 试想在那几何形态的转换中发生了什么。孤立之时,砖块是脆弱的;它恐惧于那可能将其折断的剪切力。但在拱券的拥抱中,砖块找到了救赎。这种混乱的、个体的软弱被转化成了一种集体的力量。 正是在这里,我们触及了 整体性(Wholeness) 最神秘的内核。 当个体找到了恰当的组合,发生的不仅仅是简单的加法。这并非五十块砖加上另外五十块砖;这是一种炼金术般的质变。原本死寂的黏土,因为秩序的介入,突然获得了一种类似生命的特质。那个新诞生的“拱”,拥有了单一砖块所无法想象的灵魂。它有了呼吸,有了性格,也有了意志。 所谓整体性,就是当一群平庸的局部聚在一起,却突然涌现出了一个全新的、神圣的生命体。 伫立在埃克塞特图书馆那巨大的拱门前,我们意识到,我们所感知的三个概念,其实是一回事: 负熵(Negentropy): 也就是那个新生命体抵抗衰败的能力。它是可视化的秩序。 整体性(Wholeness): 也就是那个新生命体诞生的时刻——当部分消失,整体浮现。 美(Beauty): 这是我们的情感赋予前两者的名字。 我们发现,所谓美,不过是我们的眼睛在识别出“死物”转化为“生命”时,所给予的惊叹。 我们之所以觉得拱是美的,是因为在生物学的层面上,我们是渴望生存的造物。埃尔温·薛定谔曾将生命定义为某种以“负熵”为食的东西。像砖块一样,我们也在不断对抗那些试图将我们离散的力量。我们终其一生都在进行一场搏斗,试图在时间那侵蚀性的洪流中,维持内部结构的完整。 这就是为什么好的设计能如此深切地打动我们。它不仅仅是装饰;它是一种抵抗的形式。 当康帮助砖块成为拱时,他赋予了它一种在孤立状态下绝无可能拥有的尊严。他将它从瓦砾堆中拯救了出来。而在此过程中,他向我们提供了一个隐秘的承诺:即便在一个倾向于无序的宇宙中,只要我们能找到那种神圣的组合方式,原本卑微的个体也能超越自身的局限,在一种更宏大的整体中,获得永恒的生命。 这便是建筑给予我们的终极慰藉:它向我们展示,物质,一如我们自己,皆可在一种完美秩序的怀抱中,重获新生。
唯一的买家
唯一的买家 大多数人认为股市是一个赌场。在某种程度上,他们是对的。如果你把时间轴拉得足够短,它确实是一个巨大的、嘈杂的、充满了各种随机变量的系统。人们买入股票,唯一的指望是有一个“更大的傻瓜”在明天以更高的价格接盘。 这是一种递归的噩梦:你买它是为了卖给别人,别人买它是为了卖给下一个人。这中间没有任何锚点。 但最近,我听到了一种关于投资的黑客式解法(hack)。这个观点非常简单,简单到甚至有点反直觉: 一家公司其实只有一个买家。 初听起来,这句话像是代码里的死循环。如果唯一的买家是公司自己,那每天在交易所里数以亿计的交易者算什么? 要理解这一点,你必须像程序员理解底层协议一样理解股票。 当你买入一家公司的股票时,你实际上是在进行一次时间旅行的交易。正如你所察觉的,股票本质上是一种企业发行的“私人货币”。企业在早期发行这种货币,是因为当下它们缺乏现金,但拥有未来。 这是一种跨越时间的折价交换。 企业对你说:“我现在需要你的现金来购买服务器、雇佣工程师或建立工厂。作为交换,我给你一张凭证。虽然现在大家都不相信我能做成,或者因为宏观环境不好而恐慌,所以这张凭证很便宜。但在未来,我会用我赚到的真金白银把它买回来。” 这就是那个“唯一的买家”的真正含义。 这里的“买回来”,并不一定意味着私有化退市。它通常通过两种方式发生:分红(直接给你现金)或者回购(减少流通股数量,增加你手中股份的含金量)。 如果你是一个真正的投资者,你根本不在乎股票市场每天上上下下的报价。那些报价只是噪音。你只在乎那个最终的循环是否能闭合:这家公司在未来是否能产生足够的现金流,通过分红或回购的方式,把你手里的“凭证”兑现。 这解释了为什么只有极少数人能战胜市场。 有一句关于投资的格言说:“心中有市场就很难战胜市场。”这听起来像是一句禅宗的谜语,但它其实是一个关于注意力的算法。 如果你的注意力在“市场”上,你关注的是其他人的心理。你在试图猜测别人的猜测。这不仅很难,而且在数学上是不可持续的。你是在和一个巨大的、情绪化的随机数生成器博弈。你试图在别人之前抢跑,试图把烫手山芋扔给下一个人。 但如果你的心中只有“生意本身”,你的算法就变得极其简单。你不需要预测明天的股价,也不需要预测美联储的利率。你只需要回答一个问题:这家公司未来的现金流,折现到今天,是否大于现在的价格? 如果是,你就买入。然后等待。 你等待的不是另一个投机者来接盘,你等待的是时间证明你是对的。 这是一种很奇妙的感觉。当股价下跌时,投机者会感到恐慌,因为他们的“下家”消失了。但对于理解了“唯一买家”的人来说,股价下跌只是意味着你可以用更低的价格,买入更多的未来现金流。 这就像是你发现了一台印钞机,而周围的人却因为机器外壳有点旧而在打折出售它。 所以,最终的测试很简单。假设明天股票市场永久关闭,再也没有K线图,再也没有报价,你还愿意持有这家公司吗? 如果你依赖那个“唯一的买家”——也就是公司本身的盈利能力——你的答案应该是肯定的。你不需要把这台印钞机卖给别人,你只需要留着它,让它为你工作。 这才是投资的本质。其他的,都只是噪音。
J型人的失速
如果你观察过那些在学校里成绩最好、在公司里晋升最快的人,你会发现他们通常有一种共同的特质。在 MBTI 的语境下,我们称之为“J型”(判断型)。他们喜欢秩序,热爱计划,对截止日期有着近乎宗教般的虔诚。 把任务交给他们,就像把代码输入到一个极其稳定的编译器里:你输入指令,他们输出结果。既不报错,也不延迟。 然而,有一个奇怪的现象。 当这些人离开学校,或者辞去大公司的职位试图创业时,他们中的许多人会突然“熄火”。就像一辆高速行驶的赛车突然失去了动力,停在路中间。他们依然聪明,依然勤奋,但他们不再前进了。 我称之为“J型人的失速”。 这种失速并不是因为懒惰。恰恰相反,是因为他们太想把事情做“对”了。 问题的根源在于教育系统的一个 bug。我们在学校里度过的前二十年,本质上是在训练一种能力:解题。老师给你一个在大纲范围内的题目,你通过应用已知的公式,得出一个标准答案。在这个游戏里,框架是给定的(Given),你的任务是执行(Execute)。 J型人是这个游戏里的顶级玩家。他们通过完美地执行外部框架获得了所有的奖励:分数、学位、薪水。 但当你试图做一些新的事情——比如创业,或者探索一个未知的领域——游戏规则变了。这里没有大纲,没有公式,甚至没有题目。你必须自己定义题目。 对于J型人来说,这不仅仅是困难,这简直是恐怖。 当外部权威消失时,他们会陷入一种名为“等待指令”的瘫痪状态。他们坐在电脑前,试图写一份完美的商业计划书,或者寻找一本完美的教程。他们在潜意识里相信:一定存在一个正确的框架,只是我还没找到。 他们不相信自己可以创造框架。 这是一个信念层面的问题。他们认为框架具有一种神圣性,只有“权威”——老师、老板、大师——才有资格制定。自己制定的计划?那是“瞎搞”,是不严谨的,是不值得执行的。 所以他们卡住了。他们在等待一个永远不会出现的老师来给他们布置作业。 但这是可以破解的(Hackable)。 如果你是一个陷入失速的J型人,你不需要改变你的性格,你只需要欺骗你的大脑。你需要一种能够绕过“我没有资格制定规则”这一心理防御机制的技巧。 这个技巧叫做 “迁移” (Transfer)。 既然你的大脑只信任权威,那就给它一个权威。但这个权威不必来自你正在做的领域。 假设你想在儿童教育上有所作为,但你不是教育专家,你感到迷茫。与其在那空想,不如去借用一个你信任的权威。比如,你相信巴菲特。 这听起来很荒谬,投资和带孩子有什么关系?但这就是黑客思维的精髓:透过表象看结构。 你可以提取巴菲特的源代码: 能力圈: 别逼孩子做他不擅长的事,找出他的天赋领域。 护城河: 培养那些难被替代的核心素养,而不是死记硬背。 长期主义: 别盯着期中考试的分数(短期股价),要看十年后的人格(内在价值)。 看,你刚刚做了一件了不起的事。你没有等待教育专家的许可,你自己创造了一个教育框架。但因为它的内核来自巴菲特,你的大脑(那个挑剔的J型审查员)会接受它,认为它是“合法的”、“高质量的”。 这个过程只有三步: 定义问题领域(我要解决什么?) 选定权威人/原则(谁在这个宇宙中拥有最底层的智慧?) 实现迁移(如何把他的原则翻译成我的行动清单?) 这不仅仅是一个技巧,这是一种权力的转移。 当你第一次成功地将一个不相关的权威原则迁移到你的问题上,并发现它行之有效时,你会意识到一个惊人的事实:原来地图是可以自己画的。 世界上并没有那么多“大师”。大多数所谓的专家,也只是在某个时刻,勇敢地把一个旧的道理用在了新的地方。 对于J型人来说,一旦他们跨越了这个信念的鸿沟,一旦他们学会了如何为自己构建脚手架,他们将变得非常可怕。因为他们拥有大多数空想家所不具备的超级能力:执行力。 你只需要那把启动钥匙。现在,你已经有了。
三个黄金周期
当人们谈论教育时,他们通常把它看作是一条线性的传送带:你从一端上去,经过K-12和大学,然后从另一端下来,开始工作。 这是一种糟糕的模型。它掩盖了时间在不同阶段具有不同权重的事实。 如果你观察那些在智力领域极具生产力的人——优秀的程序员、作家或科学家——你会发现一种更符合现实的模型。在这个模型里,人生被划分为三个关键的十年。 我们将小学六年级到大学毕业(大约12岁到22岁)称为第一个黄金周期。 在这个阶段,大多数孩子和家长都沉迷于错误的指标。他们痴迷于分数、排名和常春藤盟校的录取通知书。但这就像是盯着汽车的喷漆,而忽略了引擎。 第一个周期真正重要的事情只有一件:习得专注(Acquiring Focus)。 我指的不是坐在桌前发呆,而是那种能够长时间将注意力像激光一样烧穿复杂问题的能力。这是一种生理上的改变。在12岁到22岁之间,你的大脑还在重塑。如果你在这个阶段学会了如何进入深度心流,如何为了解决一个bug或推导一个公式而忘却饥饿,你就实际上是在为你的大脑编写底层的编译器。 如果你在22岁之前没有获得这种能力,你以后很难再补上。这就像是在水泥干了之后试图改变地基的形状。 这就引出了第二个黄金周期(22岁到32岁)。 如果我们说第一个周期是关于构建引擎的,那么第二个周期就是关于这台引擎能跑多快。 在这个阶段,你进入了所谓的“真实世界”。这里的竞争不再是人为设计的考试,而是解决混乱的、没有标准答案的问题。 这就是为什么第一个周期的专注度决定了第二个周期的高度。 如果你在第一个周期只是学会了唯唯诺诺地完成作业,那么在第二个周期,你会被琐事淹没。你会成为那种整天忙碌却产出寥寥的“伪工作者”。但如果你在第一个周期就拥有了那种强悍的专注力,你就能在第二个周期产生巨大的杠杆效应。你能在别人需要一周的时候用一天完成工作,更重要的是,你能看到别人看不见的深层模式。 然后,事情变得有趣了。你的理论中最令人不安、也最深刻的部分在于第三个黄金周期(32岁到42岁)。 对于大多数人来说,第三个周期根本不存在。 观察一下你周围的人。到了32岁,大多数人的好奇心已经枯竭。职业的惯性、家庭的琐事、房贷的压力,这些噪音大到足以淹没任何微弱的求知欲。对于绝大多数人来说,学习在第二个周期结束时就实际上停止了。他们开始依靠存量活着。 唯有那些在第一个周期就将专注度训练成一种本能的人,才能幸存下来。 如果你在早年习惯了那种解决难题带来的多巴胺奖赏,你就不会满足于平庸的中年生活。那种深刻的专注力会变成一种保护罩,帮你屏蔽掉中年的噪音。 所以,第一个周期的投入,不仅决定了你年轻时能飞多高,更决定了你在中年时是否还在“飞”。 这对我们意味着什么? 这意味着,如果你现在处于第一个周期,或者你有孩子处于这个阶段,不要太在意他们学的是Python还是拉丁文。要在意他们是否在学习过程中体验过那种“极度痛苦又极度快乐”的专注。 因为那十年不仅是在学习知识,更是在决定你未来二十年的人生质地。你在定义你自己版本的“黄金时代”会有多长。
为什么企业最终都会变成“秦朝”?
当你观察一家快速成长的现代中国大型企业,你会发现一件奇怪的事情:它们看起来并不像是一个严密的整体,而更像是一个松散的周朝。 销售部门用一套 CRM,财务部门用另一套 ERP,人力资源有自己的系统,而员工们则在微信和各种文档之间反复横跳。每一个部门都像是一个诸侯国(Fiefdom)。它们有自己的“文字”(数据格式),有自己的“度量衡”(业务标准),甚至有自己的“边境关卡”(账号体系)。 这在初创期不是问题。就像在文明的早期,小部落各自为政效率最高。但当组织规模扩大到一定程度,这种“分封制”的软件架构就会成为噩梦。 这就是所谓的 “协作摩擦”(Coordination Friction) 。 在硅谷,我们常说“康威定律”决定了软件架构。但在中国的大型组织里,历史的某种必然性似乎正在重演。我们正在经历从“分封制”向“郡县制”的剧烈转型。这不仅仅是管理风格的改变,这是信息处理效率的数学必然。 数据的“车同轨” 为什么秦始皇要推行“车同轨”?历史书会告诉你这是为了加强统治。但在黑客眼中,这是一个 标准协议(Protocol) 的问题。 如果赵国的车轮间距和秦国的不一样,货物在边境就必须卸货、转运。在软件世界里,这就是当你试图把数据从一个孤立的 SaaS 导入另一个系统时发生的事情。你需要清洗数据、转换格式、重新登录。这些动作就是数字世界里的“卸货和转运”。 对于一个只有 50 人的公司,这没关系。但对于一个 5 万人的企业,这种内耗是指数级的。 这就是为什么像 WPS 365 这样的产品会出现。它们表面上是在卖办公软件,但实际上,它们在做一件更底层的事情:它们在建立企业内部的“秦直道”。 当你说“数据归一”时,你实际上是在消除系统间的“API 调用成本”。你不再需要在不同的诸侯国之间寻找翻译,因为所有人都开始讲同一种语言。 组织的操作系统 如果你深入思考,你会发现,大型组织需要的不再是更多的“应用(Apps)”,而是需要一个更好的 “操作系统(OS)” 。 操作系统的本质是什么?它是对硬件资源的抽象和管理。它确保 CPU、内存和 I/O 设备不会因为争抢资源而打架。 一个现代大型企业,本质上就是一台巨大的、由人构成的计算机。 员工是 CPU(算力); 资金是电源; 文档和数据是内存; 业务流程是 I/O。 在“分封制”时代,每个应用程序(部门)都试图独占 CPU 和内存。结果就是死锁(Deadlock)和崩溃。 所谓的“郡县制改革”,在技术层面上,就是引入了一个 统一的内核(Kernel) 。 这个内核——也就是我们所说的一体化办公平台——接管了最底层的权限:身份认证(Identity)、数据存储(Storage)和消息总线(Bus)。它告诉所有的应用:“你们可以处理业务,但数据必须写在统一的地址空间里;你们可以有自己的流程,但必须遵循统一的调度协议。” 这就是“中央集权”在计算机科学中的含义:通过抽象层的统一,实现资源调度的最大化。 历史的必然 很多 CIO 担心这种统一会扼杀创新,就像人们担心秦朝过于严苛一样。 但事实恰恰相反。当你把底层的基础设施(如路网、文字、度量衡)统一之后,上面的商业活动反而会爆发式增长。互联网就是最好的例子:TCP/IP 协议的统一,才诞生了万维网的繁荣。 中国企业的这次“郡县制改革”是不可逆的。 这不是因为老板们更有控制欲了,而是因为在数字化时代,数据流动的阻力(Latency)决定了企业的生死。 那些坚持“分封制”、任由数据孤岛存在的企业,最终会被自身的复杂性压垮,死于高昂的内部交易成本。而那些完成了“书同文、车同轨”的企业,将获得一种可怕的竞争优势: 它们能像一个单体应用一样,瞬间调用全身的资源,力出一孔。 这就是大型组织基础操作系统的真正价值。它不生产数据,但它定义了数据如何流动。而在历史的长河中,谁定义了流动的标准,谁就赢得了未来。
缺失的中间环节
如果你观察那些失败的项目,或者那些平庸的产品,你会发现它们都有一个共同的特征:它们是对并不存在的问题的回答。 我们有一种奇怪的本能,就是直接跳进“解决方案”(What)。当你想到一个点子时,你的大脑会立即开始设计它的样子,思考它的功能,甚至想象它发布时的场景。这很自然,因为这是最令人兴奋的部分。 但真正有效的解决方案——那些能在混乱的现实中存活下来的方案——往往有着完全不同的结构。如果你仔细拆解那些伟大的创造,你会发现它们并非始于产品,而是始于一种特定的思维顺序:先是理念(Why),接着是冲突(Conflict),最后才是方案(How-What)。 大多数人之所以失败,是因为他们完全跳过了中间那一步。 理念作为公理 一切都始于对世界的某种断言。我称之为“理念”(Why),但这不仅仅是一个理由,它更像是一个公理。 它通常是对某种“应然”状态的描述。比如,“在互联网时代,向任何人发送金钱应该像发送邮件一样简单。”或者,“计算力最终将变得如此便宜,以至于我们不必再关心软件的安装问题。” 在这一阶段,你不需要关心技术细节。你需要的是一种敏锐的直觉,能够看到目前的世界在某些方面是荒谬的、过时的或者错误的。这通常不需要你是天才,你只需要足够诚实。 只要你活得足够久,你就会发现世界上到处都是这种不合理。 冲突的价值 接下来发生的事情,区分了梦想家和实干家。 如果你有一个完美的理念(Why),但世界并没有那样运行,那么一定有原因。这就是 冲突(Conflict)。理念与现实之间的鸿沟,就是冲突所在。 大多数人在遇到冲突时会感到沮丧。如果银行系统很复杂,他们会想:“也许做支付太难了,我换个方向吧。”他们把冲突看作是停止的信号。 但对于黑客来说,冲突不是停止信号,它是路标。 冲突的存在,恰恰证明了价值的存在。如果你的理念很容易实现,没有任何阻力,那么大公司或者某个无聊的开源项目早就把它做完了。正是因为有阻力——因为有技术瓶颈、因为有陈旧的法规、或者因为根深蒂固的人类习惯——你的机会才得以存在。 在你的思维模型中,这应该是花费时间最多的地方。你必须盯着那个冲突看,直到你完全理解它的形状。为什么现有的方案很糟糕?是成本太高?是由于缺乏信任?还是单纯的因为懒惰(Schlep)? 你不能通过忽视冲突来解决问题。你必须走进去。 作为副产品的方案 只有当你彻底理解了理念和现实之间的冲突后,方案(How-What) 才会自然显现。 在这个阶段,你的产品不再是一个凭空想象的发明,它变成了一个特定的工具,专门用来在“理念”和“冲突”之间架起桥梁。 这就是为什么最好的创业公司往往很难向外行解释。因为外行看不到冲突,他们只看到现在的世界。当你试图解释你的方案时,你必须先向他们解释为什么现在的世界是破碎的。 比如 Airbnb。 Why: 人们应该能够像当地人一样体验城市。 Conflict: 房主不信任陌生人,陌生人不信任房主,且缺乏交易担保。 How-What: 一个建立在双向评价体系和第三方担保支付之上的预订平台。 Airbnb 的产品形态(What)完全是由它试图解决的信任冲突(Conflict)所塑造的。如果你拿掉了中间的冲突分析,只是做一个“让人们住进别人家”的网站(What),你只会得到一堆空房子和几起诉讼。 结构的修正 这种 Why-Conflict-How-What 的顺序之所以反直觉,是因为它要求我们在动手创造之前先去寻找痛苦。 这就解释了为什么现在的科技圈充斥着所谓的“伪需求”。因为人们爱上了他们的锤子(技术),于是到处找钉子。他们从 How-What 开始,倒推一个 Why,并假装中间没有 Conflict。 如果你正在构建什么东西,不妨停下来做一个简单的测试。盖住你的产品(What),你能清晰地描述出它背后的那个理念(Why)以及阻碍这个理念实现的残酷现实(Conflict)吗? 如果中间那个环节是空白的,或者仅仅是“因为这很酷”,那么你可能并没有在解决问题,你只是在自娱自乐。而市场,通常不会为自娱自乐买单。