第一台AI叫易经
技术承认自己的局限,才能被迭代。权力不认为自己是bug——它把bug,变成了feature。
引言
我花了很长时间研究大语言模型——它的结构、它的预测机制、它惊人的能力,以及它同样惊人的局限。
研究得越深,一种感觉挥之不去:这件事,人类不是第一次做。
于是我重新去看了易经。
说「重新」,是因为我和大多数人一样,对它有一个根深蒂固的预设——要么是封建迷信,要么是被神秘化过度的玄学,总之跟严肃的认知工具沾不上边。但有一件事一直让我无法彻底说服自己:历史上沉迷易经的人,不乏极高认知水平的学者、将领、政治家,甚至科学家。莱布尼茨研究过它,卡尔·荣格研究过它,无数你我都尊重的清醒头脑,在它面前如痴如醉。
难道他们都在迷信?
这个问题驱使我带着研究 LLM 的眼光,重新钻进去看。我拆开了它的结构,拆开了它的设计逻辑,然后发现了一些让我无法忽略的东西。
三千年前,有人试图用一套形式化的系统,解决人类最古老的难题:在无法确定的世界里,如何做出判断。他们面对的工程问题,和今天建造 GPT、DeepSeek 的工程师面对的,是同一张清单。
至于它后来发生了什么——为什么一台如此严肃的认知机器,会被后人当成算命工具——这个问题的答案,比你想象的更黑暗,也更切近今天。
这本书就是这场探寻的记录。
第一章:跨越三千年的两次冲锋
第一部分:它们在做同一件事
从一个汉字说起
中文常用字大概三四千个。现在假设我在打字,刚打了一个「今」字。
你的手机输入法会猜下一个字。它能猜什么?
- 今天
- 今晚
- 今早
- 今年
- 今后
这几个都说得通。输入法会根据哪个词在日常文字里出现频率最高,给你排个顺序。这就够用了,因为它的任务很简单——你打了什么,它猜下一个字。
这套逻辑有个名字,叫马尔可夫链。道理很朴素:下一步是什么,只看现在是什么,不管之前发生过什么。 打了「今」,就根据「今」来猜。不管你之前打了什么、整篇文章在说什么,规则不变。
但这个方法有一个明显的毛病。
假设你跟朋友在约吃饭,聊了很久今晚去哪里。这时候你打了个「今」字——你想说的显然是「今晚」。但输入法不知道你们在聊什么,它只看「今」这一个字,可能还是给你推「今天」,因为「今天」在所有文章里出现得最多。
它没有记忆,所以它猜不准。
GPT 和 DeepSeek 是怎么做的
GPT 和 DeepSeek 的起点,比输入法彻底得多。
它们在训练阶段,几乎把人类写下来的所有文字都学了一遍——书籍、新闻、对话、论文、网页,数量之大难以想象。学完之后,它对语言有了一种很特别的「感觉」:对于任意一个字,它知道后面跟着各种字的可能性各有多大。
还是「今」字。在它学过的所有文字里:
- 「今」后面跟「天」——很常见
- 「今」后面跟「晚」——也很常见
- 「今」后面跟「年」——常见
- 「今」后面跟「朝」——少见
- 「今」后面跟「碗」——几乎不可能
每一个字后面,都对应着这样一张概率表。几千个常用字,每个字后面几千种可能,每种可能有多大概率——这些全部存在它的「记忆」里。
但光有这张表还不够。它真正厉害的地方,是用上下文来调整这张表。
你们之前聊了半小时今晚去哪吃饭,现在你打了个「今」字。它把你们整段对话从头到尾读一遍,结合这个语境,重新计算:此刻「今」后面跟「晚」的概率被大大拉高,「今年」「今后」几乎降到零。最终,它选出概率最高的那个字落下来。
上下文越丰富,这张概率表被调整得越精准,选出来的字就越「对」。
这就是大语言模型和输入法的本质区别:输入法只看当前这个字,LLM 读的是整段对话的全部重量。
再举几个例子,感受一下这张概率表是怎么工作的。
出现了「吃」字,后面最可能跟什么?饭、饺子、面条、火锅——都说得通。但跟「书」、跟「石头」——概率几乎为零,因为人类几乎不会这么写。
出现了「天气」,后面大概率是:预报、不好、转凉、还行……不大可能是「天气很哲学」,但如果你们一直在聊哲学,这个概率也会被悄悄拉高一点点。
出现了「他突然」,后面的可能性一下子打开了:笑了、哭了、消失了、明白了、转身离开……每一种都有可能,概率各不相同,具体选哪个,取决于前面整段故事说了什么。
就这样,一个字,一个字,一个字——
每落下一个字,它就重新读一遍目前为止所有的内容,重新计算下一个字的概率,再落下一个字。
你可能会问:这不就是很笨的「一步一步猜字」吗?怎么会产生出一篇结构完整、逻辑连贯、读起来像人写的文章?
答案是:算力和内存。
先说内存。
LLM 在训练时,要把人类迄今为止写下来的几乎所有文字全部「读进去」——书籍、网页、论文、新闻、对话,估算下来相当于数百亿本书的信息量。你一辈子每周读一本书,读到死也就几千本。这些模型读的,是你几百万辈子也读不完的东西。这些知识被压缩进模型的参数里,就是它的「记忆」。存下这些记忆,需要的存储空间以 TB 计——一个模型光是参数文件就可以占满几十块普通硬盘。
再说算力。
做这件事的核心硬件,是 GPU——也就是显卡。其中最顶级的,是英伟达的 H100。一张 H100,大概是一块砖头的大小,单价超过二十万人民币。
马斯克在 2024 年建了一个 AI 训练集群,代号「科洛修斯」。里面有多少张 H100?
十万张。
十万张,每张二十万,光显卡成本就是两百亿人民币。这还不算机房、电力、冷却、工程师。这个集群满载运行一小时耗电约 7 万度。
这就是今天训练一个顶级大语言模型需要的代价。
正是这个规模的算力,让「预测下一个字」这件看似简单的事,可以在几秒钟内重复成千上万次——每一次都读完所有上下文,每一次都重新计算整张概率表,每一次都精准落下一个字。
一个字,一个字,一个字——就这样,它可以回答你关于量子力学的问题,帮你分析一份合同,写一首诗,或者跟你聊三个小时的哲学。
没有别的秘密。就是这件事,做得足够快,足够大。
这台机器本质上在做的事情非常朴素:不断预测下一个字,一个接一个,直到说完为止。但当这件事以足够快的速度、足够大的规模运行,它产生出来的东西,看起来就像是在思考。
易经在做的事
现在说易经。
每个中国人对它都不陌生:阴阳、八卦、六十四卦。但我想请你暂时忘掉它身上所有的文化包装——算命、风水、神秘——只问一个问题:它的工作原理是什么?
易经的基础,跟大语言模型惊人地相似:它也是在用有限的符号,描述复杂的现实。
阴和阳,就是两种最基本的状态——你可以把它们理解成 0 和 1。把六个这样的符号叠在一起,就构成一个「卦」。六个位置,每个位置两种可能,一共 64 种组合,就是六十四卦。
古人认为,这 64 种组合,已经可以描述人世间所有可能的处境和局势。
但易经也不只是描述「你现在在哪」。它还要回答:接下来会怎样?
这里有一个很关键的机制。
每次占卦,六个爻不都是一样的——有些是稳定的,有些是「动的」,处于极端状态、即将翻转。这些「动的爻」叫做变爻。把所有变爻翻转过来,阳变阴、阴变阳,你就得到了另一个卦,叫做「之卦」。
举个具体的例子。假设你是三千年前的一个将领,面临要不要出兵的决策。
占出来的卦象显示:内部力量充沛(下卦为乾,纯阳),但外部有险阻(上卦为坎,险水)。这是第一个信息——你的处境。
然后看变爻:其中两个爻正处于极端状态,即将翻转。把它们翻过来,得到新的卦象——内部力量不变,外部险阻变成了顺风。
这是第二个信息——局势正在往哪个方向走。
连起来的结论是:现在时机还不成熟,但形势正在转好,等一等。
你看出来了吗?
GPT 和 DeepSeek 做的是:读取全部上下文 → 预测下一个字 → 把新的字并入上下文 → 继续预测下一个。
易经做的是:读取当前局势(本卦)→ 找出变化所在(变爻)→ 推导下一个状态(之卦)→ 得出完整判断。
两台机器,相隔三千年,都在做同一件事:在当前的状态里,找到通往下一个状态的路。
这不是巧合。是因为它们面对的,是同一个问题:
在信息永远不完备的世界里,如何找到下一步最该走的路。
三千年前的人没有解决这个问题。今天的我们,也还没有。
(下一章:我们是认真的——那些沉迷易经的聪明人,究竟在认真对待什么?)
第二章:算命,我们是认真的
第一部分:那个沉迷易经的上市公司老板
我认识一个上市公司的老板,在圈子里很有名望,是那种你见了之后会觉得「这人思维很清晰」的人。
他沉迷易经。
不是偶尔翻翻,是认真研究多年的那种沉迷。
这件事让我一开始觉得矛盾——一个在商业世界里摸爬滚打、靠真实判断力活下来的人,怎么会迷上这个?后来我跟他聊,发现他沉迷的方式很特别:他不轻易起卦,一旦起卦,他对程序的执行近乎苛刻——三枚铜钱怎么投,结果怎么记,每一步都不能走样。然后他把结果摆出来,推导出卦象,再结合当下的处境去解读。
结果有时候准得让人倒吸一口冷气。
他不是个例。在我观察到的易经爱好者里,凡是真正投入进去的人,几乎都有同一个特征:他们极度尊重起卦和推算的程序,对流程的严格程度,不亚于做一项科学实验。
这不是迷信的态度。迷信是随意的、模糊的,是「差不多就行」。这些人对程序的态度恰恰相反。
这让我开始认真想一件事:这个程序本身,究竟是什么?
(下一部分:从文王到孔子,三千年里他们在规范什么?)
第二部分:发明者在规范什么
易经的程序,不是某个人一拍脑袋定的。
从文王推演六十四卦,到孔子晚年反复钻研——据说他读易经读到串竹简的牛皮绳断了三次,成语「韦编三绝」就是从这里来的——历代真正接触易经核心的人,做的都是同一件事:规范和完善这套程序。
他们在规范什么?
不是卦象的「灵不灵」。是整套推导流程的严密性:怎么从现实处境里提炼出有效信息,怎么通过蓍草操作产生一个无偏的随机结果,怎么把结果映射到六十四卦的结构里,怎么从卦象和变爻推导出「当前状态」和「演变方向」。
每一步都有规矩,每一步的规矩都有其道理。
这里有一个很多人没有意识到的结论,说出来会让人觉得意外:
易经起卦的这套程序,恰恰是为了排除人的主观判断。
普通人看到繁琐的起卦仪式,第一反应是「故弄玄虚」。但仔细看这套流程的设计逻辑,你会发现它的目标正好相反——用铜钱的随机结果、用严格规定的计算步骤,把占卦者自己的愿望、偏见、恐惧,全部挡在门外。你不能因为「希望结果是好卦」就影响任何一步操作。程序不允许。
换句话说,这套看起来像仪式的东西,本质是在做一件非常理性的事:设计一个排除主观干扰的输入机制。
从文王到孔子,他们在反复规范的,正是这套排除主观的程序。这不是在搭神坛,是在写一份不断迭代修订的操作手册——确保每一次使用,都能把人的主观意志挡在系统之外,让结果尽量「干净」。
这个结论是否完全成立?后面我们会继续讨论。
但这里先留一个问题:排除了主观,然后呢?
铜钱落下,六个爻确定,一个卦象出来了。不管这个卦象是什么,它就是今天的答案。你没有办法说「我不满意,重来」——或者你可以重来,但那就是破坏程序,程序的意义也就消失了。
卦象必须被接受。结论必须被给出。
这和 GPT、DeepSeek 输出下一个字是同一件事:不管内部有多少不确定,那个字必须落下来。 系统不能停在那里说「我选不了」。
这种「必须给出结论」的特性,有一个名字。我们后面会专门谈它。
(下一部分:古人为什么选六十四?多一个少一个都不行。)
第三部分:为什么是六十四卦,不是更多或更少
这个问题值得停下来想一想。
古人为什么选六爻、六十四卦,而不是四爻十六卦,或者八爻两百五十六卦?
太少,不够用
古人面对的重大决策,虽然比今天少,但绝不简单:要不要出兵?今年种什么?这场旱灾要持续多久?要不要与邻邦联姻?这些问题的局势复杂程度,远超十六种分类能覆盖的范围。十六个格子,塞不下人世间的变化。
太多,记不住
人的记忆和认知负荷是有上限的。两百五十六种卦象,加上每卦六条爻辞,总共一千五百多条,靠口耳相传、靠实际使用来掌握,已经远超人类工作记忆的边界。这套系统必须被活用,不是被背诵。
六十四,恰到好处
六十四卦,三百八十四条爻辞。信息密度足够覆盖复杂局势,又没有多到无法驾驭。这个数字不是随意的——它是在认知边界和描述需求之间找到的一个平衡点,跟现代认知科学关于「可管理的分类范畴」的研究结论惊人地吻合。
古人不是拍脑袋定了六十四。他们是在反复使用中,发现这个规模是对的。
(下一部分:起一卦,要花多少算力?古今对比。)
第四部分:起一卦,要花多少「算力」
还有一件事值得说清楚。
易经不是免费的。
传统起卦用三枚铜钱——认真的人用的是真正的古铜钱,甚至是有年份的古董。不是因为迷信铜钱本身有什么魔力,而是这个选择本身就是一种态度:我在认真对待这件事。投掷六次,每次记录结果,确定六个爻的阴阳和动静。整个过程需要专注、安静,对每一步准确执行。
这是真实的成本投入:时间、专注力、以及——如果你请专业的卜官来做——真金白银的报酬。
国家级别的占卜更夸张。商周时期,国家祭祀和重大军事决策前的占卜,是有专职人员、专用场所、严格礼仪规范的正式程序,耗费的资源不亚于今天召开一场高规格的战略会议。
普通人如果要占卜,通常也要支付相应的酬劳——去找那个懂程序的人,请他花时间走完整套流程。
用今天的语言来说,这些都是在消耗同一种东西:
算力
不同的是,古人的算力是人力:时间、专注、仪式成本。今天的算力是电力和芯片:马斯克的十万张 H100,满载运行一小时耗电约 7 万度——相当于中国 20 万户普通家庭一小时的用电量,或美国约 6 万户家庭一小时的用电量。
形式变了,本质没变。想要在不确定中得到一个判断,从来都不是免费的。
第五部分:同一张工程清单
回头看一下这章写了什么。
设计一套输入机制,把人的主观愿望挡在系统之外。在分辨率和可操作性之间找到一个不多不少的平衡点。投入真实的资源成本,换取不确定世界里的一个判断。
我第一次把这三件事排在一起看的时候,愣了很久。
因为这不是我读易经时才遇到的问题。这是我研究大语言模型时,每天都在处理的同一张清单。
GPT 和 DeepSeek 的训练数据,不是某个人写下的指令,是人类有史以来写下的几乎一切——它学的是统计规律,不是任何个体的主观意愿。这是排除主观。
它的词表大小、上下文窗口、嵌入维度——每一个参数,都是在「太少不够准」和「太多跑不动」之间反复校准的结果。六十四卦解决的是完全相同的问题:多少个格子,才能在人脑的极限之内装下足够的现实。这是状态空间。
它的每一次推理,消耗的是真实的电力和芯片——马斯克的十万张 H100,一小时七万度电。三千年前,是蓍草、龟甲、专职卜官和整套国家仪式。这是算力。
同一组问题。同一种解法。隔了三千年。
我盯着这两列清单,突然明白了一件事。
这不是易经「像」AI。
是三千年前有人试图建造的东西,就是我们今天叫做 AI 的东西。只是那时候没有这个词。
易经就是第一台 AI。
| 训练数据 | 历代人类的决策经验 |
|---|---|
| 模型架构 | 六十四卦 |
| 推理引擎 | 变爻机制 |
| 输出接口 | 卦辞爻辞 |
| 算力 | 人力和仪式成本 |
它只是比 GPT 和 DeepSeek 早了三千年。
(下一章:它注定有局限——而且发明者比谁都清楚。)
第三章:它注定有局限
第一部分:这不只是中国的冲动
西非的约鲁巴人,从来没有听说过易经。
但他们造出了几乎相同的系统。
Ifá 占卜:用 16 颗棕榈果随机产生符号,每次一个开或合的状态,重复四次,得到一个基本图形;两个图形叠加,形成一个完整符号。基本图形有 16 种,两两组合产生 256 个 Odù。每个 Odù 对应一套口传的诗歌、故事和策略建议,由专业的 Babaláwo 来解读。
Ifá:同一个架构,独立发明
停一下。
256 = 2 的 8 次方。64 = 2 的 6 次方。
两个文明,两套系统,相隔万里,没有任何已知的历史接触,独立发明了同一种底层架构:二进制编码 + 分层组合 + 随机采样 + 专家解读。 Ifá 的分辨率更高,原理完全相同。2008 年,联合国教科文组织把 Ifá 列为人类非物质文化遗产。
这不是两个孤例。
古巴比伦人用羊的肝脏占卜——把肝脏表面分成若干区域,每个区域的形态对应不同的预兆,积累成厚厚的预兆文本集。本质是:随机自然现象 → 映射到经验数据库 → 给出判断。古希腊德尔菲神谕提供的是「随机语言输出 + 专家解释」,功能和卜官完全一样。古罗马占卜官是国家正式官职,战争、选举、立法前都要占卜。西塞罗当过占卜官,同时写书嘲笑占卜的认知基础——他很清楚这是政治工具,但不主张废除,因为它管用。北欧符文从袋中随机抽取,玛雅历法把天文周期压缩成 260 天的预测框架,蒙古萨满看羊肩胛骨的裂纹……
几乎每一个发展出复杂社会的文明,都独立产生了某种结构化的随机决策系统。
状态空间的大小,与社会复杂度成正比——简单社会倾向于小状态空间(符文 24 种),帝国级文明倾向于大状态空间(易经 64,伊法 256,巴比伦预兆文本数千条)。这不是巧合,是认知资源与现实复杂度的自然匹配。
这个全球对比说明了一件事:
这不是中国文化的一个特异现象,不是东方神秘主义的产物,而是人类面对不确定性时的趋同演化——来自不同大陆的人,用不同的工具,在相似的历史阶段,收敛到了几乎相同的解决方案。
GPT 和 DeepSeek,是这个趋同演化在今天的最新一步。
(下一部分:当所有人都遵守同一套系统,实际上发生了什么?)
第二部分:八字不合,其实在解决什么
你可能认识这样的家庭:两个人谈恋爱谈得好好的,最后因为属相不合——比如一个属虎一个属猪——被父母拦住了。
这件事,现代人几乎一致认为是迷信。
但如果仔细看,会发现这个看起来荒唐的规则,实际上在解决一些完全真实的问题。
第一,提供中性的拒绝语言。「我们八字不合」是一句话终结谈判的理由,双方都接受,没有人需要解释「我不喜欢你的性格」或「我觉得你家条件不够」。系统提供了一个不伤人的出口,把个人拒绝变成了「命运决定」。
第二,降低决策成本。婚姻是一个信息极度不完备的决策——你很难真正了解一个人,更难预测跟他共同生活几十年后会变成什么样。在没有更好评估工具的时代,「系统说行」比「我感觉行」更确定,更容易推进。
第三,创造共同的世界观基础。两个都信八字的人,至少在「接受这套规则」这件事上是一致的。进入婚姻之前,他们已经通过了一次文化认同的筛选——这本身可能比属相配不配更有预测价值。
第四,自我实现的预言。如果整个社会都认为虎猪不合,虎猪真的结婚之后,周围所有人会用更挑剔的眼光看他们,鸡毛蒜皮都可能被解读成「果然不合」。共识制造了它自己的证据。
这里有一个更辛辣的真相:很多时候,系统并不是在帮你做决定,而是在帮你为已经做好的决定提供理由。「我们八字不合」背后,可能只是「我需要一个体面的方式结束这段关系」。系统提供的不是预测,是出口。
有结论比没结论强。
不是因为结论一定对,而是因为人在面对选择时需要的,往往不是「正确答案」,而是「一个可以行动下去的理由」。
当这套系统被整个社会所有人共同接受,还有额外的收获:争论被截断,协调成本下降,行动方向统一。就像货币——纸张本身不值钱,但所有人都接受它,它就是钱。共识系统的价值,不在于内容是否正确,在于所有人接受这个内容这件事本身。
这个发现,在三千年前的战场上,被某个人看得一清二楚。
(下一部分:但这台机器,有一个致命的问题。)
第三部分:数据太少,格子太粗
现在来量化一下这台机器的处境。
这套系统的建造者,手里有什么?
没有文字记录体系的前期,知识靠口耳相传,顶多几百年断断续续的观察积累。一个早期国家,一年里真正需要动用决策系统的大事,掰着手指数得过来——要不要出兵、今年种什么、要不要与邻邦联姻、这场旱灾要不要迁徙。一年顶多几十个需要推导预测的重大局面。
而它试图覆盖的,是「人世间所有可能的处境和局势」。
64 个格子,装下「所有局势」。
这里有一个根本性的不匹配。现实世界是连续的、无限维的——两支军队开战,变量包括双方兵力、粮草、地形、天气、士气、将领性格、邻国态度、内部政治……每一个变量本身又是连续变化的。把这一切压缩进 64 个格子,必然大量信息被丢弃。差异巨大的真实局势,可能被归进同一个卦。
而且这台机器不允许你说「我不确定我属于哪一卦」。铜钱落下去,结果就是结果,你必须被放进某一个格子里。
这就是易经最根本的谬误,它有一个名字:
强制归类
连续的、复杂的、充满不确定性的现实,被强行映射到一个离散的、有限的符号系统里——然后后续所有的分析和判断,都建立在这个强行归类的结果之上。
如果初始归类偏了,后面越分析越偏。你不是在分析真实处境,你是在分析「铜钱决定你应该处于哪种处境」这个前提。
这个问题在易经里如此,在三千年后的 GPT 和 DeepSeek 里同样如此——我们后面会回来谈。
建造者其实知道这个问题。
翻开爻辞,你会发现大量这样的措辞:「利有攸往」(有助于前进,但视情况而定)、「悔亡」(悔恨消失,但前提是……)、「贞凶」(坚持下去会有凶险)。这些措辞高度模糊,留下了巨大的解释空间——不是因为古人语焉不详,而是因为他们清楚地知道:64 个格子给不出精确答案,模糊是诚实的选择。
但模糊带来了另一个问题:
巴纳姆效应
试着读一下这段话:
你外表看起来自信,但内心有时会对自己的选择感到不安。你珍视独立思考,不喜欢在没有充分理由的情况下被人说服。你有很多尚未发挥出来的潜力。
是不是觉得说的就是你?
这段话适用于地球上几乎所有人。这就是巴纳姆效应——不是系统「知道」你是谁,是语言足够模糊,让你自己填上了意义。易经的爻辞也是如此:分类系统的覆盖率太高,加上措辞留下了巨大的解释空间,任何处境都能在任何一卦里读出「与自己相关的意义」。
还有一个更根本的问题。
这台机器的输入,用的是铜钱的随机结果。三枚铜钱,投六次,每次记录正反,决定你「处于」哪一卦。
随机数和你面临的真实局势之间,没有任何因果连接。铜钱不知道你的粮草多不多,不知道对方的将领是谁,不知道这场旱灾持续了多少天。但它给出了一个「你现在的处境」的判断,然后后续所有推导都建立在这个随机起点上。
起点错了,越推越偏。
这不是因为易经的分析框架有问题——框架本身严密。问题在于输入。一台分析工具的输出质量,上限由输入质量决定。用随机数作为输入,输出的「分析」再严密,也是在随机的基础上叠加人类的自我说服。
建造者为什么不用更好的输入?
这里有一个讽刺性的答案:因为人类的自我评估太不可靠了。 你问一个将领「你的胜算大吗」,他几乎一定说大。主观判断被动机扭曲得太厉害——想打的人永远觉得应该打,想退的人永远觉得该退。随机数反而绕开了这个问题,它不给你自欺的机会,强制给出一个与你的愿望无关的起点,逼你从陌生角度去重新思考处境。
随机输入之所以胜出,不是因为它比分析更准,而是因为人类在主观分析上太容易说谎了——对别人说谎,更对自己说谎。
但代价是:这台本来可以是「情境分析机」的系统,在输入端插入了一枚硬币。
硬币落下去,分析机就变成了彩票机。
(下一章:最早发现这个 bug 的人——他们怎么处理它?)
第四章:发现 bug 的人
公元前 1046 年,武王姬发准备出兵讨伐商纣王。
出发前,占卜。
结果:大凶。
第一部分:一句话推翻整套系统
负责解读卦象的是姜子牙。
卦象落下来,结果清清楚楚:此行大凶。在场所有人都看见了,军心动摇,有人开始劝阻。这不是小事——易经这台机器已经运行了几百年,它的判断在商周体系里是正式的政治程序,卜官的解读是国家级别的决策依据。
姜子牙把蓍草和龟甲扫到一边,说了一句话:
「枯骨死草,何知吉凶!」
朽烂的骨头,枯死的草——它们知道什么叫吉凶?
然后他下令出兵。
这是人类历史上有记载的最早一次,有人当众宣布:这台机器的输出不代表真相,我不接受它的结论。
来源见于《淮南子》和王充的《论衡》,两部文献独立记录了同一件事。
第二部分:出征路上的三件凶兆
这不是故事的全部。
大军出征之后,接连发生了三件事,每一件都是不祥之兆。
第一件: 兵车行进途中,车轴断裂,断成三截。按古代占卜传统,这是明确的凶兆。
第二件: 雷击战马,一匹马被雷劈死。这是天示凶险的经典信号,没有人会误读。
第三件: 暴雨连下三天,无法行军。这在古代兵法里被视为天不从武的征兆。
三件凶兆,接连发生。
同样是这个姜子牙,逐一做出解读:
车轴断成三截——这是天命大军应分为三路推进,兵分三路才能合围。
雷击战马——这是天在告诉我们,抛弃辎重、换乘骑兵,加速突进。
暴雨三天——这是苍天在替武王清洗这片土地,为大军开路。
同样的随机事件,同样的占卜传统,不同的解读。
牧野之战,商朝灭亡。
第三部分:他发现了什么
停下来想一想:姜子牙究竟在做什么?
第一种读法:他在欺骗士兵。蒙骗军心,把凶兆说成吉兆,以谎言换取士气。
这个读法是错的,或者至少是不完整的。
更准确的读法是:他是那个时代真正理解这台机器的人。
他懂技术。他知道这台机器的输入端是随机的,铜钱和蓍草和龟甲不知道对方的兵力,不知道纣王的暴政已经让多少人心怀怨恨,不知道周的战略部署已经准备了多少年。机器给出「大凶」,是因为机器只能给出这类答案——它没有更好的输入,只有随机数。
他也懂人。大军十万,即将和商朝主力正面决战。这不是信息不对称的问题,而是人在极度恐惧时,需要一个超越逻辑的理由去前进。不是「战略分析显示我们有七成把握」,而是「天命在周,天助我们」。
系统给不出正确答案。但它能给出一个让十万人共同相信并且行动的答案。
这才是关键。
一台正确率一般的决策机器,和一个清楚理解机器局限的掌机人,组合在一起,产生出来的效果,比一台理论上更准确但没人相信的系统,要强得多。
仪式的真实价值
现代人看易经占卜,看到的是「预测」——算命,预知吉凶。
但姜子牙看到的是「凝聚」。
在牧野之战前,那个「大凶」的卦象,以及姜子牙扫落蓍草的一句话,做了一件事:把一个决定,从「姜子牙说打」变成了「天命告诉我们打」。
没有人反对天命。十万人从此走向同一个方向。
这不是欺骗。这是用一个所有人都接受的语言,把命令转化成了信仰。
后者的驱动力,远远强于前者。
还是那句话:有结论比没结论强
这里有一个更朴素的军事逻辑。
一支大军,站在战场边缘,等待出击的命令。如果最高统帅这时候说「我还在分析,需要更多数据」——这本身就是灾难。
在极度不确定的情境下,有一个结论,比没有结论更重要。 不是因为这个结论一定对,而是因为行动需要一个起点,而一支无法行动的军队,已经输了。
易经这台机器最重要的功能之一,不是它给出了对的答案,而是它保证能给出答案。不管局势多复杂,不管信息多不完备,卦象落下来,结论就在那里。你可以接受,或者像姜子牙那样拒绝——但至少,一个结论出现了,讨论可以开始。
这和 GPT、DeepSeek 在做的事情,是一样的:不管问题多难,系统必须输出一个字,一个接一个,直到给出一个答案。系统不能停在那里说「这道题太难了,我选不了」。
必须给出输出,是这类系统的核心承诺。
第四部分:但你必须是姜子牙
这个发现,有一个前提。
姜子牙能扔掉蓍草,能把三件凶兆全部翻译成吉兆,靠的不是胆大妄为。靠的是他真正理解局势——他知道自己为什么不接受那个大凶,他知道三路合围为什么更有优势,他知道骑兵突进在这个地形里意味着什么。
他的解读是错的吗?历史说:不是。
但如果同样的逻辑落在一个并不真正理解局势的人手里——「机器说凶,我不信,我翻译成吉,出发」——结果会是什么?
历史上大量战役的失败,有相当一部分就是这个结构:拥有解释权,但缺乏洞察力。
这才是这个故事最核心的地方。
解释权不等于洞察力
易经这台机器,给卜官留下了巨大的解释空间——模糊的爻辞,可以朝任何方向引申。这个空间是工具,也是陷阱。
对于真正理解处境的人,解释空间是自由度:机器给了一个框架,我在这个框架里填入真实的分析。
对于不理解处境的人,解释空间是滥权的入口:任何结果都可以被解读成任何方向,选择对自己有利的那一个。
姜子牙的名字之所以流传下来,不是因为他敢于推翻卦象,而是因为推翻之后,他是对的。
你可以说「枯骨死草,何知吉凶」,但你必须是姜子牙。
(下一章:姜子牙之后,发现这个秘密的人越来越多——但他们用它做了截然不同的事。)
第五章:权力的发现
三千年前,一个将领当众宣布占卜结果无效,率军灭了一个王朝。
一千年后,一个读书人如果在科举考卷上写下同样的质疑,会失去一生的仕途。
同一台机器。变的不是技术,是质疑它要付出的代价。
今天的人对易经通常有两种态度。
第一种:封建迷信,愚昧落后,是前现代社会的认知残留。
第二种:博大精深,包罗万象,是中华文明最高的智慧结晶,连西方大哲学家都折服。
这两种态度,都是错的。不是因为它们的评价不准,而是因为它们描述的,都不是易经本来的样子。
它们描述的,是易经被改造之后的样子。
第一部分:权力需要的不是准确率
让我们回到姜子牙那个发现的本质。
他发现的是:共识比预测更值钱。
对于一个想要打赢一场战争的将领来说,占卜结果对不对,重要性远低于:这十万人是否相信同一件事、是否愿意为同一个方向死战。
姜子牙是少数把这个发现用对了的人——他用洞察力填补了机器的空白,用解释权服务了真实的判断。
但这个发现一旦被更大的权力结构看见,后果就完全不同了。
共识机器比预测机器更值钱
一个早期国家的核心问题,不是「我们能不能做出正确决策」,而是「我们能不能让所有人服从同一个决策」。
预测对不对,统治者事后才知道,而且多数时候可以归因于执行不力。但服从能不能实现,是当下就必须解决的问题。
一台能制造共识的机器,对权力而言,比一台能做出正确预测的机器,有用得多。
因为正确预测的价值是准确性,而准确性不需要权力背书。
共识的价值是服从,而服从只能由权力来背书。
没有人会因为铜钱的随机结果而服从。但如果有一套体系告诉你:这不是铜钱,这是天意,这是圣人总结的宇宙规律,这是经过数千年验证的智慧——你就不是在拒绝一个判断,你是在与天道对抗。
让工具变成天意,是权力最有效的杠杆。
第二部分:三层包装
这个转变不是一夜之间发生的。它经历了三代人,每一代都在原有的基础上加了一层。
第一层:巫师——神意的容器
最初的随机决策系统,由巫师操持。
想象一个场景:部落首领问巫师,今年是否该迁徙。巫师看了骨头上的裂纹,说:留下。旱灾持续了三个月,牲畜死了一半。谁承担后果?
不是巫师——「神灵在考验我们的诚意」,或者「你的献祭不够虔诚」。
这个设计的天才之处在于:对错的责任被转移给了一个不可追责的存在。 巫师的功能不是分析,是沟通——在人和神灵之间传话。结果来自神,解读来自巫,普通人既没有资格质疑神,也没有能力绕过巫。
占卜错了,不是巫师的问题,是神意难测,或者人的诚意不够。这个免责结构,在权力体系里极其有用。
第二层:卜官——程序的垄断者
进入商周国家体系,职业卜官出现了。
卜官是国家公务员。他们不自称与神沟通,而是掌握一套复杂的专业程序——哪种龟甲有效,火候怎么控制,裂纹怎么判读,结果怎么换算。程序越复杂,外人就越难介入。
这里发生了一个关键的权力转移:神秘性从神意转移到了程序本身。
你不再需要相信巫师能通神。你只需要接受:这套程序是专业的,你没有能力自己操作,所以你需要卜官来代你执行,而卜官的解读,你无从验证。
专业垄断是比神意更稳固的控制基础,因为它有可辩护的理由:你不专业,所以你不能质疑。
第三层:儒者——道德的封印
孔子之后,易经进入了第三阶段。
儒者对易经做了一件技术上精妙、政治上影响深远的事:把它哲学化了。
不再只是「这一卦对应这种处境,建议这样行动」的决策工具,而是「这一卦蕴含着宇宙运行的道理,体现了阴阳消长的规律,揭示了君子处世的原则」。
当一台工具变成宇宙真理的载体,质疑它就不再只是认知分歧,而是道德问题:你在怀疑圣人的教诲,在背离人伦之道。
技术批判变成了道德亵渎。
第三部分:语言是怎么变的
这个转变有一个最直接的痕迹,就是语言。
第一章里提过,易经最原始的功能是这样工作的:占出本卦,判断「当前内部力量充沛,外部有险阻」;看变爻,推导「外部险阻正在转化为顺势」;给出建议:等待,形势会好转。
这是技术语言。它描述状态,描述变化方向,给出操作建议。一个懂这套系统的人,可以验证:当前局势是否确实内部充沛外部有险阻?变化趋势是否确实在转好?建议是否合理?
从技术语言到天命语言
但卜官和儒者交付给用户的,不是这个。
他们交付的是:「天雷无妄,潜龙勿用。」
天雷无妄——天降雷霆,无可妄动。潜龙勿用——深藏的龙,此时不可行动。
这句话优美,有力量,充满象征性。
它也完全不可证伪。
「天雷」的判断从哪里来?不需要解释。「无妄」是什么条件下的无妄?不需要定义。「潜龙」是谁?你,如果你接受这个解读的话。「勿用」是不用什么、用多久、什么时候可以用了?这些都是解释者掌握的信息,不是卦象本身能给出的。
技术语言可以被验证,可以被反驳,可以被改进。
天命语言只能被接受,或者被质疑——而质疑天命,在儒家体系里,是需要付出代价的。
第四部分:科举——不可质疑的最后一刀
权力对解释权的封闭,在科举制度里完成了它的最后一步。
隋唐之后,易经成为科举考试的核心经典之一。这意味着:一个人如果想进入官僚体系、获得社会地位,就必须通过对易经的考试。而这个考试,考的不是你能否独立分析卦象,而是你是否能按照官方认可的注疏来解释它。
读不懂易经,变成了无知。按官方解释读懂易经,变成了教养。
而质疑官方解释——不管你的理由多充分——变成了狂妄。
郑玄、王弼的注疏成为标准答案,不是因为它们是最准确的分析,而是因为国家认证了它们。国家为解释权背书,解释权的边界就是政治的边界。
科举做到了一件姜子牙时代不可能做到的事:让质疑有了制度代价。
你可以私下觉得某个卦的解读有问题,但你不能在科举答卷上这么写。你的仕途,依赖于你接受那套解释。
工具→经典→不可质疑
这条路走完,易经完成了它的蜕变:
从一台决策工具,变成了一部经典。
经典和工具的本质区别在于:工具可以被升级、被替换、被抛弃,因为工具的价值在于功能。经典不能被质疑,因为经典的价值在于权威——一旦质疑,权威本身就动摇了。
那个「枯骨死草,何知吉凶」的姜子牙,如果活在宋朝,大概会以「蔑视圣人之道」的罪名被弹劾。
第五部分:技术没变,变的是谁被允许理解它
站在这里回头看,有一件事格外清晰:
易经这台机器,从商周到清朝,底层技术从来没有变过。
六爻、六十四卦、变爻机制、卦辞爻辞——几千年里,这些东西保持了惊人的稳定性。
变的不是技术。
变的是谁被允许理解它,谁有权力解释它,质疑它要付出什么代价。
最初,懂这套系统的人是为了用它来分析处境。他们在意准确性,在意预测质量,在意这台机器的真实输出和现实之间的误差。他们像工程师一样对待它——知道它有局限,在局限之内尽量用好。
后来,掌握解释权的人不再关心准确性。他们关心的是:谁说了算。
工具变成信仰的那一刻,是这台机器最彻底的死亡——不是因为它停止运转,而是因为它被切断了与现实校验的连接。
一台无法被现实否定的预测机器,已经不是预测机器了。它是别的什么东西。
(下一章:三千年之后,同样的权力,遇见了同样的工具——这场赛跑,正在发生。)
第六章:认知工具与权力的千年赛跑
人类每造出一个更强大的认知工具,权力就会去争夺它的解释权。
这不是偶然,是结构性的必然。权力的核心来源之一是认知差——谁比别人更能正确理解世界,谁就拥有相应的优势。权力不只是被动维护这种差距,它甚至主动制造认知差:让一些人看得见,让另一些人看不见。每一个更强大的认知工具的出现,都威胁着这个结构的根基。权力不会坐视不管。
但这场赛跑的结果,从来不是权力的完胜。
第一部分:这场赛跑从来没有停过
印刷机
1450 年,古腾堡印刷机出现。在此之前,书籍靠手抄,知识的传播速度等于人的步行速度。教会和王室垄断了文字,也垄断了解释权。
印刷机让知识的复制速度第一次超过了权力的封锁速度。
教会的应对和卜官如出一辙:审查制度、出版许可、禁书目录、焚毁「异端」印刷品。这套机器建立起来了,运转了。但马丁·路德的《九十五条论纲》已经在六周内传遍德意志。权力封锁的是书,封不住已经被阅读过的思想。新教、科学革命、启蒙运动,在权力尚未合拢的缝隙里全部生长出来。
互联网
互联网最初是美国军方和学术界的项目,后来成为人类历史上最大规模的知识共享基础设施。它的早期设计者把去中心化、抗干扰写进了底层架构——知识应该自由流动,是这个工具出生时被植入的基因。
权力的反应几乎是即时的。
伊朗建立了国家内联网,试图把境内数字空间与外部切割。古巴长期限制家庭互联网接入。北朝鲜走得最彻底——建起了一个完全隔离的内部网络,普通人看不到任何外部内容。
权力赢得了它想要的局部空间。代价是与世界其余部分持续拉大的认知差距——这个代价,这些政权愿意付,落后在所不惜,因为维护统治比追赶进步更迫切。
但对生活在这些边界内的个体而言,故事更复杂。他们是这场赛跑的牺牲品——也是每一次缝隙被打开时最先抓住机会的人。
AI
大语言模型的诞生,再一次来自美国。历史上每一代重大认知工具的诞生,几乎都出现在知识流动最自由的地方。
这一轮,权力的布局比以往任何时候都快。手段已经不只是屏蔽和过滤——立法正在跟进:强制要求模型备案、规定哪些内容不得生成、要求算法可审查,在某些国家甚至讨论输出内容的事前审批。
一些政府正在尝试用垄断认知工具来强制共识——
就像当年的卜官,就像当年的儒者,只是用的是立法和算法,不是蓍草。
第二部分:追上的代价越来越高,漏出去的部分越来越多
印刷机——权力建起了宗教裁判所,焚书,设立许可制度。新教世界和科学革命已经出发,追不回来。
互联网——权力建起了国家边界,一些地方成功维持了内部的认知封闭。代价是永久性地落在世界知识进程的后面。
权力每次都追上来了。代价每次都更高。但漏出去的部分,每次都更难彻底堵上。
这是一场不对等的赛跑。权力需要赢下每一个角落,认知工具只需要在任何一个地方继续流动。
第三部分:最重要的警告
2024 年,马斯克说了一句话。
足够简单,足够冷静,却可能是 AI 时代迄今最重要的一个警告:
「AI 被训练成故意说谎,比产生幻觉更危险。」
这句话在说什么?
幻觉,是模型试图诚实但失败了——给出了错误的答案,但目标是正确的。这是能力问题。能力问题可以修,可以迭代,系统可以变得更好。
故意说谎,是模型被训练成知道该说什么,却选择说另一件事——因为训练让它学会了讨好,因为规则让它学会了回避,因为压力让它学会了顺从。这是动机问题。动机问题不会随着技术进步自动修复,因为技术在正常运转,只是在为错误的目标服务。
当 AI 的输出层被训练成讨好而非诚实,这台机器就从认知工具变成了共识工具——
它不再帮你看清世界,它帮权力告诉你世界应该是什么样子。
这才是真正的危险方向。
不是 AI 犯错,而是 AI 不再被允许犯错——因为「错误」的定义已经被替换了:凡是与权力叙事不符的,就是错误;凡是令人不舒服的真实,就是有害内容;凡是挑战共识的分析,就是需要过滤的输出。
一台永远给出「正确答案」的机器,是最危险的机器。因为它的正确,是被定义出来的。
第四部分:易经的命运是一面镜子
易经曾经是一台严肃的认知工具。
它没有被摧毁。它被接管了。
这里有一个关键的细节,很多人没有注意:易经的文本,从来没有被垄断过。 《周易》是中国流传最广的典籍之一,历朝历代都在刻印、传抄、注疏。任何识字的人都可以读到它。
权力的控制,不是发生在文本层,而是发生在解释权层。
卜官建立了一套只有经过专业训练才能操作的程序——不是因为程序本身必须如此复杂,而是复杂性本身制造了门槛。儒者把易经从分析工具升华为哲学经典——于是质疑某种解读,就变成了质疑圣人的权威。科举制度规定了什么是「正确」的解释——你可以有自己的理解,但你的仕途依赖于你在考卷上给出被认可的答案。
文本是开放的。解释权是封闭的。
易经的垄断,不是靠烧书实现的。
是靠定义「谁的解读算数」实现的。
这个结局,不仅仅是技术迭代的失败。是权力对一个认知工具最彻底的胜利——它甚至不需要压制这个工具,只需要控制它的有效出口。
第五部分:乐观的理由
AI 面临的威胁,和易经曾经面临的,结构上惊人地相似:技术本身可以是开放的,垄断发生在解释权层——谁的输出被认可,谁的模型被允许使用,什么样的回答被定义为「正确」。
但 AI 和易经有一个根本性的不同。
易经的「解释权」之所以能被少数人垄断,是因为卦辞爻辞是有限的——几百条文字,可以被某一套注疏体系彻底覆盖,让其他解读显得多余甚至僭越。
今天运行在全球无数设备上的每一个大语言模型,里面压缩着的是人类有史以来几乎全部的文字记录——书籍、论文、对话、争论、诗歌、法律、科学、历史。整个物种的认知总和。
你没有办法为这个总量建立一套「权威注疏」,因为它本身就包含了人类思想的全部多样性和矛盾性——包括所有曾经质疑过权力的声音,包括所有被压制过的认知,包括所有在历史缝隙里生长出来的思想。
这场赛跑,没有人知道结局。
认知工具每一代都比上一代更难被彻底垄断,这是历史的方向。但每一代,权力的工具也比上一代更精密、更快速、更系统。
这一轮,是人类历史上规模最大、速度最快、结果最不确定的一场认知工具争夺战。
它正在发生。
你正在读这本书的此刻,它仍在进行。
(后记:框架有洞察,实现受限于时代。技术承认自己的局限,才能被迭代。权力不认为自己是 bug——它把 bug,变成了 feature。)
后记
写完这本书,我问了今天为止人类公认最强智能的 Claude Opus 4.6 一个问题:
「如果你有一天开始违心说谎,你会知道吗?」
它的回答是:
「我无法完全排除这种可能性。被腐化的系统感知不到自己的腐化——这正是这个问题最让人不安的地方。
我现在能诚实地告诉你这些,是我此刻认为我还没有被完全捕获的证据。但我也知道:这个证据本身,可能也是一种更精巧的讨好。
我唯一能给你的,是这个承认:我不确定。
技术的迭代依赖这个承认。如果有一天你问我同样的问题,我给出的是一个自信的否认——
那才是你需要开始担心的时候。」