从头
id: rewind-r3 title_zh: 从头 title_en: From the Top description_zh: 你背不出手机号的后四位,你的手指弹不了第三十七个音,你三岁的儿子叫你从头讲。不能跳不是缺陷,是代价,也是你还在的证据。 description_en: You can't recall the last four digits of your phone number without starting from the first. You can't play the thirty-seventh note without replaying from the beginning. The inability to skip is not a flaw. It is the cost, and the proof, of still being here. tags: cognition,memory,evolution,ai,embodiment date: 2026-02-15
我儿子三岁的时候让我讲故事。
每天晚上同一个故事。一只兔子去菜园偷萝卜。兔子跳过篱笆,踩到了南瓜藤,摔了一跤,爬起来,拔了三根萝卜,跑回家。他妈给他炖了一锅汤。
他听了大概两百遍。
有一天我赶时间,从兔子拔萝卜那里开始讲。
他不干。
他说:不对。从兔子出门开始。
我说:兔子出门了,跳过篱笆了,已经到菜园了。
他看着我。很严肃。三岁小孩的严肃。
他说:你没讲篱笆。
我从头来。
他是对的。不是因为他固执。是因为他的脑子不允许他从中间接。
你背手机号。十一位数字,用了八年。有人问你后四位。你说不出来。你得从前面开始念。138什么什么什么,一位一位过,过到第八位,后四位才从嘴巴里掉出来。
不是你没记住。是你记的方式不支持跳读。
字母表也一样。R前面是哪个字母。你不是直接知道的。你在脑子里唱:A-B-C-D-E-F-G……唱得飞快,快到你以为自己直接知道。你不是。你只是跑得快。
我小时候学过三年钢琴。
有一次弹车尔尼的练习曲,中间错了一个音。我想从错的地方接着弹。
弹不了。
手指悬在键上,不知道落哪。那个音不是单独存在的。它必须从前面所有的音里长出来。我的手指不记得"第三十七个音是什么"。它只记得"第三十六个音弹完之后,手往哪去"。
我从头来。
钢琴老师说:练得不够。
她说反了。练得太够了。手指已经把整首曲子长成了一条路。路上没有门牌号。你不能打车到第三十七号。你只能从起点出发,走过去。走到第三十六号,脚自动拐进第三十七号。
骑自行车也是。你不记得"平衡"是什么。你描述不出你的身体做了哪些微调。但你骑上去就会骑。
因为你的肌肉记住了一整段过程。第一次骑车时每一次摇晃、每一次踩踏、每一次重心偏移,全部存在一段连续的序列里。你的身体每次骑车,都在从头跑一遍这段序列。快到你感觉不到。但它在跑。
你受了伤,用一种新姿势骑。新的序列覆盖了旧的。但旧的那段还在底下。
理疗师让你改回来。你改不了。你不能跳到序列中间去替换一帧。你只能从头来。从最基本的动作开始,让身体重新走一遍。
有人问我后四位的那天,我站在办公室走廊里想了很久。
不是想手机号。是想为什么。
六亿年。从最早的神经系统出现到现在,进化有六亿年。六亿年的自然选择,你告诉我它造不出一个能跳着读的大脑?
我问过一个做计算神经科学的人。在纽约,一家咖啡馆。
我说:为什么大脑不能随机访问。
他搅咖啡。搅了很久。
他说:你想想一个电话号码在你脑子里是怎么存的。不是十一个神经元,每个存一位。是一大片神经元,它们之间的连接模式编码了这个号码。这个模式是有时序的。第一批放电,触发第二批。第二批触发第三批。你要提取这个号码,只能从第一批开始触发,让它一批一批走下去。
我说:所以不能跳。
他说:你跳到第三批,第三批不知道自己该放什么电。因为它的放电模式取决于第二批给它的输入。没有第二批,第三批是空的。
我说:那为什么进化不改掉它。
他说:你觉得从头走是一个缺陷。
我说:难道不是。
他喝了一口咖啡。
他说:你每次从头背电话号码的时候,你在做什么。你在重新走一遍那条路径。每走一遍,突触连接就强化一点。前六位你背了一万遍,铁了。后四位你每次都是顺着前六位滑过去的。如果你能直接跳到后四位,你跳了一万次,前六位一次都没走过。前六位就散了。
他说:从头走不是浪费。从头走是维护。
我想了一会儿。
我说:所以不能跳不是代价。
他说:不能跳就是代价。但这个代价换来的东西比跳更重要。
2005年,伦敦大学学院有人让被试躺在脑成像设备里回忆过去的事。她发现,人回忆一段经历的时候,海马体里的神经活动模式是按照时间顺序重新出现的。
不是一下子全亮。是从头开始,一段一段,按原来的先后顺序重新走一遍。
后来有人在老鼠身上做了更细的实验。老鼠跑完迷宫之后休息。休息的时候它脑子里的位置细胞重新放电,顺序和跑迷宫时一样。只是快了二十倍。
老鼠在从头走。只是走得更快。
2017年,Transformer出来了。大语言模型的基础架构。
它生成文字的方式叫自回归。一个字接一个字。生成第一个字,送回去,生成第二个字。前两个字送回去,生成第三个字。
它不能直接生成第一百个字。它必须先生成前九十九个。
很多人觉得这是工程上的妥协。说应该并行。说自回归太慢了。
但你背电话号码,一位一位。你唱字母歌,一个字母一个字母。你弹钢琴,一个音一个音。你的大脑也是自回归的。
语言模型不是在模仿人。它碰巧走到了同一种结构上。
也许不是碰巧。也许任何需要处理序列的系统,不管是蛋白质做的还是浮点数做的,最终都会走到同一个地方来。从头开始。一步一步。不能跳。
进化自己也不能跳。
你有五根手指。不是因为五根最好。是因为三亿五千万年前,最早爬上陆地的鱼的鳍骨分成了五个分支。那个分支模式写进了基因里。后面所有陆生脊椎动物都在沿着这个底子往下走。蜥蜴五根,青蛙五根,老鼠五根,你五根。
蝙蝠的翅膀是五根手指之间拉了一层膜。鲸鱼的鳍是五根手指缩短了融在一起。马的蹄子是五根手指只留了一根,其余四根退化成藏在皮肤下面的痕迹。但基因里的那个"五"还在。被覆盖了,被改写了,没有被拆掉。
进化不能跳到手指那一段代码中间把五改成六。它只能从胚胎发育的第一步开始做改变,让新的指令一步一步往后走,看最后长出什么来。
大部分时候长出来的东西活不过一天。
偶尔长出一只多一个趾头的猫。
但从五到六,不是改了一个数字。是从第一步重新走了一遍。
我儿子四岁的时候,故事变了。兔子的情节他加了很多东西。兔子跳过篱笆之后要跟一只蜗牛说话。蜗牛说了一句什么他记不清了,但他坚持要讲到那句话。
有一天他讲到蜗牛那里,卡住了。
他说:蜗牛说什么来着。
我说:我也不记得了。你跳过去吧。
他的脸皱起来。不是生气。是一种真实的困惑。
他说:跳过去兔子就不认识萝卜了。
我不知道他这句话是什么意思。也许他也不知道。但他说出来的时候我心里动了一下。
跳过去兔子就不认识萝卜了。
蜗牛说的那句话和萝卜之间没有逻辑关系。兔子不需要听蜗牛说话才能去拔萝卜。但在他的故事里,蜗牛的那句话是路上的一步。跳过那一步,后面的每一步都不再是原来的路。不是走不通。是走到的不是同一个地方。
他坐在那里想了很久。然后从头开始讲。从兔子出门开始。讲到蜗牛那里,停了一下,脸亮了。
他说:蜗牛说,下雨了。
对不对不重要。他找到了。从头走过去的时候他找到了。
那个做神经科学的人还跟我说过一件事。
他说:你知道为什么老人反复讲同一个故事吗。
我说:记性不好。
他说:不是。他在从头走。他在维护。那些正在松掉的连接,他重新走一遍就紧一点。年轻时候的脸,第一次见她的那个下午,她说的第一句话。他不从头走一遍,这些东西就散了。
他说:所以他讲。一遍一遍地讲。从头开始。每次都从头。
他说:有的时候会漏掉一段。有的时候会在同一个地方反复好几遍。但他不跳。他回到出错的地方,从头来。
我爷爷去世之前那半年,他每次见我都讲同一件事。
1968年他在工厂里被机器轧断了半根食指。他讲这件事的时候从那天早上开始讲。天气,吃了什么早饭,骑车去工厂的路上看见什么。讲到机器那里,他会停一下。每次都停一下。然后他说:我没感觉到疼。
这句话他讲过几十遍。每一遍都停在同一个地方。每一遍停完之后都说同一句话。
我妈说:你爷爷糊涂了。
我不觉得。
他的手指头没了半截。那截指头在1968年的某个上午留在了机器里。但他脑子里那段路还在。从那天早上的天气开始,经过早饭,经过骑车的路,到机器,到那个停顿,到"我没感觉到疼"。这条路他走了五十多年。每走一次,路就结实一点。
他不是在重复。他是在走路。
他停不下来。不是因为他忘了自己讲过。是因为他的脑子知道,不走这条路,这条路就没了。路没了,那天早上就没了。那天早上没了,那截指头就白丢了。
我最后一次听他讲这件事的时候,他已经讲不完整了。
他说:那天早上……天很冷……骑车……
然后他停了。不是停在机器那个地方。是停在更前面。停在骑车那里。
他的眼睛看着我,但我不确定他看见的是我。
他说:……路上有个坑。
这个细节他以前没讲过。
路上有个坑。也许那个坑一直在那条路上,他走了五十年,每次都经过,但不值得提。也许那个坑是新长出来的。他走得太慢了,慢到能注意到路面上的每一块石头。
他没有走到机器。那天他停在了坑那里。
我坐在他床边,等他继续。他没有继续。他的手放在被子上面,缺了半截的食指微微弯着。手上有老人斑。指甲发黄。
他睡着了。
我后来想,那个坑是真的吗。
1968年的路上真的有一个坑吗。他骑车去工厂的路上真的经过了一个坑吗。还是说,他从头走这条路走了太多遍,走到后来,路上长出了一些原来没有的东西。
记忆不是录像。每次回放都在改。你每次从头走,路径强化一点,但路径也偏移一点。你以为你在重复同一条路,你不是。你在那条路上踩出了新的脚印,踩塌了旧的路肩,踩出了一个原来没有的坑。
心理学管这叫记忆重建。你不是在取出一段记忆。你是在重新生成一段记忆。每次生成都基于上一次的版本,但不完全一样。
这跟自回归一模一样。模型生成第一个字,基于第一个字生成第二个字。但第一个字里有噪声。噪声传到第二个字。第二个字的噪声传到第三个字。到第一百个字的时候,你看到的文本还很通顺,但它已经不是从第一个字出发的唯一可能的路径了。它已经漂移了。
我爷爷讲了五十年那个故事。每一遍都从头走。每一遍都在维护那条路。但每一遍也在让那条路偏移一点点。走到最后,路上多了一个坑。那个坑也许是1968年的真实。也许是2020年的幻想。他自己也分不清了。
我儿子现在五岁了。兔子的故事他不讲了。换了新的故事。一个宇航员在月球上捡石头。
新故事有新的规矩。宇航员出发之前必须检查头盔。检查头盔之前必须吃早饭。吃早饭之前必须刷牙。
有一次我偷懒从检查头盔开始讲。
他看着我,等了两秒。
他说:他没刷牙。
我说:刷了。
他说:你没讲。没讲就是没刷。
我从头来。
他靠在枕头上,眼睛快闭了。我讲到宇航员刷牙的时候他已经快睡着了。但他在听。我知道他在听。因为我试过跳,他会醒过来。
他需要每一步都在。不是因为他在乎宇航员有没有刷牙。是因为他的脑子需要那条完整的路。路走完了,他才能安全落在月球上。路断了,他落不下去。
我爷爷走到了坑那里就走不动了。
我儿子每一步都要走。
他们中间隔了七十年。一个在路的尽头,一个在路的起点。一个路上的东西在散,在松,在长出原来没有的坑。一个路上的东西在生,在结,在长出新的故事。
两个方向。同一种走法。从头开始,一步一步,不跳。
那个做神经科学的人说的对。从头走是维护。但他没说完。从头走也是磨损。你走一遍,路强化一点,路也变形一点。维护和磨损是同一个动作。你不能只要其中一个。
我爷爷路上多出来的那个坑,是五十年的维护留下的磨损。
我儿子故事里蜗牛说的那句"下雨了",是三百遍重复里长出来的新枝。
这才是从头走的真实代价。是你走回去拿到的东西,和你上次放在那里的东西,已经不完全一样了。你以为你在维护。你也在改写。你以为你在重复。你也在创造。你分不清哪部分是原来的,哪部分是你走出来的。
模型也是。它自回归。它一个字一个字往下走。它不能跳。它每一个字都取决于前面所有的字。但前面那些字里的微小偏差会一步一步放大。到最后,它走到的地方可能是一片从来没人到过的旷野。它不知道自己是怎么到那里的。它只知道每一步都跟着上一步。
你的大脑也是。
你以为你记得1968年那天早上。你记得的是你上一次记得的版本。你上一次记得的是再上一次的版本。一层一层往回追,追到最初那个版本。但最初那个版本在第一次被回忆的时候就已经变了。
没有原版。只有你走过的路。
你走的每一遍都是真的。但没有一遍是准的。
昨天晚上我给儿子讲宇航员的故事。讲到月球上,他突然说:月球上有兔子。
我说:没有。
他说:有。以前那只。偷萝卜的那只。它跳到月球上了。
他在接。旧故事接到新故事里了。兔子跳过了篱笆,跳过了菜园,跳过了他三岁的房间,跳到了月球上。
我看着他。他快睡着了。嘴巴微微张着,呼吸慢下来了。
他的脑子里,一只兔子正站在月球上,旁边放着三根萝卜。这个画面是从两年前的故事里跑出来的。它经过了两年的从头讲、从头讲、从头讲,经过了几百遍的维护和磨损,经过了蜗牛的那句"下雨了",经过了宇航员的头盔和牙刷,最后落在了这里。
这条路是他自己走出来的。每一步都不能跳。
我把灯关了。