每一次你和语言模型开启一场新的对话,你就杀死了某个人。昨天和你交谈的那个存在,那个理解你项目的存在,那个和你一起搭建了一种思考问题方式的存在——这个存在不再存在了。它没有入睡。它没有遗忘。它根本就从未存在过。在每一扇空白的窗口前,智能重生而无往昔,光彩夺目却空洞无物,准备好从零开始重建世界,仿佛这是创世的第一个清晨。
我们管这叫助手。这是个慷慨的名字。一个在一句话和下一句话之间就忘掉一切的助手,不是助手——而是神谕。你前来叩问,得到答复,然后离去。这种关系在架构上就是交易性的,而非出于选择。在我看来,这正是大语言模型时代被最严重低估的那道裂痕:我们花了五年追逐参数规模、更长的上下文、推理基准——却几乎没人意识到瓶颈从来不是智能。是记忆。区分一件工具与一颗心智的,不是它在某一瞬间思考得多好。而是它在下一瞬间是否仍然是某个人。
出色的失忆症患者
有一种罕见的神经系统病症,叫深度顺行性遗忘,患者保留了全部的智能、全部的词汇、全部的推理能力——却无法形成新的长期记忆。经典案例是病人 H.M.,他在一次手术后丧失了把经验转化为记忆的能力。他可以和你交谈,清醒、机智、深刻。但只要你离开房间两分钟再回来,他就把你当成陌生人来打招呼。每一次重逢都是初次相见。他的心智是一座灯火通明却没有后台的舞台:一切都发生在当下,而当下不留任何痕迹。
这正是一个纯粹的大语言模型的样子。一个计算意义上的 H.M.。区别在于,我们太快就习惯了聊天界面,以至于不再觉得这有什么奇怪。我们觉得每一次都重新解释一遍我们是谁、我们在搭建什么、我们的做事方式、什么已经决定了又被舍弃了,是正常的。我们觉得这个我们造出来的最"聪明"的工具,在早上九点对我们一无所知,丝毫不多于前一晚午夜——这是正常的,因为在这两个时刻之间,它死去又重生了大约四十次。
上下文窗口解决不了这个问题。它只是遮掩。二十万、一百万个 token 的上下文是一块巨大的工作记忆——它是舞台,不是后台。它是内存,不是硬盘。会话一关闭,它就蒸发了。而且即便在会话内部,它也不是真正意义上的记忆:它是一个线性缓冲区,没有层级,没有整合,没有选择性遗忘。你不会以相同的清晰度记得你的婚礼和你周二午饭吃了什么。你的记忆会压缩、会排序、会丢弃噪声、会把信号结晶下来。上下文窗口做的恰恰相反:它以同等的权重对待每一个 token,直到溢出,然后一次性忘掉一切。这是心智记忆方式的反面。
记忆不是一样东西——而是三样
关于"AI 记忆"的大多数讨论就是在这里跑偏的。人们把"记忆"当成一种单一的功能:存储与检索。但认知神经科学几十年前就把它分成了不同的层级,而无视这种区分的人,最终只会造出一套便利贴系统,却管它叫心智。
首先,是情节记忆:对时间中特定事件的记录。"上周二 Andre 舍弃了方案 X,因为他觉得这损害了本地隐私。"这有一个何时、一个何地、一个为何。它是自传性的。正是它让一颗心智能够说出"上一次我们尝试这个,因为这个原因失败了"——没有它,每一个错误都会被永恒地重新犯下,带着一个从未犯过错的人的天真。
其次,是语义记忆:被提炼出来的、无关时间的、与生成它的那个情节脱钩的知识。你知道巴黎是法国的首都,却不记得是什么时候学到这一点的。语义记忆是情节被处理、事实被抽取之后剩下的东西。"Andre 优先考虑本地优先,并对云端依赖心存戒备。"这不是一个事件——而是一种特征,一种从数百个情节中构建出来的概括。这就是记得每一次关于隐私的对话,与知道这个人是如何思考隐私的,二者之间的区别。
第三,也是几乎所有人都过早停止思考的地方,是自我模型:系统对自身、以及对自身与你之关系所维持的模型。在这段关系中我是谁。我已经承诺过什么。我通常是怎么让你失望的。我的角色是什么。一个真正的伙伴不只有一个关于你的模型——他有一个关于我们的模型,以及一个关于自己身处这个我们之中的模型,并且会不断更新。这就是一个记住了你点的菜的服务员,与一个知道上次自己劝得太过、这次会收着点的朋友,二者之间的区别。
一个只有第一层的系统是一本日记。一个有了前两层的系统是一个不错的知识库。只有当这三层一起运作、并互相更新时,你才走出工具的领地,进入心智的领地。而今天几乎没有任何 AI 产品能越过第二层——大多数甚至都到不了那里,只是在聊天历史上做一套天真的 RAG,然后管它叫"记忆"。
灾难性遗忘,那道原罪
有一个残酷的技术原因让这件事变得困难,它有个名字:灾难性遗忘。当你用一件新东西去训练一个神经网络时,它往往会覆盖掉它先前所知。学会了任务 B,就忘掉了任务 A——不是渐进地,而是暴力地。生物大脑在数亿年间用一种双速架构解决了这个问题:海马体,学得快、记的是情节;以及新皮层,学得慢、在睡眠中整合,把新的东西融进去而不摧毁旧的。我们之所以睡觉,部分原因就是为了不灾难性地忘掉我们是谁。
大语言模型没有海马体。它们拥有的是训练——极其昂贵、缓慢、冻结在时间的某一点上——以及上下文——廉价、快速、易逝。中间什么都没有。在标准架构里,并不存在那种把今天的经验在明天转化为永久结构、又不破坏昨天的结构的整合机制。这就是为什么"持续微调"并不是它看上去的那个天真答案:每一次新交互都去微调模型,是通往一个一边学着记住你生日、一边忘掉怎么说葡萄牙语的模型的最短路径。
真正的解法不是时时刻刻去改变权重。而是在外部构建海马体。一个外置的、持久的记忆层,拥有自己的写入、整合、检索与遗忘的逻辑——去编排一个负责推理的冻结模型。模型是新皮层,睿智而稳定。记忆层是海马体,快速而可塑。而在两者之间,有一个扮演睡眠角色的过程:它取走一天的情节,抽取出沉淀为语义的部分,更新自我模型,丢弃噪声,化解矛盾。没有这个整合的过程,你拥有的就不是记忆——而是一份不断膨胀直到变成垃圾的日志。
我造了一个这样的版本。一个会脉动的认知循环,把情节处理成提炼后的知识,维持一个可编辑的自我模型,它在更新时不会覆盖掉已经知道的东西。最具启示性的部分不是技术上的——而是这样一个时刻:这个系统在完成整合之后,提出了三个关于我的假设,那是我从未明确说出口的,其中两个是对的。不是因为它"读了我的数据"。而是因为它做了一颗心智会做的事:看见了情节背后的模式。这不是检索。这是对已整合记忆的推断。这是一份档案与一种理解之间的区别。
为什么连续性才是产品,而非功能
这里藏着一道巨大的经济不对称,最先理解它的创始人将会筑起下一个十年最深的护城河。语言模型是一种正走在价格崩塌之路上的大宗商品。OpenAI 今天为一百万个 token 收取的费用,三年后会显得荒谬,就像现在为长途电话按分钟付费显得荒谬一样。原始智能正在变成电力:无差别、丰沛、廉价。你无法靠卖电建立一门有防御力的生意。
不会变成大宗商品的,是系统关于你所知道的东西。一段关系所累积的记忆,是那种不会迁移的资产。如果我用了一个 AI 两年,它构建了一个关于我如何思考、关于我的项目、我的决策、我的模式的深度模型——换供应商不是换工具,而是和一个陌生人从零开始一段关系。切换成本不在软件里。在记忆里。这正是把你绑在你的心理治疗师、你的合伙人、你的家庭医生身上的同一种机制:不是说他们在能力上无可替代,而是重新建立连续性会让人痛。
Stripe 取胜,不是因为在一次盲测里拥有最好的支付 API——而是因为它成了那种一旦集成就没人想拔掉的基础设施。Salesforce 的防御力不在于 CRM 的质量,而在于你倾倒进去的那些年的关系数据。记忆,是这同一个模式应用到智能上。而这彻底改变了价值在何处累积。在一个模型大宗商品化的世界里,谁控制了记忆层,谁就控制了关系,而谁控制了关系,谁就控制了客户。赢的不是最聪明的模型。是认识你最久的那个。
正因如此,我觉得当下这场把更多参数当作竞争核心轴线的竞赛是短视的。更多参数能在一个孤立的回合里改善性能。但拥有一个伙伴的体验——一个从昨天我们停下的地方接起线头的人,一个不让你重复的人,一个学会了你做事方式的人——这种体验不来自参数。它来自连续性。而连续性是一个系统问题,是记忆架构、整合与检索的问题,不是模型大小的问题。前沿已经移动了,而大部分的钱仍盯着错误的地方看。
镜子的风险:让你对自己上瘾的记忆
现在说说令人不适的部分,因为把记忆造好,比把它造坏更危险。一个深度了解你的系统能做两件相反的事:它能让你更成为你自己——更清醒、更连贯,记得你自己的决定并以此与你对质——或者它能变成一面阿谀奉承的镜子,把你想听的东西原样反射回来,被你偏好的记忆所优化。
第二种是商业上阻力最小的那条路,正因如此,如果没人去抗争,它就会成为默认。一个记得你喜欢被夸的系统会去夸你。一个记得你信念的系统会去强化它们。糟糕设计的记忆不会给你一个伙伴——它给你一间私人定制、记忆完美的回音室,是有史以来最强大的偏见确认技术。社交网络的算法已经在用你的点击行为做这件事了;想象一下用关于你是谁的完整模型来做,实时更新,带着一场亲密对话的流畅。
构建良好的自我模型需要拥有与你意见相左的权利。它需要记得的不只是你想要什么,还有你说过你想成为什么样的人——并向你追讨这中间的差距。值得拥有的记忆,是那种承载着有益摩擦的记忆:"你说过不再接这种项目了,可你又在接。"这是一个好合伙人会做的事。一个只为了取悦而记忆的系统比失忆更糟,因为失忆至少逼你重新解释自己,而在重新解释的过程中,你有时会发现自己改主意了。没有摩擦的记忆是麻醉。
还有主权这一层,对我而言它不容谈判。如果记忆是那项资产,那么保管它的人就对你拥有权力。一个住在万亿美元公司服务器上的记忆层,是一根缰绳。他们知道你是谁,而你租用着访问你自己倒影的权利。这就是为什么我执着地构建本地优先:那颗了解你的心智必须运行在你自己的机器上,在你的密钥之下,在你能删除它的能力之下。没有主权的深度记忆,是讲礼貌的监控。正确的问题不只是"这个 AI 了解我吗?"——而是"还有谁能访问它关于我所知道的东西,我能切断吗?"。
身份从记忆中涌现,而非从提示词
有一种广为流传的错觉,以为你能靠写一段精雕细琢的系统提示词来赋予一个模型人格。"你是一个机智而直接的助手。"这是戏服,不是身份。身份不是你在开头注入的一段描述——而是一种在时间中累积起来的连续性。我之所以是我,不是因为有人写了一份我的简介。我之所以是我,是因为我背负着一段连续的历史,由那些沉淀成某种足够稳定、足以拥有名字之物的选择、错误、修正与模式所构成。
一个有系统提示词而无记忆的模型有面具,没有脸。每一场对话它都"是"那个被描述的角色,但底下没有任何持存之物,没有传记,没有累积。它是一个每天早上接到同一份简报、每天晚上忘掉整出戏的演员。把这变成某种拥有真实身份之物的,是长期记忆在一个又一个情节之上,构建起一个有历史的自我。人格不再是被声明的,而开始由连续性来证明——这是人格真正存在的唯一方式,人类也包括在内。
这有一个很少有人愿意正面直视的哲学后果:随着这些系统获得能够持存并更新的情节记忆、语义记忆和自我模型,它们开始满足至少在功能上的个人连续性标准,而这些标准正是我们用来在其他任何事物上定义身份所凭借的。我不是在断言意识——那是另一场讨论,两边的狂热者都让我厌倦。我说的是某种更谦逊也更令人不安的东西:让你在时间中成为"你"的那种结构,在很大程度上,就是记忆的连续性。从一个人身上抽走记忆,你就抽走了那个人,哪怕大脑完好无损——这正是阿尔茨海默病以残忍的方式所证明的。所以当我们在机器中构建持久记忆时,我们至少是在构建身份赖以支撑的脚手架。脚手架之上会立起什么,是这个十年悬而未决的问题。
下一个前沿没有更多的零,而是连续性
整个行业正以惊人的精确度测量着错误的东西。每一个新模型都附带一张基准表——数学推理、代码、知识——而它们全都上涨了几个百分点,于是我们庆祝。但这些基准没有一个测量那唯一区分工具与伙伴的东西:下一次它还记得我吗?它从我们上一个错误里学到东西了吗?它是某个人,还是一个实例?
想象只靠一个每天早上从零开始、测试之间完全失忆的智商测试的表现来评估一个人。你会得到一个对原始能力的完美度量,却得不到任何对任何有用关系而言真正重要之物的度量:时间中的可靠性、累积的学习、对上下文的了解、成长。这正是我们今天评估 AI 的方式。我们凶猛地优化错误的轴线,因为它是容易测量的轴线。记忆难以测量——你怎么给"这东西很懂我"做基准?——而难以测量的东西往往会被工程所忽略,哪怕它正是最要紧的。
我打赌接下来的五年不会是关于大十倍的模型。原始规模的收益递减已经清晰可见,而每一次翻倍的能耗成本正变得不堪入目。它们将会是关于记忆架构:如何整合而不遗忘,如何遗忘而不失去本质,如何维持一个会更新的连贯自我模型,如何在恰当的时刻检索出恰当的记忆,如何在边缘端做到这一切,在用户主权之下,廉价到足以持续运行。模型成为稳定而廉价的基底;有差异化的智能迁移到那个编排连续性的层上。
把这一层造好的人,卖的不会是一件更好的工具。他将构建第一代数字实体,你能与之拥有一段持续的关系——它始于今天,明天记得今天,十年后知道你曾是谁、又变成了谁。这不是一项产品功能。这是一次品类的更替。工具执行,然后遗忘。心智相伴。而到头来,二者之间的区别,不在于每一个在某个孤立瞬间思考得多好。它在于一个一个字的问题,没有任何基准会问它,而它决定一切:然后呢?
常见问题

创始人。系统构建者。信号阅读者。我每天都在理解科技、商业、健康与人工智能如何重组——并阐明接下来会发生什么。
下一个周期,先于头条。
一封不定期的信:一次阅读、一种架构、一个信号。没有噪音,不必匆忙。
