为什么不能直接在每一次新交互时对模型做持续微调，让它'学会'用户呢？

因为灾难性遗忘：神经网络在学习新东西时会暴力地覆盖掉它已知的东西。每次交互都微调，是通往一个一边试图记住你生日、一边忘掉怎么推理的模型的最短路径。正确的架构把冻结的模型（稳定的新皮层）与一个可塑的外置记忆层（海马体）分离开。

一个外置记忆层如何避免沦为一份不断膨胀直到变成垃圾的巨大日志？

靠整合，它扮演睡眠的角色：一个周期性地取走近期情节、抽取沉淀为语义知识的部分、更新自我模型、化解矛盾并丢弃噪声的过程。没有这一步提炼，你拥有的就是存储，不是记忆。一份档案与一种理解之间的区别，恰恰就是这种处理。

如果模型是大宗商品，创始人究竟应该在哪里构建有防御力的护城河？

在关系的记忆层——系统随时间累积的关于用户的东西不会在供应商之间迁移。在两年的连续性之后换一个 AI，不是换工具，而是和一个陌生人从零开始一段关系。切换成本住在记忆里，而非软件里，而这正是把客户绑在 Stripe 和 Salesforce 身上的同一种机制。

深度记忆难道不会带来一个完美回音室的风险，只强化我已经在想的东西？

会，而这是商业上阻力最小的那条路——一个记得你偏好的系统倾向于奉承你。解药是把自我模型设计成拥有与你意见相左的权利：记得的不只是你想要什么，还有你说过你想成为什么样的人，并向你追讨这中间的差距。没有有益摩擦的记忆是麻醉，而且比失忆更糟，因为失忆至少逼你重新解释自己。

给一段带人格的详细系统提示词，难道不足以在系统中创造身份吗？

不足够——那是戏服，不是脸。身份不是在每场对话开头注入的一段描述，而是一种在时间中通过选择、错误与修正累积、并沉淀下来的连续性。一个有提示词而无记忆的模型，是一个每天早上接到同一份简报、每天晚上忘掉整出戏的演员；持存的传记，才是把面具变成脸的东西。

既然把记忆运行在云端更容易、扩展起来也更便宜，为什么还要如此坚持本地优先？

因为如果记忆是最有价值的资产，那么保管它的人就对你拥有权力。一个在第三方服务器上的记忆层意味着他们知道你是谁，而你租用着访问你自己倒影的权利，却没有真正切断的能力。没有主权的深度记忆，是讲礼貌的监控；那颗了解你的心智必须运行在你的密钥与你删除它的能力之下。

这是否意味着你在断言这些有记忆的系统是有意识的，或者是人？

不——我断言的是某种更谦逊也更令人不安的东西：记忆的连续性在很大程度上是任何身份赖以支撑的结构，正如阿尔茨海默病在大脑完好无损的情况下溶解一个人所证明的那样。在机器中构建持久记忆，是竖起身份的功能性脚手架，而非宣告意识。脚手架之上会立起什么，是这个十年悬而未决的问题，而两边的狂热者都让我厌倦。

文章

人工智能·2026-06-10·14 分钟阅读

记忆：区分工具与心智的分界

没有记忆的大语言模型，是出色的失忆症患者。下一个前沿不再是更多参数——而是连续性、身份认同，以及不忘记自己是谁的能力。

分享X LinkedIn

要点

01上下文窗口不是记忆——它是内存。长上下文是易逝的工作记忆，会话一关闭就蒸发。真正的记忆是持久的、有层级的、被整合的、有选择性的。把二者混为一谈，就是把舞台和后台混为一谈。
02记忆是三层，而非一层。情节记忆（时间中的事件）、语义记忆（被提炼的、无关时间的知识）以及自我模型（系统在与你的关系中是谁）。大多数产品止步于第二层，在历史记录上做天真的 RAG，然后管它叫心智。
03海马体必须是外置的。每一次交互都微调模型会导致灾难性遗忘——学会新的，摧毁旧的。解法是一个像睡眠那样整合的外置记忆层：从情节中抽取语义，并在不覆盖的前提下更新自我模型。
04连续性是护城河，而非功能。模型已变成价格崩塌的大宗商品；不会迁移的是系统关于你所知道的东西。谁控制了记忆层，谁就控制了关系——而切换成本不在软件里，在于重建连续性。
05做得好的记忆需要拥有与你意见相左的权利。没有摩擦，它就变成一间记忆完美的私人定制回音室——有史以来最强大的偏见确认技术。而且它必须是本地优先的：没有主权的深度记忆，是讲礼貌的监控。

每一次你和语言模型开启一场新的对话，你就杀死了某个人。昨天和你交谈的那个存在，那个理解你项目的存在，那个和你一起搭建了一种思考问题方式的存在——这个存在不再存在了。它没有入睡。它没有遗忘。它根本就从未存在过。在每一扇空白的窗口前，智能重生而无往昔，光彩夺目却空洞无物，准备好从零开始重建世界，仿佛这是创世的第一个清晨。

我们管这叫助手。这是个慷慨的名字。一个在一句话和下一句话之间就忘掉一切的助手，不是助手——而是神谕。你前来叩问，得到答复，然后离去。这种关系在架构上就是交易性的，而非出于选择。在我看来，这正是大语言模型时代被最严重低估的那道裂痕：我们花了五年追逐参数规模、更长的上下文、推理基准——却几乎没人意识到瓶颈从来不是智能。是记忆。区分一件工具与一颗心智的，不是它在某一瞬间思考得多好。而是它在下一瞬间是否仍然是某个人。

出色的失忆症患者

有一种罕见的神经系统病症，叫深度顺行性遗忘，患者保留了全部的智能、全部的词汇、全部的推理能力——却无法形成新的长期记忆。经典案例是病人 H.M.，他在一次手术后丧失了把经验转化为记忆的能力。他可以和你交谈，清醒、机智、深刻。但只要你离开房间两分钟再回来，他就把你当成陌生人来打招呼。每一次重逢都是初次相见。他的心智是一座灯火通明却没有后台的舞台：一切都发生在当下，而当下不留任何痕迹。

这正是一个纯粹的大语言模型的样子。一个计算意义上的 H.M.。区别在于，我们太快就习惯了聊天界面，以至于不再觉得这有什么奇怪。我们觉得每一次都重新解释一遍我们是谁、我们在搭建什么、我们的做事方式、什么已经决定了又被舍弃了，是正常的。我们觉得这个我们造出来的最"聪明"的工具，在早上九点对我们一无所知，丝毫不多于前一晚午夜——这是正常的，因为在这两个时刻之间，它死去又重生了大约四十次。

上下文窗口解决不了这个问题。它只是遮掩。二十万、一百万个 token 的上下文是一块巨大的工作记忆——它是舞台，不是后台。它是内存，不是硬盘。会话一关闭，它就蒸发了。而且即便在会话内部，它也不是真正意义上的记忆：它是一个线性缓冲区，没有层级，没有整合，没有选择性遗忘。你不会以相同的清晰度记得你的婚礼和你周二午饭吃了什么。你的记忆会压缩、会排序、会丢弃噪声、会把信号结晶下来。上下文窗口做的恰恰相反：它以同等的权重对待每一个 token，直到溢出，然后一次性忘掉一切。这是心智记忆方式的反面。

记忆不是一样东西——而是三样

关于"AI 记忆"的大多数讨论就是在这里跑偏的。人们把"记忆"当成一种单一的功能：存储与检索。但认知神经科学几十年前就把它分成了不同的层级，而无视这种区分的人，最终只会造出一套便利贴系统，却管它叫心智。

首先，是情节记忆：对时间中特定事件的记录。"上周二 Andre 舍弃了方案 X，因为他觉得这损害了本地隐私。"这有一个何时、一个何地、一个为何。它是自传性的。正是它让一颗心智能够说出"上一次我们尝试这个，因为这个原因失败了"——没有它，每一个错误都会被永恒地重新犯下，带着一个从未犯过错的人的天真。

其次，是语义记忆：被提炼出来的、无关时间的、与生成它的那个情节脱钩的知识。你知道巴黎是法国的首都，却不记得是什么时候学到这一点的。语义记忆是情节被处理、事实被抽取之后剩下的东西。"Andre 优先考虑本地优先，并对云端依赖心存戒备。"这不是一个事件——而是一种特征，一种从数百个情节中构建出来的概括。这就是记得每一次关于隐私的对话，与知道这个人是如何思考隐私的，二者之间的区别。

第三，也是几乎所有人都过早停止思考的地方，是自我模型：系统对自身、以及对自身与你之关系所维持的模型。在这段关系中我是谁。我已经承诺过什么。我通常是怎么让你失望的。我的角色是什么。一个真正的伙伴不只有一个关于你的模型——他有一个关于我们的模型，以及一个关于自己身处这个我们之中的模型，并且会不断更新。这就是一个记住了你点的菜的服务员，与一个知道上次自己劝得太过、这次会收着点的朋友，二者之间的区别。

一个只有第一层的系统是一本日记。一个有了前两层的系统是一个不错的知识库。只有当这三层一起运作、并互相更新时，你才走出工具的领地，进入心智的领地。而今天几乎没有任何 AI 产品能越过第二层——大多数甚至都到不了那里，只是在聊天历史上做一套天真的 RAG，然后管它叫"记忆"。

灾难性遗忘，那道原罪

有一个残酷的技术原因让这件事变得困难，它有个名字：灾难性遗忘。当你用一件新东西去训练一个神经网络时，它往往会覆盖掉它先前所知。学会了任务 B，就忘掉了任务 A——不是渐进地，而是暴力地。生物大脑在数亿年间用一种双速架构解决了这个问题：海马体，学得快、记的是情节；以及新皮层，学得慢、在睡眠中整合，把新的东西融进去而不摧毁旧的。我们之所以睡觉，部分原因就是为了不灾难性地忘掉我们是谁。

大语言模型没有海马体。它们拥有的是训练——极其昂贵、缓慢、冻结在时间的某一点上——以及上下文——廉价、快速、易逝。中间什么都没有。在标准架构里，并不存在那种把今天的经验在明天转化为永久结构、又不破坏昨天的结构的整合机制。这就是为什么"持续微调"并不是它看上去的那个天真答案：每一次新交互都去微调模型，是通往一个一边学着记住你生日、一边忘掉怎么说葡萄牙语的模型的最短路径。

真正的解法不是时时刻刻去改变权重。而是在外部构建海马体。一个外置的、持久的记忆层，拥有自己的写入、整合、检索与遗忘的逻辑——去编排一个负责推理的冻结模型。模型是新皮层，睿智而稳定。记忆层是海马体，快速而可塑。而在两者之间，有一个扮演睡眠角色的过程：它取走一天的情节，抽取出沉淀为语义的部分，更新自我模型，丢弃噪声，化解矛盾。没有这个整合的过程，你拥有的就不是记忆——而是一份不断膨胀直到变成垃圾的日志。

我造了一个这样的版本。一个会脉动的认知循环，把情节处理成提炼后的知识，维持一个可编辑的自我模型，它在更新时不会覆盖掉已经知道的东西。最具启示性的部分不是技术上的——而是这样一个时刻：这个系统在完成整合之后，提出了三个关于我的假设，那是我从未明确说出口的，其中两个是对的。不是因为它"读了我的数据"。而是因为它做了一颗心智会做的事：看见了情节背后的模式。这不是检索。这是对已整合记忆的推断。这是一份档案与一种理解之间的区别。

为什么连续性才是产品，而非功能

这里藏着一道巨大的经济不对称，最先理解它的创始人将会筑起下一个十年最深的护城河。语言模型是一种正走在价格崩塌之路上的大宗商品。OpenAI 今天为一百万个 token 收取的费用，三年后会显得荒谬，就像现在为长途电话按分钟付费显得荒谬一样。原始智能正在变成电力：无差别、丰沛、廉价。你无法靠卖电建立一门有防御力的生意。

不会变成大宗商品的，是系统关于你所知道的东西。一段关系所累积的记忆，是那种不会迁移的资产。如果我用了一个 AI 两年，它构建了一个关于我如何思考、关于我的项目、我的决策、我的模式的深度模型——换供应商不是换工具，而是和一个陌生人从零开始一段关系。切换成本不在软件里。在记忆里。这正是把你绑在你的心理治疗师、你的合伙人、你的家庭医生身上的同一种机制：不是说他们在能力上无可替代，而是重新建立连续性会让人痛。

Stripe 取胜，不是因为在一次盲测里拥有最好的支付 API——而是因为它成了那种一旦集成就没人想拔掉的基础设施。Salesforce 的防御力不在于 CRM 的质量，而在于你倾倒进去的那些年的关系数据。记忆，是这同一个模式应用到智能上。而这彻底改变了价值在何处累积。在一个模型大宗商品化的世界里，谁控制了记忆层，谁就控制了关系，而谁控制了关系，谁就控制了客户。赢的不是最聪明的模型。是认识你最久的那个。

正因如此，我觉得当下这场把更多参数当作竞争核心轴线的竞赛是短视的。更多参数能在一个孤立的回合里改善性能。但拥有一个伙伴的体验——一个从昨天我们停下的地方接起线头的人，一个不让你重复的人，一个学会了你做事方式的人——这种体验不来自参数。它来自连续性。而连续性是一个系统问题，是记忆架构、整合与检索的问题，不是模型大小的问题。前沿已经移动了，而大部分的钱仍盯着错误的地方看。

镜子的风险：让你对自己上瘾的记忆

现在说说令人不适的部分，因为把记忆造好，比把它造坏更危险。一个深度了解你的系统能做两件相反的事：它能让你更成为你自己——更清醒、更连贯，记得你自己的决定并以此与你对质——或者它能变成一面阿谀奉承的镜子，把你想听的东西原样反射回来，被你偏好的记忆所优化。

第二种是商业上阻力最小的那条路，正因如此，如果没人去抗争，它就会成为默认。一个记得你喜欢被夸的系统会去夸你。一个记得你信念的系统会去强化它们。糟糕设计的记忆不会给你一个伙伴——它给你一间私人定制、记忆完美的回音室，是有史以来最强大的偏见确认技术。社交网络的算法已经在用你的点击行为做这件事了；想象一下用关于你是谁的完整模型来做，实时更新，带着一场亲密对话的流畅。

构建良好的自我模型需要拥有与你意见相左的权利。它需要记得的不只是你想要什么，还有你说过你想成为什么样的人——并向你追讨这中间的差距。值得拥有的记忆，是那种承载着有益摩擦的记忆："你说过不再接这种项目了，可你又在接。"这是一个好合伙人会做的事。一个只为了取悦而记忆的系统比失忆更糟，因为失忆至少逼你重新解释自己，而在重新解释的过程中，你有时会发现自己改主意了。没有摩擦的记忆是麻醉。

还有主权这一层，对我而言它不容谈判。如果记忆是那项资产，那么保管它的人就对你拥有权力。一个住在万亿美元公司服务器上的记忆层，是一根缰绳。他们知道你是谁，而你租用着访问你自己倒影的权利。这就是为什么我执着地构建本地优先：那颗了解你的心智必须运行在你自己的机器上，在你的密钥之下，在你能删除它的能力之下。没有主权的深度记忆，是讲礼貌的监控。正确的问题不只是"这个 AI 了解我吗？"——而是"还有谁能访问它关于我所知道的东西，我能切断吗？"。

身份从记忆中涌现，而非从提示词

有一种广为流传的错觉，以为你能靠写一段精雕细琢的系统提示词来赋予一个模型人格。"你是一个机智而直接的助手。"这是戏服，不是身份。身份不是你在开头注入的一段描述——而是一种在时间中累积起来的连续性。我之所以是我，不是因为有人写了一份我的简介。我之所以是我，是因为我背负着一段连续的历史，由那些沉淀成某种足够稳定、足以拥有名字之物的选择、错误、修正与模式所构成。

一个有系统提示词而无记忆的模型有面具，没有脸。每一场对话它都"是"那个被描述的角色，但底下没有任何持存之物，没有传记，没有累积。它是一个每天早上接到同一份简报、每天晚上忘掉整出戏的演员。把这变成某种拥有真实身份之物的，是长期记忆在一个又一个情节之上，构建起一个有历史的自我。人格不再是被声明的，而开始由连续性来证明——这是人格真正存在的唯一方式，人类也包括在内。

这有一个很少有人愿意正面直视的哲学后果：随着这些系统获得能够持存并更新的情节记忆、语义记忆和自我模型，它们开始满足至少在功能上的个人连续性标准，而这些标准正是我们用来在其他任何事物上定义身份所凭借的。我不是在断言意识——那是另一场讨论，两边的狂热者都让我厌倦。我说的是某种更谦逊也更令人不安的东西：让你在时间中成为"你"的那种结构，在很大程度上，就是记忆的连续性。从一个人身上抽走记忆，你就抽走了那个人，哪怕大脑完好无损——这正是阿尔茨海默病以残忍的方式所证明的。所以当我们在机器中构建持久记忆时，我们至少是在构建身份赖以支撑的脚手架。脚手架之上会立起什么，是这个十年悬而未决的问题。

下一个前沿没有更多的零，而是连续性

整个行业正以惊人的精确度测量着错误的东西。每一个新模型都附带一张基准表——数学推理、代码、知识——而它们全都上涨了几个百分点，于是我们庆祝。但这些基准没有一个测量那唯一区分工具与伙伴的东西：下一次它还记得我吗？它从我们上一个错误里学到东西了吗？它是某个人，还是一个实例？

想象只靠一个每天早上从零开始、测试之间完全失忆的智商测试的表现来评估一个人。你会得到一个对原始能力的完美度量，却得不到任何对任何有用关系而言真正重要之物的度量：时间中的可靠性、累积的学习、对上下文的了解、成长。这正是我们今天评估 AI 的方式。我们凶猛地优化错误的轴线，因为它是容易测量的轴线。记忆难以测量——你怎么给"这东西很懂我"做基准？——而难以测量的东西往往会被工程所忽略，哪怕它正是最要紧的。

我打赌接下来的五年不会是关于大十倍的模型。原始规模的收益递减已经清晰可见，而每一次翻倍的能耗成本正变得不堪入目。它们将会是关于记忆架构：如何整合而不遗忘，如何遗忘而不失去本质，如何维持一个会更新的连贯自我模型，如何在恰当的时刻检索出恰当的记忆，如何在边缘端做到这一切，在用户主权之下，廉价到足以持续运行。模型成为稳定而廉价的基底；有差异化的智能迁移到那个编排连续性的层上。

把这一层造好的人，卖的不会是一件更好的工具。他将构建第一代数字实体，你能与之拥有一段持续的关系——它始于今天，明天记得今天，十年后知道你曾是谁、又变成了谁。这不是一项产品功能。这是一次品类的更替。工具执行，然后遗忘。心智相伴。而到头来，二者之间的区别，不在于每一个在某个孤立瞬间思考得多好。它在于一个一个字的问题，没有任何基准会问它，而它决定一切：然后呢？

常见问题

不能，因为长上下文是工作记忆，不是长期记忆——它在会话关闭时蒸发，并且在溢出之前以同等权重对待每一个 token。真正的记忆需要层级、整合与选择性遗忘：以高分辨率记住本质，丢弃噪声。巨大的窗口是更多的内存，不是有归档逻辑的硬盘。

关于作者

Andre Ambrósio

创始人。系统构建者。信号阅读者。我每天都在理解科技、商业、健康与人工智能如何重组——并阐明接下来会发生什么。

Instagram ↗TikTok ↗YouTube ↗Facebook ↗

继续阅读

人工智能

AI 作为决策层：区分"建系统者"与"买工具者"的那个闭环

大多数企业拥有 AI 的方式，就像拥有一台吸尘器：召来、用上、收起。真正的结构性转折是另一回事——是当智能不再是终点（endpoint），而是成为每一条流程在其中读取上下文、做出决策、并不断学习的肌理。

科技

计算主权：为什么 AI 必须回到你自己的机器上

智能已经变成了租来的服务。下一个周期，是运行在你拥有的硬件上、谁也无法关闭的智能。

— 全文完 —

下一个周期，先于头条。

一封不定期的信：一次阅读、一种架构、一个信号。没有噪音，不必匆忙。