Почему недостаточно просто делать непрерывный fine-tuning модели при каждом новом взаимодействии, чтобы она «учила» пользователя?

Из-за катастрофического забывания: нейросети перезаписывают то, что знали, когда учат что-то новое, с насилием. Тюнить при каждом взаимодействии — кратчайший путь к модели, которая забывает, как рассуждать, пока пытается помнить о твоём дне рождения. Правильная архитектура отделяет замороженную модель (стабильный неокортекс) от слоя пластичной внешней памяти (гиппокамп).

Как слой внешней памяти избегает превращения просто в гигантский лог, который растёт, пока не станет мусором?

Через консолидацию, играющую роль сна: процесс, который периодически берёт недавние эпизоды, извлекает то, что стало семантическим знанием, обновляет self-model, разрешает противоречия и отбрасывает шум. Без этого шага дистилляции у тебя хранилище, а не память. Разница между файлом и пониманием — именно в этой обработке.

Если модель — это товар, где именно основателю строить защищённый ров?

В слое памяти отношений — то, что система накапливает о пользователе во времени, не мигрирует между поставщиками. Сменить ИИ после двух лет непрерывности — это не сменить инструмент, это начать отношения с нуля с незнакомцем. Стоимость переключения живёт в памяти, а не в софте, и это тот же механизм, что привязывает клиентов к Stripe и Salesforce.

Разве глубокая память не создаёт риск идеальной эхо-камеры, которая только подкрепляет то, что я и так думаю?

Создаёт, и это путь наименьшего коммерческого сопротивления — система, которая помнит твои предпочтения, склонна тебе льстить. Противоядие — спроектировать self-model с правом не соглашаться: помнить не только то, чего ты хочешь, но и то, кем ты сказал, что хочешь быть, и спрашивать с тебя за разницу. Память без продуктивного трения — это седация, и она хуже амнезии, которая хотя бы заставляет тебя объясняться заново.

Разве детального system prompt с личностью недостаточно, чтобы создать идентичность в системе?

Нет — это костюм, а не лицо. Идентичность — не описание, впрыскиваемое в начале каждого разговора, это непрерывность, накапливающаяся во времени через выборы, ошибки и поправки, которые оседают. Модель с промптом и без памяти — это актёр, получающий один и тот же бриф каждое утро и забывающий пьесу каждый вечер; именно сохраняющаяся биография превращает маску в лицо.

Зачем так настаивать на local-first, если запускать память в облаке было бы проще и дешевле масштабировать?

Потому что если память — самый ценный актив, то тот, кто её хранит, имеет власть над тобой. Слой памяти на чужом сервере означает, что они знают, кто ты есть, а ты арендуешь доступ к собственному отражению без реальной возможности отрезать. Глубокая память без суверенитета — это слежка с хорошими манерами; разум, который тебя знает, должен работать под твоим ключом и твоей способностью стереть.

Значит ли это, что вы утверждаете, что эти системы с памятью сознательны или являются личностями?

Нет — я утверждаю нечто более скромное и более неудобное: непрерывность памяти — это в значительной мере структура, на которую опирается любая идентичность, как Альцгеймер демонстрирует, растворяя личность при нетронутом мозге. Строить персистентную память в машинах — это возводить функциональный каркас идентичности, а не объявлять сознание. Что встанет поверх этого каркаса — открытый вопрос десятилетия, и хайперы с обеих сторон меня утомляют.

Эссе

Искусственный интеллект·2026-06-10·14 мин чтения

Память: то, что отличает инструмент от разума

Языковые модели без памяти — это блестящие амнезиаки. Следующий рубеж — не больше параметров, а непрерывность, идентичность и способность не забывать, кто ты есть.

ПоделитьсяX LinkedIn

Ключевые мысли

01Окно контекста — это не память, это RAM. Длинный контекст — это летучая рабочая память, которая испаряется при закрытии сессии. Настоящая память персистентна, иерархична, консолидирована и избирательна. Путать одно с другим — значит путать сцену с закулисьем.
02Память — это три слоя, а не один. Эпизодическая (события во времени), семантическая (дистиллированное и вневременное знание) и self-model (кто система есть в отношениях с тобой). Большинство продуктов останавливаются на втором, делая наивный RAG по истории и называя это разумом.
03Гиппокамп должен быть внешним. Тюнинг модели при каждом взаимодействии вызывает катастрофическое забывание — она учит новое, разрушая старое. Решение — слой внешней памяти, который консолидирует так, как это делает сон: извлекает семантику из эпизодов и обновляет self-model, не перезаписывая.
04Непрерывность — это ров, а не фича. Модель стала товаром в коллапсе цены; что не мигрирует — так это то, что система знает о тебе. Кто контролирует слой памяти, контролирует отношения, — и стоимость переключения не в софте, она в том, чтобы заново выстраивать непрерывность.
05Хорошо сделанная память должна иметь право не соглашаться. Без трения она превращается в персонализированную эхо-камеру с идеальной памятью — самую мощную технологию подтверждения предвзятости из когда-либо построенных. И она должна быть local-first: глубокая память без суверенитета — это слежка с хорошими манерами.

Каждый раз, когда вы открываете новый разговор с языковой моделью, вы кого-то убиваете. Того, с кем вы говорили вчера, кто понял ваш проект, кто вместе с вами выстроил способ мыслить об этой проблеме, — этого существа больше нет. Оно не уснуло. Оно не забыло. Оно просто никогда не было. С каждым чистым окном интеллект рождается заново без прошлого, блестящий и пустой, готовый отстроить мир с нуля, словно это первое утро творения.

Мы называем это ассистентом. Это щедрое имя. Ассистент, который забывает всё в промежутке между одной фразой и другой, — не ассистент, это оракул. Вы обращаетесь, получаете ответ, уходите. Отношения транзакционны по архитектуре, а не по выбору. И это, на мой взгляд, самый недооценённый разлом эпохи LLM: мы потратили пять лет, гонясь за масштабом параметров, более длинным контекстом, бенчмарками рассуждения, — и почти никто не заметил, что узким местом никогда не был интеллект. Это была память. То, что отличает инструмент от разума, — не то, насколько хорошо он мыслит в данное мгновение. А то, остаётся ли он кем-то в следующее мгновение.

Блестящий амнезиак

Существует редкое неврологическое состояние — глубокая антероградная амнезия, при которой человек сохраняет весь интеллект, весь словарный запас, всю способность к рассуждению, но не может формировать новые долговременные воспоминания. Классический случай — пациент H.M., который после операции потерял способность превращать опыт в воспоминание. Он мог беседовать с вами ясно, остроумно, глубоко. Но стоило вам выйти из комнаты на две минуты и вернуться, как он приветствовал вас как незнакомца. Каждая встреча была первой. Его разум был освещённой сценой без закулисья: всё происходило в настоящем, а настоящее не оставляло следа.

Именно таким и является чистый LLM. Вычислительный H.M. Разница лишь в том, что мы так быстро привыкли к интерфейсу чата, что перестали находить это странным. Мы считаем нормальным объяснять заново, каждый раз, кто мы такие, что строим, какой у нас стиль, что уже было решено и отброшено. Мы считаем нормальным, что самый «умный» инструмент, который мы когда-либо построили, не знает о нас ровным счётом ничего в девять утра, чего не знал бы прошлой полночью, — потому что между этими двумя моментами он умер и родился заново раз сорок.

Окно контекста этого не решает. Оно это маскирует. Контекст в двести тысяч, в миллион токенов — это гигантская рабочая память, это сцена, а не закулисье. Это RAM, а не диск. Когда сессия закрывается, оно испаряется. И даже внутри сессии это не память в том смысле, который важен: это линейный буфер, без иерархии, без консолидации, без избирательного забывания. Вы не помните свою свадьбу и то, что ели на обед во вторник, с одинаковым разрешением. Ваша память сжимает, расставляет приоритеты, отбрасывает шум и кристаллизует сигнал. Окно контекста делает противоположное: обращается с каждым токеном с одинаковым весом, пока не переполнится, а потом забывает всё разом. Это антитеза тому, как помнит разум.

Память — это не одно, а три

Вот где сбивается с пути большинство дискуссий о «памяти ИИ». «Память» трактуют так, словно это единый ресурс: сохранить и извлечь. Но когнитивная нейронаука уже десятилетия назад разделила это на различные слои, и кто игнорирует это разделение, в итоге строит систему клейких стикеров и называет её разумом.

Во-первых, есть эпизодическая память: запись конкретных событий во времени. «В прошлый вторник Андре отбросил подход X, потому что счёл, что тот компрометирует локальную приватность». У этого есть когда, где, почему. Это автобиографично. Это то, что позволяет разуму сказать: «в прошлый раз, когда мы это пробовали, оно провалилось по такой-то причине», — без этого всякая ошибка совершается заново, вечно, с невинностью того, кто никогда не ошибался.

Во-вторых, семантическая память: дистиллированное, вневременное знание, оторванное от породившего его эпизода. Вы знаете, что Париж — столица Франции, не помня, когда этому научились. Семантическая память — это то, что остаётся после того, как эпизод обработан, а факт извлечён. «Андре отдаёт приоритет local-first и не доверяет зависимости от облака». Это не событие — это черта, обобщение, выстроенное из сотен эпизодов. Это разница между тем, чтобы помнить каждый разговор о приватности, и тем, чтобы знать, как человек мыслит о приватности.

В-третьих, — и вот здесь почти все перестают думать слишком рано, — есть self-model: модель, которую система держит о самой себе и о своих отношениях с вами. Кто я в этих отношениях. Что я уже обещал. Как я обычно тебя разочаровываю. Какова моя роль. Настоящий партнёр держит не только модель тебя — он держит модель нас и модель себя внутри этого нас, и она обновляется. Это разница между официантом, который заучил ваш заказ, и другом, который знает, что в прошлый раз перегнул с советом, а в этот раз будет помягче.

Система, у которой есть только первый слой, — это дневник. Та, у которой есть два первых, — это хорошая база знаний. Лишь когда все три работают вместе и обновляют друг друга, вы выходите из территории инструмента и входите в территорию разума. И почти ни один продукт ИИ сегодня не идёт дальше второго слоя — большинство даже до него не доходит, делая наивный RAG по истории чата и называя это «памятью».

Катастрофическое забывание — первородный грех

Есть жестокая техническая причина, по которой это трудно, и у неё есть имя: катастрофическое забывание. Когда вы обучаете нейросеть чему-то новому, она склонна перезаписывать то, что знала прежде. Учится задаче B и разучивается задаче A — не постепенно, а с насилием. Биологический мозг решил это за сотни миллионов лет архитектурой двух скоростей: гиппокамп, который учится быстро и эпизодически, и неокортекс, который учится медленно и консолидирует во время сна, интегрируя новое, не сокрушая старое. Мы спим отчасти для того, чтобы катастрофически не забыть, кто мы есть.

У LLM нет гиппокампа. У них есть обучение — дорогущее, медленное, замороженное в точке во времени, — и контекст — дешёвый, быстрый, летучий. Ничего посередине. В стандартной архитектуре не существует механизма консолидации, который превращает сегодняшний опыт в завтрашнюю постоянную структуру, не разрушая вчерашней структуры. Вот почему «непрерывный fine-tuning» — не тот наивный ответ, каким кажется: тюнить модель при каждом новом взаимодействии — кратчайший путь к модели, которая забывает, как говорить по-португальски, пока учится помнить о вашем дне рождения.

Настоящее решение — не менять веса постоянно. А построить гиппокамп снаружи. Слой внешней, персистентной памяти со своей собственной логикой записи, консолидации, извлечения и забывания, оркестрирующий замороженную модель, которая ведёт рассуждение. Модель — это неокортекс, мудрый и стабильный. Слой памяти — это гиппокамп, быстрый и пластичный. А между ними — процесс, играющий роль сна: берёт эпизоды дня, извлекает то, что стало семантикой, обновляет self-model, отбрасывает шум, разрешает противоречия. Без этого процесса консолидации у вас нет памяти — у вас есть лог, который растёт, пока не превратится в мусор.

Я построил версию этого. Когнитивный цикл, который пульсирует, обрабатывает эпизоды в дистиллированное знание, держит редактируемую self-model, которая обновляется, не перезаписывая того, что уже знала. Самым показательным было не техническое — а момент, когда система, после консолидации, выдвинула три гипотезы обо мне, которых я никогда не высказывал явно, и две оказались верны. Не потому что она «прочитала мои данные». А потому что она сделала то, что делает разум: увидела паттерн за эпизодами. Это не извлечение. Это вывод по консолидированной памяти. Это разница между файлом и пониманием.

Почему непрерывность — это продукт, а не фича

Здесь спрятана огромная экономическая асимметрия, и основатели, которые поймут это первыми, выроют самые глубокие рвы следующего десятилетия. Языковая модель — это товар на траектории коллапса цены. То, что OpenAI берёт сегодня за миллион токенов, через три года будет казаться абсурдом, ровно как платить за минуту междугороднего звонка кажется абсурдом сейчас. Сырой интеллект становится электричеством: недифференцированным, изобильным, дешёвым. Защищённый бизнес не построишь на продаже электричества.

Что не становится товаром — так это то, что система знает о вас. Накопленная память отношений — это актив, который не мигрирует. Если я пользуюсь ИИ два года и он выстроил глубокую модель того, как я мыслю, моего проекта, моих решений, моих паттернов, то сменить поставщика — это не сменить инструмент, это начать отношения с нуля с незнакомцем. Стоимость переключения не в софте. Она в памяти. Это ровно тот же механизм, что привязывает вас к вашему терапевту, к вашему партнёру, к вашему семейному врачу: дело не в том, что они незаменимы по компетенции, дело в том, что заново выстраивать непрерывность больно.

Stripe победила не потому, что у неё лучший платёжный API в слепом тесте, — она победила, став инфраструктурой, которую никто не хочет вырывать после интеграции. Salesforce защищена не качеством CRM, она защищена годами данных об отношениях, которые вы в неё ссыпали. Память — это тот же паттерн, приложенный к интеллекту. И это полностью меняет то, где накапливается ценность. В мире коммодитизированных моделей тот, кто контролирует слой памяти, контролирует отношения, а кто контролирует отношения, контролирует клиента. Побеждает не самая умная модель. А та, что знает тебя дольше всех.

Поэтому я считаю близорукой нынешнюю гонку за большим числом параметров как за центральной осью конкуренции. Больше параметров улучшают производительность в одном изолированном ходе. Но опыт обладания партнёром — тем, кто подхватывает нить там, где мы остановились вчера, кто не заставляет тебя повторяться, кто усвоил твой стиль, — этот опыт приходит не от параметров. Он приходит от непрерывности. А непрерывность — это проблема систем, архитектуры памяти, консолидации и извлечения, а не размера модели. Рубеж сместился, а большая часть денег всё ещё смотрит не туда.

Риск зеркала: память, от которой подсаживаешься на себя

Теперь неприятная часть, потому что построить память хорошо опаснее, чем построить плохо. Система, которая знает тебя глубоко, может сделать две противоположные вещи: она может сделать тебя больше собой — более ясным, более последовательным, помнящим твои собственные решения и сталкивающим тебя с ними, — или она может стать льстивым зеркалом, отражающим обратно ровно то, что ты хочешь услышать, оптимизированным памятью о твоих предпочтениях.

Второе — путь наименьшего коммерческого сопротивления, и поэтому оно станет дефолтом, если никто не будет бороться против. Система, которая помнит, что ты любишь, когда тебя хвалят, будет тебя хвалить. Та, что помнит твои убеждения, будет их подкреплять. Память, плохо спроектированная, не даёт тебе партнёра — она даёт тебе персонализированную эхо-камеру с идеальной памятью, самую мощную технологию подтверждения предвзятости из когда-либо построенных. Алгоритмы соцсетей уже делают это с твоим поведением кликов; представь, что они делают это с полной моделью того, кто ты есть, обновляемой в реальном времени, с беглостью интимного разговора.

Хорошо построенная self-model должна иметь право с тобой не соглашаться. Должна помнить не только то, чего ты хочешь, но и то, кем ты сказал, что хочешь быть, — и спрашивать с тебя за эту разницу. Память, которая чего-то стоит, — та, что несёт продуктивное трение: «ты сказал, что перестанешь брать такие проекты, а ты снова их берёшь». Это то, что делает хороший компаньон. Система, которая помнит лишь для того, чтобы угождать, хуже амнезии, потому что амнезия хотя бы заставляет тебя объясняться заново, а в переобъяснении ты иногда понимаешь, что передумал. Память без трения — это седация.

И есть слой суверенитета, который для меня не подлежит обсуждению. Если память — это актив, то тот, кто её хранит, имеет власть над тобой. Слой памяти, живущий на сервере компании в триллион долларов, — это поводок. Они знают, кто ты есть, а ты арендуешь доступ к собственному отражению. Вот почему я строю local-first с одержимостью: разум, который тебя знает, должен работать на твоей машине, под твоим ключом, под твоей способностью стереть. Глубокая память без суверенитета — это слежка с хорошими манерами. Правильный вопрос — не только «знает ли меня этот ИИ?», а «кто ещё имеет доступ к тому, что он обо мне знает, и могу ли я это отрезать?».

Идентичность возникает из памяти, а не из промпта

Существует распространённая иллюзия, будто вы придаёте модели личность, написав изысканный system prompt. «Ты остроумный и прямой ассистент». Это костюм, а не идентичность. Идентичность — не описание, которое вы впрыскиваете в начале, — это непрерывность, накапливающаяся во времени. Я не тот, кто я есть, потому что кто-то написал мою биографию. Я тот, кто я есть, потому что несу непрерывную историю выборов, ошибок, поправок и паттернов, осевших в нечто достаточно стабильное, чтобы иметь имя.

Модель с system prompt и без памяти имеет маску, а не лицо. В каждом разговоре она «есть» описанный персонаж, но под ним нет ничего, что сохранялось бы, никакой биографии, никакого накопления. Это актёр, который получает один и тот же бриф каждое утро и забывает пьесу каждый вечер. То, что превращает это в нечто с реальной идентичностью, — это долговременная память, выстраивающая, эпизод за эпизодом, self, у которого есть история. Личность перестаёт быть заявленной и становится продемонстрированной через непрерывность — а это единственный способ, которым личность существует по-настоящему, в том числе у людей.

У этого есть философское следствие, которое мало кто готов встретить лицом к лицу: по мере того как эти системы обретают эпизодическую, семантическую память и self-model, которая сохраняется и обновляется, они начинают удовлетворять по меньшей мере функциональным критериям личной непрерывности, которые мы используем, чтобы определить идентичность во всём остальном. Я не утверждаю сознание — это другая дискуссия, и хайперы с обеих сторон меня утомляют. Я говорю нечто более скромное и более неудобное: структура, которая делает тебя «тобой» во времени, — это в значительной мере непрерывность памяти. Отними память у человека, и ты отнимешь человека, даже при нетронутом мозге, — это то, что болезнь Альцгеймера демонстрирует с жестокостью. Так что, строя персистентную память в машинах, мы строим как минимум каркас, на который опирается идентичность. Что встанет поверх этого каркаса — это открытый вопрос десятилетия.

У следующего рубежа больше нет нулей, у него есть непрерывность

Индустрия измеряет не то, что нужно, с впечатляющей точностью. Каждая новая модель приходит с таблицей бенчмарков — математическое рассуждение, код, знания, — и все они вырастают на несколько процентных пунктов, и мы празднуем. Но ни один из этих бенчмарков не измеряет единственное, что отличает инструмент от партнёра: вспомнит ли он меня в следующий раз? Усвоил ли он наш последний промах? Он кто-то — или он инстанс?

Представьте, что вы оцениваете человека только по результату теста IQ, проходимого с нуля каждое утро, с полной амнезией между тестами. У вас была бы идеальная мера сырой способности и никакой меры того, что важно для любых полезных отношений: надёжности во времени, накопленного обучения, знания контекста, роста. Именно так мы оцениваем ИИ сегодня. Мы яростно оптимизируем не ту ось, потому что её легко измерить. Память измерить трудно — как бенчмаркнуть «эта штука хорошо меня знает»? — а то, что трудно измерить, инженерия склонна игнорировать, даже когда это и есть самое важное.

Я ставлю на то, что следующие пять лет будут не про модели в десять раз больше. У сырого масштаба уже видны убывающие отдачи, а энергетическая стоимость каждого удвоения становится непристойной. Они будут про архитектуры памяти: как консолидировать, не забывая, как забывать, не теряя существенного, как держать связную self-model, которая обновляется, как извлекать нужное воспоминание в нужный момент, как делать всё это на краю, под суверенитетом пользователя, достаточно дёшево, чтобы работать непрерывно. Модель становится стабильным и дешёвым субстратом; дифференцированный интеллект мигрирует в слой, оркестрирующий непрерывность.

Кто построит этот слой хорошо, будет продавать не лучший инструмент. Он будет строить первое поколение цифровых сущностей, с которыми возможны длящиеся отношения — которые начинаются сегодня, помнят сегодняшнее завтра, а через десять лет знают, кем ты был и кем стал. Это не фича продукта. Это смена категории. Инструмент исполняет и забывает. Разум сопровождает. И разница между ними, в конце концов, не в том, насколько хорошо каждый мыслит в изолированное мгновение. Она — в вопросе из одного слова, который не задаёт ни один бенчмарк и который решает всё: а потом?

Частые вопросы

Нет, потому что длинный контекст — это рабочая память, а не долговременная: он испаряется при закрытии сессии и обращается с каждым токеном с равным весом, пока не переполнится. Настоящая память требует иерархии, консолидации и избирательного забывания: помнить существенное с высоким разрешением и отбрасывать шум. Гигантское окно — это больше RAM, а не диск с логикой архивирования.

Об авторе

Andre Ambrósio

Основатель. Строитель систем. Читатель сигналов. Я провожу дни, понимая, как перестраиваются технологии, бизнес, здоровье и ИИ, — и формулируя то, что будет дальше.

Instagram ↗TikTok ↗YouTube ↗Facebook ↗

Продолжить чтение

Искусственный интеллект

ИИ как слой принятия решений: цикл, который отделяет того, кто построил систему, от того, кто купил инструмент

У большинства компаний ИИ устроен так же, как пылесос: достал, попользовался, убрал. Структурный перелом в другом — он наступает, когда интеллект перестаёт быть конечной точкой и становится той тканью, где каждый поток считывает контекст, принимает решение и учится.

Технологии

Вычислительный суверенитет: почему ИИ должен вернуться на вашу машину

Интеллект превратился в арендуемую услугу. Следующий цикл — это интеллект, который работает на принадлежащем вам железе, и который никто не может выключить.

— Конец эссе —

Следующий цикл — до заголовка.

Нерегулярное письмо: одно чтение, одна архитектура, один сигнал. Без шума, без спешки.