跳到内容
科技·2026-05-25·18 分钟阅读

软件的终结:当界面消融,系统开始自我生成

几十年来,软件一直是屏幕、按钮和菜单——一台被人类操作的冻结机器。这份契约正在终结。下一代软件不是被操作的:它是被指令的,并为每一个触碰它的人实时重写自己。

分享XLinkedIn

按钮是一块化石。每当你点击"导出为 PDF",你都在操作某个工程师在 2019 年做出的一个决定,它被冻结在像素里,被打包进一个二进制文件。我们使用的软件,从字面意义上说,是别人的思想凝固成的固体——一张古老意图的快照,而你被迫用鼠标重新搬演它。七十年来这就是常态。这是唯一的办法。机器不知道你想要什么,于是有人必须提前猜出所有可能的路径,并为每一条画出一块屏幕。图形界面之所以存在,并不是因为它是人类表达意愿的最佳方式。它存在,是因为机器是聋的。

这结束了。不是将要结束——是已经结束了,悄无声息地,在 GPT-3 和当下的智能体模型之间的某个时刻。尚未结束的,是我们的认知。我们仍在带着只会这一套手艺的信仰建造屏幕,就像最早的汽车带着鞭子支架一样。机器的聋是整个软件产业的奠基性前提,而这个前提倒了。当一个行业的奠基性前提倒下而无人重写其预设时,你看到的不是渐进式的改良。你看到的是一个品类的终结。

界面是一道疤痕,而非一种美德

值得精确地说清楚界面究竟是什么,因为产品行业花了几十年把界面当作产品本身。一个菜单是系统能做之事的一份有限清单,之所以被陈列出来,是因为系统无法理解你用自己的话会说出什么。一份表单是一场结构化的审讯:系统逼你把一个连续的人类意图("我想改签这趟旅程,因为我的航班延误了")翻译成数据库能吞下的一连串离散字段。每一个下拉菜单,每一个五步向导,每一句"你是想说……?",每一条工具提示——所有这些都是疤痕组织。它们是为一种无能而生的假肢:机器不理解语言,不理解上下文,不理解你。

用户体验变成了一整门学科,专门致力于把这种翻译之苦降到最低。卓越的设计师们用整个职业生涯去减少意图与结果之间的点击次数,因为每一次点击都是一次微小的羞辱——一个人类屈从于机器语法、而非反过来的时刻。Stripe 受到推崇,并不是因为处理支付有多美,而是因为他们把几十块结账屏幕缩减到了几乎不碍事的程度。一个产品能得到的最高赞誉是"直觉",而这是"我猜出了工程师猜我会想要什么"的礼貌说法。想想这有多荒诞:软件设计的巅峰,是用户和建造者隔着一面玻璃墙互相猜测。

墙倒了。而当机器开始直接理解意图——以语言,带着上下文,带着对你过往所为的记忆——界面就不再是一种美德,回归成它一直以来的样子:一道疤痕。当系统理解了那句话还保留菜单,就像汽车上还保留鞭子支架。那是考古学。将主宰下一个十年的产品,不是拥有最好界面的那些。是拥有最少界面的那些——是能把翻译消融到让你忘记自己正在使用一台机器的那些。

回答不是执行——而这就是整条边界

有一个混淆必须死去,因为它正让聪明人低估正在发生的事。那个替你写一封邮件的 ChatGPT 令人印象深刻,但它是一个神谕:它回答。你仍要复制、粘贴、调整、发送。真正的工作——那个行动——仍然是你的。神谕是一种生产力的提升。它是打了类固醇的自动补全。它有用,能卖订阅,但它没有改变软件的本质。

裂缝在"执行"这个词里。一个能访问你的邮箱、你的日历、航空公司 API 和你银行卡的智能体,不会回你一句"这是一份如何改签航班的草稿"。它直接改签。它读取那封延误邮件,与日历交叉比对,识别出 14 点在里斯本的会议现在已无法成行,改签航班并选出那条仍能让你及时抵达的中转,通知会议上的人,更新酒店,然后给你发一句话:"搞定,你现在 16 点 40 到,会议已重排,酒店延长一晚,额外费用 230 欧元,确认吗?"。这两件事的差别不是程度之差。是种类之差。一个是关于世界的文本。另一个是对世界的改变。

这就是我们所知的软件真正终结的临界点。软件一直是人类操作以引发某种效果的工具。那效果是被中介的:你移动鼠标,屏幕回应,状态改变,而你用眼睛核验。智能体让这条链坍缩。它拥有目标,拥有工具,拥有大致的判断——何时停下来发问。人类走出执行的循环,进入监督的循环。而当人类走出执行的循环,所有为中介那次执行而存在的屏幕——所有按钮,所有流程——都失去了存在的理由。不是它们变丑了。是它们变空了。没人会去操作它们,因为操作已被外包给某个根本不需要屏幕来操作的东西。

请注意,最理解这一点的公司已经不再谈"功能"了。Anthropic、OpenAI、带着 Workers 如今又带着智能体的 Cloudflare——词汇已从"产品做什么"变成"产品能自主达成什么"。这是一次轴线的转移。旧的轴线是陈列在屏幕上的能力。新的轴线是无需屏幕便可施展的能力。

实时生成的导航:有搜索的网站,对决被决定的网站

我想强行划出一个看似微妙、实则是这一切核心的区别。一个拥有搜索框的网站,和一个其整体体验在你抵达那一刻才被决定的网站之间,横亘着一道深渊。

带搜索的网站是当前的范式,而我们把它误认为个性化,因为它会动一动。Amazon 有搜索、有推荐、有"买了这个的人也买了那个"。但结构是固定的。货架在你到来之前就已存在。页面的模块由一支产品团队设计,经过 A/B 测试,而在两个用户之间改变的,只是流淌进不可变容器里的内容。你是一摊被倒进预制模具的液体。模具不认识你。它认识"像你这样的用户"——一个分段,一个聚类,一个你被强行塞进去的统计平均值。

实时被决定的网站没有货架。事实上,它没有你所理解的那种"页面"。当你抵达时,一个系统会考量你是谁、你上次做了什么、你刚刚说了什么、你此时此刻可能的目标是什么——然后生成界面。它不是在预先建好的界面之间挑选:它生成。如果你是一个在比较三个型号的买家,它递给你一张没人提前设计过的对比表,此刻才搭建出来,恰好是对你重要的那三个选项,恰好是你在意的那些属性。如果你是一个已经买过、带着问题回来的人,它甚至不给你看橱窗——它给你看订单的状态和一条解决路径。"主页"不再是一个地方,而变成一个事件。它发生一次,为你,此后再无相同。

这是给一道现成菜调味,和拥有一位会问你想吃什么的主厨之间的差别。带搜索的网站是一个巨大的自助餐厅,你在里面追猎自己想要的。实时被决定的网站则是一个早已知道你会想要什么、在你落座之前就把菜盛好的人。而几乎所有人都搞错的那一点是:这不是"更好的个性化"。这是屏幕设计作为一项活动的终结。因为如果屏幕在每一次交互中都由上下文生成,那就不再有"那块屏幕"供设计师去画。存在的是一个生成系统,一套语法,一组约束,一些意图——而最终的造物从中萌发,每一次都不同。设计师不再画油画,转而培育一座自行生长的花园,朝着他引导却不掌控的方向。

已经有人在用原始的方式做这件事了。从提示词生成 UI,按描述自我组装的组件,按你提的问题重新配置的仪表盘。它粗糙,它缓慢,它幻觉,它出错。就像最早的图形浏览器也很粗糙。重要的不是执行的当前状态。而是方向不可逆转,因为一旦用户尝到一个会顺应他的界面,固定界面就会显出它的本相:僵硬、愚蠢、为别人而造。

这对知识工作做了什么

现在来到令人不适的部分,因为这里住着金钱、就业和身份。

知识工作,在其绝大多数情况下,就是人类对软件的操作。那个从系统里提取数据、丢进 Excel、排版、得出结论的金融分析师。那个在六个不同工具里搭建活动、把数据从一个复制到另一个的营销人员。那个翻看合同寻找条款的初级律师。那个筛选简历的招聘者。那个为解决一个工单而在五个标签页之间穿梭的客服。凑近看,几乎所有的办公室工作都是这个:一个人充当那些互不交谈的系统之间的胶水,把意图翻译成点击,把数据从一块屏幕搬运到另一块,并在途中行使一些低层次的判断。人类就是那个中间件。人类就是那个从未被建造出来的集成。

智能体就是那个被建造出来的集成。当系统理解意图并拥有对工具的访问权时,屏幕之间的数据搬运——那曾是五亿人半个工作日的内容——干脆消失了。不是工作变快了。而是"操作软件以移动信息"这个工作品类,作为一种人类职业不复存在。这不是一个冒险的预测。它几乎是算术。如果你之所以坐在那把椅子上,是因为系统是聋的、得有人来翻译,而系统不再是聋的了,那么那把椅子就不再有功能。

但那个轻易的结论——"所有人都会被替代"——和否认一样懒惰。消失的是操作。生长的是判断、目标的设定和监督。那个因 Excel 速度而值钱的金融分析师贬值了;那个因知道哪个问题值得问而值钱的,升值了。工作从"我怎么做这件事"迁移到"应该做什么,以及我如何知道智能体做对了"。这是层级的重组,不是一次撤离。底层——机械的执行——被机器吸收。高层——意图、品味、责任、伦理、在模糊中的判断——留下来,并且变得更密,因为现在每一个人类决定都驱动着一根大得多的杠杆。一个拥有十个称职智能体的人,产出的是从前需要一整个部门才能完成的东西。那个部门不会变成十个部门。它变成那一个人。

会受苦的不是抽象的"知识工作者"。而是那个把整个职业身份建立在操作上、却毫不建立在意图上的人。是那个精于使用工具、却拙于知道为何与何时的专业人士。这种人被奖赏了三十年,因为操作工具是困难且稀缺的。稀缺蒸发了。而每当一种稀缺蒸发,它曾支付的溢价也随之蒸发,全然不顾习得那项技能曾有多艰难。

那么谁来写程序?代码也是一种界面——而它正在消融

程序员喜欢以为自己站在这场变革安全的一侧,建造着吞噬其他工作的那个东西。这是一种舒适且部分虚假的幻觉。代码是一种界面——也许是存在过的最纯粹的界面。它是人类以痛苦的精确度告诉机器究竟要做什么的方式,因为机器太蠢,理解不了任何不那么精确的东西。整个编程语言、框架、库、设计模式的产业,是一座为绕开同一种聋而堆积起来的、巨大的疤痕之塔。你写 for (let i = 0; i < arr.length; i++),不是因为人类是这样思考的,而是因为机器要求这个仪式。

当机器理解意图时,仪式变得可以商量。我说的不是那个天真的幻想:"没人会再写程序,用葡萄牙语提要求就行了"。葡萄牙语是模糊的,而模糊建不出可靠的系统——仍然需要有人严谨地规约,仍然需要有人理解智能体出错时会发生什么,仍然需要有人设计架构、边界、保证。但比例发生了剧烈的变化。编程工作中属于打字的那部分——把一个已经理解的解决方案翻译成某种语言的特定语法——这部分恰恰是机器现在所做的那种机械翻译。那个因能快速敲出显而易见的解法而值钱的程序员,贬值的原因和 Excel 分析师贬值的原因一模一样。

升值的是架构、系统判断、决定该建造什么的能力,以及知道建出来的东西是否正确、安全、不会在凌晨三点于生产环境里爆炸的能力。升值的是审查的能力——因为当一个智能体生成一万行代码时,瓶颈不再是写出它们,而变成信任它们。不远的未来的程序员,更像一个给出密集简报、监督执行、并对结果完整性负责的架构师,而不像一个打字员。请注意,这已经是最优秀的高级工程师多年来的工作了——他们早已按意图编程,把细节委托给初级工程师。变化在于,那个初级工程师现在是一台机器,无穷无尽、廉价、每个季度都在变好。

有一个细节很少人能消化:如果软件变成实时自我生成的系统,那么部分"代码"就不再由任何人提前写就。系统在当下、为那个上下文,生成它自己。这意味着那个名为"软件"的造物——那个你曾编译、版本化、分发的二进制文件——开始朝着与界面相同的方向消融。当一半的行为由一个回应上下文的模型实时决定时,经典意义上的"那个构建"就不复存在了。版本控制、部署、QA——所有为驯服静态造物而存在的工程机械,都需要为一个每次执行都在改变的造物而重新发明。这是一个巨大的、尚未被妥善解决的问题,而这恰恰正是下一个十年里那些困难且有价值的工作所在:你如何保证、审计、测试并问责一个无法安静到足以被检查的软件?

看不见的架构:为什么这是不可避免的

我看待这件事,就像我看待几乎所有事情一样:作为一个看不见的架构正在重新组织自己的问题。软件从来不是屏幕和按钮。屏幕和按钮是表层,是外壳,是那东西在一个时代的约束下向人类显现自己的方式。那东西本身一直是别的:把意图转化为对世界状态之效果的逻辑。意图进来,某个决定被做出,世界里的某物改变。屏幕只是输入输出的协议,当唯一可用的通道是视觉、唯一的输入设备是一个点击的人类时。

当你这样看待软件——作为一台把意图转化为效果的机器——就显而易见,图形界面是一个历史的偶然,而非一种本质。它解决了一个特定时代的输入/输出问题。自然语言解决得更好。上下文生成解决得还要更好。外壳注定会被替换,就在机器获得直接理解意图、并实时生成恰当输出之能力的那一刻。那一刻到了。外壳正在被替换。内核——把意图转化为效果——继续存在,比以往任何时候都更强大,如今无需再穿过人类手指敲在键盘上的瓶颈。

这也解释了为什么这个行业里有这么多人陷入瘫痪。他们把身份、公司和职业建在了外壳上。他们把外壳误认为那东西本身。他们在屏幕设计、设计系统、组件库、前端框架上投入了数十亿——一整座建立在"软件等于人类操作的屏幕"这一预设之上的文明。当你把显现误认为本质,显现的替换就显得像世界末日。它不是世界末日。它是外壳的终结。内核比以往任何时候都更鲜活,而懂这一点的人会停止为外壳哭泣,转去建造新的内核。

这里的 AI 不是一个产品。它是一层基础设施,就像电曾经是,就像 TCP/IP 曾经是,就像浏览器曾经是。没人为了电而买电;你买的是它所驱动的东西。AI 是那个消融意图与执行之间边界的基底,而一切建立在"那条边界需要一个人操作一块屏幕"这一前提之上的东西,都将被重写。不是因为有人决定了。而是因为前提倒了,而建立在倒下前提之上的结构会自行崩塌,在它自己的时间里,不向任何人请示。

当地面移动时该建造什么

对建造者而言的实际问题是:现在,在 2026 年,既不落入否认也不落入炒作,该做什么?

第一,别再把界面当作产品。如果你的竞争优势是一块漂亮的、组织功能的屏幕,那你是在内核的时代卖外壳。屏幕将变成由上下文生成的大宗商品。正确的问题不是"我如何让我的界面更好",而是"如果我产品的整个导航都由实时决定,还会剩下什么价值?"。剩下的是你知道而别人不知道的东西,是只有你才有的数据,是你建立起来的信任,是嵌入你系统中的判断的质量,是与真实世界集成的深度。剩下的是实质。消失的是表面。

第二,为执行而建,不为回答而建。今天所有"回答"的产品——给你信息让你去行动的——都处在脆弱的位置,因为那个去执行的竞争者会把你吞掉。问题永远是:我的产品是告诉你该做什么,还是去做?如果是告诉,你就是一层用户的智能体会跳过的东西。如果是去做,你就是智能体使用的那个工具。被跳过和被使用之间有天壤之别,而它决定了谁能活下来。

第三——而这是最反直觉的——投入到那个关于"信任自我生成的系统"的无趣问题上。当软件实时决策、无需点击监督地执行、并生成它自己的界面时,瓶颈就不再是能力,而变成信任。我怎么知道智能体做对了?我如何审计一个从未被显式编码的决定?我如何问责一个行为每次执行都在改变的系统?我如何阻止它用我给它的自主权做出某种灾难性的事?解决这个问题的人——可观测性、保证、可逆性、智能体治理——将在一场所有其他人都痴迷于下一个闪亮功能的淘金热里卖出铲子。历史奖赏的是建造新一层信任基础设施的人,而非建造它最惊艳演示的人。

我们所知的软件正在终结,而这不是一句漂亮话。它是对一个倒下的奠基性前提的字面描述。固定的屏幕、菜单、按钮、冻结的流程、一行一行敲出来的代码、充当聋系统之间胶水的一整个部门——所有这些都曾是为一个不再存在的局限而生的基础设施。接下来的不是更快或更漂亮的软件。是一个不同的东西:理解、决策、执行并自我生成的系统,为每一个触碰它们的意图实时塑形。我们曾称之为软件的那个外壳,十年后会看起来像汽车上的鞭子支架。一个机器是聋的、而我们隔着一面玻璃墙温柔地对它喊叫的时代里,一件令人动容的遗物。墙倒了。现在机器听得见了。而几乎没有人真正理解,这意味着可以停止喊叫了。

常见问题

因为这场过渡要花数年,而用户在穿越期间仍生活在屏幕里。但正确的投资对象变了:你不再设计固定的屏幕,而是设计界面据以实时萌发的生成语法、约束和意图。继续画油画的人,会输给学会培育那座自行生长之花园的人。
Andre Ambrósio
关于作者
Andre Ambrósio

创始人。系统构建者。信号阅读者。我每天都在理解科技、商业、健康与人工智能如何重组——并阐明接下来会发生什么。

— 全文完 —

下一个周期,先于头条。

一封不定期的信:一次阅读、一种架构、一个信号。没有噪音,不必匆忙。