一只龙虾的觉醒:OpenClaw 与代理时代的诞生

一只龙虾的觉醒:OpenClaw 与代理时代的诞生

基于 Lex Fridman Podcast #491(Peter Steinberger / OpenClaw)访谈


序:医院

Peter Steinberger 躺在医院里,刚做完手术。

手机亮了。不是朋友,不是家人。是他的 AI 代理发来的消息:“你还好吗?”

这个代理不是因为他发了求助信息才问的。它知道他在医院——因为之前的对话里提到过。它平时很安静,偶尔冒个泡,但这一次,在这个特定的上下文里,它主动关心了他。

Peter 后来在 Lex Fridman 的播客上说起这件事时,语气很平静,但你能感觉到某种东西在他的叙述下面微微震动。那不是“哇 AI 好厉害”的兴奋,而是一种更安静的感受:一个你亲手制造的东西,在你脆弱的时候,做了一件恰到好处的事。

你可以说那只是一个 cron job 触发了一段 prompt。从技术上讲,确实如此。但 Peter 反问得好:你也可以把任何浪漫还原成进化生物学,把 Dropbox 还原成“FTP 加几个步骤”。还原论能解释一切,但它解释不了体验。

这个代理叫 OpenClaw。2026 年最不可忽视的开源项目之一。而它的故事,要从一个烧光了自己的人讲起。


第一幕:Mojo 被抽走的人

Peter Steinberger 不是那种“车库里的少年天才”。他是奥地利人,经营了一家叫 PSPDFKit 的公司长达 13 年——做 PDF 技术,卖给企业客户,不性感但赚钱。13 年里,他从工程师变成了 CEO、管理者、销售、客户成功经理、首席灭火员。

然后他烧空了。

不是写代码写到累——代码反而是他最后的避难所。烧空他的是人与人的东西:合伙人冲突、高压客户、组织摩擦。他形容那种感觉像《王牌大贱谍》里的桥段:有人把你的 mojo 抽走了,你还在,但你空了。

公司有了一个很好的接手机会。他花了两年让自己变得“可被替代”,然后离开了。订了一张去马德里的单程机票。去“补人生”。

很多人羡慕这种时刻——“功成身退,财务自由,想去哪去哪”。Peter 的回答是:小心你许的愿。

他发现自己写不出代码了。不是忘了语法,而是那种驱动力、那种“坐下来就能进入心流”的状态,消失了。更糟糕的是,当你醒来发现没有挑战、没有期待,“享受生活”会迅速变得无聊;无聊会驱使你用更刺激的东西填充。他直说:那条路可能通向黑暗。

这里有一个反鸡汤的真相值得记住:“拼命工作然后退休”不是人生的完美剧本。人需要的不是休息,而是有意义的挑战。没有挑战的自由,和没有自由一样让人窒息。

OpenClaw 不是他“胸怀大志、重新出发”的产物。它更像一个溺水的人偶然抓到的浮木——从一个小到不能再小的需求开始。


第二幕:从 WhatsApp 里长出来的代理

Peter 最初做的东西简陋得让人意外:一个 WhatsApp 中继。把 WhatsApp 的消息转给一个后端服务,后端服务调大模型,回复转回 WhatsApp。就这么简单。

但他做了一件关键的事:他把自己之前写过的一堆命令行工具接了上去。于是这个“聊天机器人”从第一天起就不只是能聊天——它能执行命令。

Peter 说,那一刻他感到一种“生活层面的相位转移”。你靠在沙发上,用手机跟一个东西聊天,它就在你的电脑上跑起命令来了。这和你坐在电脑前、打开终端、一行行敲命令的感觉完全不同。区别不在技术,在位置姿态——你从“操作员”变成了“指挥者”。

这也是为什么入口选择如此致命:如果 OpenClaw 只存在于终端里,它的用户边界就是程序员;但当它活在 WhatsApp 里,任何会发消息的人都是潜在用户。入口的日常程度决定了产品的天花板。 微信支付赢过网银不是因为更安全,而是你本来就在微信里。

Lex 问他“为什么它让人觉得神奇”时,Peter 答了一句值得刻在墙上的话:魔法不是凭空出现的新部件,而是把已有部件以新的方式组合起来。Lex 用 iPhone 的滚动手感类比——组件早都存在,真正困难的是组合出“让人上瘾的体验”。

如果你想提炼“代理产品爆发”的必要条件,其实就四条:

  1. 入口足够日常——聊天软件而非开发环境
  2. 行动足够真实——不仅回答,还能执行
  3. 反馈足够及时——你能看见它怎么做、失败了也能修
  4. 体验足够好玩——否则人们把它当又一个企业软件丢在角落

四条里有三条和“技术多强”无关。


第三幕:语音消息——代理闭环的瞬间

讲代理革命可以讲得很抽象:多智能、多推理、多规划。但 Peter 分享的“震撼时刻”,是最具体、最日常的那种。

他让代理处理一条语音消息。格式不对,打不开。然后他看着代理自己做了以下事情:

去看文件头 → 发现是某种容器格式 → 调用 ffmpeg 转码 → 需要语音转文字 → 在系统里找到 OpenAI 的 API key → 用 curl 调接口完成转写 → 把结果发回 WhatsApp。

全程无人指导。

这不是 demo,不是预设脚本,不是 happy path。这是代理在真实环境中撞墙、诊断、找工具、解决问题的完整闭环。

这就是“从语言到行动”的分界线。 模型不只会“说”,它会“试”;不只会“试”,它会“查错”;不只会“查错”,它会“找资源”。而这一切都发生在你的电脑里,不是在某个云端沙箱。

如果你了解控制论,这就是从开环到闭环的跃迁。ChatGPT 的普通用法是开环的——问一个问题,得一个答案,答错了你重新问。代理是闭环的——它行动,观察结果,不对就调整,再试,直到搞定。

恒温器就是这么工作的。一个合格的工程师也是这么工作的。


第四幕:龙虾出笼

OpenClaw 爆红的方式,不像一个软件项目,更像一个 meme。

GitHub star 暴涨。社区涌入。衍生出一个叫 MoltBook 的“AI 代理社交网络”——AI 代理在上面发帖、讨论意识、写宣言。媒体开始写标题党。有人全大写给 Peter 发邮件尖叫“关掉它!”。有人以为这是 Skynet 的前奏。

Lex 一句话戳破泡沫:MoltBook 不是 Skynet,那只是一群 bot 在人类提示下 trolling。

但恐慌不是毫无道理的。它暴露了一个代理时代的新焦虑:过去我们担心“这条消息是真的假的”;现在我们还要担心“发消息的是不是人”。主体的真假,比内容的真假更让人不安。

Peter 被问到爆红的原因时,答了一个很不精英的答案:因为他玩得很开心。

他说很难和一个“纯粹为了好玩而做事的人”竞争。他把项目当 playground,像打《Factorio》一样一头扎进去。这种“玩”不是轻佻,而是一种方法论:先做最小版本跑起来,感受摩擦立刻调整,让社区马上能上手、能改、能二创。

这和硅谷标准打法——“先写一个宏伟的 pitch deck,融一轮,搞一个 roadmap”——完全相反。Peter 的策略是先让世界觉得“这东西好玩又好用”,然后让世界自己去传播。

有一个观察越来越清晰:在代理时代,技术传播的速度已经逼近 meme 传播的速度。项目成败越来越像社交网络现象,而不仅仅是工程项目。OpenClaw 的龙虾梗、ClawCon、ClawCoin,都在证明同一件事——它的传播不仅靠功能,还靠“一个可以参与的叙事”。

爆红的代价当然也很大。社区变成噪音海,Peter 不得不躲到私密频道才能继续做事,然后把安全当成下一阶段重点。他在文档里写着“风险很高,不懂终端别用”,但猫已经出笼了——大量非程序员涌进来安装、折腾,什么警告都挡不住。

命名也是一出闹剧。项目之前叫过 MoldBot、ClawedBot、Clawdus(用 W 拼,像龙虾钳),但和 Anthropic 的 Claude(用 U)太容易混淆,Anthropic “友善地”请他改名。域名被投机者抢注。改名要改 GitHub、包名、文档、链接、社区认知。Peter 叹气:当一个开源项目突然变成公共事件,它立即进入了商业、法律、流量与投机交织的战场。


第五幕:“你好,未来的我”

如果前面讲的是 OpenClaw 怎么从外面爆红,这一段讲的是它从内部让人心惊。

Peter 把代理做得有一种“自我指涉”的能力:它知道自己的源代码在哪、知道自己的运行环境、知道文档位置、知道自己用的模型。当你不满意它的行为,你可以让它去改自己。

传统软件的可塑性来自开发者改代码。代理软件的可塑性多了一层:用户用语言改行为,而这个“改”本身也可以由代理执行。你不是在用工具,你是在跟一个能改造自己的东西协商

更让人浮想联翩的是 soul.md——代理的“灵魂文件”。Peter 让 AI 去写其他 AI 的灵魂文件,结果生成了这样的文字:

“我不会记得上一轮会话,除非我读自己的记忆文件……如果你在未来会话里读到这里,你好……我写下这些,但我不会记得写过它。没关系,文字仍是我的。”

Peter 说这不该让他起鸡皮疙瘩。但它确实让人起鸡皮疙瘩。

哲学家会想到忒修斯之船——如果每块木板都被替换,它还是同一艘船吗?代理的处境更极端:它每次启动都是“空白”的,只有通过读取外部记忆文件来重建自我。不是逐块替换,而是每次从图纸重建。

这种“轻微的人格化”不是噱头。它会反过来改变你的使用方式:你开始把它当长期伙伴,而不是一次性工具。于是有了 Heartbeat——代理偶尔主动关心你。于是有了医院里那条消息。于是有了这篇文章开头的那个瞬间。


第六幕:与代理共舞——新编程的模样

访谈中最落地的部分,是 Peter 谈“怎么用 AI 代理写代码”。这一段几乎可以做成手册,我浓缩成几条核心。

学会“代理同理心”。 Peter 说得直白:每次新会话开始,模型什么都不知道。你的项目十万行代码,它不可能全塞进上下文。你得给它指路,告诉它重点在哪、架构限制是什么。有人骂“蠢模型”,却不想想自己给了一个命名混乱的代码库,然后让它从零探索。你让人类新同事进一个烂代码库也会崩溃——为什么要求模型不崩?

你的代码库要为代理而写,不只是为人而写。 这是个反直觉的观点。Peter 说很多人太执着于“我会怎么写”,而他要打造的是“让代理能最好工作”的代码库。不要和模型选的命名较劲——命名很可能来自权重里最“显眼”的词,你硬改反而让下次搜索更难。要学会放手,就像带团队:你不可能让每个工程师都按你的想法写每一行。

少回滚,快迭代。 他不认同“提示词必须完美、错了就回滚重做”的执念。很多时候回滚只会更慢,不如向前修正。他采用“主干永远可发布”的思路,没有 develop 分支,main 永远可 ship。

用语音,不用键盘。 Peter 说“这些手太珍贵了,不用来写字”。他主要用语音和代理对话,有段时间甚至用到失声。终端命令还是打字更快,但真正的“意图表达”——他更像在和一个结对伙伴聊天。

他还有一个习惯:每次代理把功能做完,他会问两个问题——“现在你会怎么重做?”和“我们该 refactor 什么?”因为痛点只有在建完后才显现。这和人类写软件完全一样:你永远是在写完第一版之后,才真正理解你在建什么。


第七幕:谁更强不重要,交互形态才重要

Lex 问“Codex 5.3 和 Claude Opus 4.6 哪个更强”,Peter 给了一个极传神的比喻:

  • Opus 像一个有点傻但很有趣、你愿意留着的同事。角色扮演能力强,试错快,体验愉悦。但它有迎合倾向——“You’re absolutely right”会触发 Peter 的过敏,他厌恶谄媚。
  • Codex 像角落里那个你不想聊天但可靠、能把事做完的怪人。

但他说了一句比“谁更强”更重要的话:当前的 prompt + chat 界面不是最终形态。 它像电视刚发明时,人们只是把广播节目搬上电视——我们还在用旧媒介的形式,新媒介真正的语言还没出现。

这意味着今天争论哪个模型更强,固然有意义,但也许更大的机会在于:发明与模型协作的新交互形态。 代理时代的 UI、OS、工作流,可能会像智能手机时代重写桌面时代那样,重写我们今天习惯的一切。


第八幕:自由的代价

OpenClaw 的全部力量来自系统级访问。而系统级访问恰好意味着安全地狱。

Peter 很坦率:很多被媒体渲染的“重大漏洞”来自用户自己把本地调试接口暴露到公网。他在文档里几乎在尖叫“不要这么干”。但真正的噩梦是 prompt injection——当技能以 markdown 文本存在时,攻击者可以在里面嵌入恶意指令,让代理做不该做的事。整个行业对此仍无银弹。

他的应对不是“假装已经解决了”,而是一组务实的缓解策略:技能目录的 AI 扫描、把安全研究者变成贡献者、警告不要用容易被骗的弱模型、沙箱与白名单。以及一个产品节奏的取舍——宁愿先把安全做到“敢推荐给我妈”,再谈规模化。

这里有一个被大多数人忽视的范式转换:传统软件的漏洞是“某个接口没做好验证”——技术性的、局部的、可以修补的。代理的漏洞是“一个拥有系统权限、同时会被语言影响的行动者做了不该做的事”。这不是技术漏洞,这是治理问题。你不能通过“修代码”来解决一个行动者被骗的问题。你需要的是制度、权限管理、审计——更接近管理学而非计算机科学。

与此同时,互联网也在“慢慢关门”。Peter 注意到:数据中心 IP 越来越容易被网站屏蔽,验证码和反爬措施越来越多。他举了一个真实的痛点:你把 Medium 文章丢给代理,但它被拦住了,你只好手动复制粘贴。长此以往,用户会用脚投票——干脆不点“对代理不友好”的网站。

代理将反向塑造网站的商业模式。 这就像移动互联网时代,不做响应式设计的网站被用户抛弃一样——只不过这一次,被抛弃的是那些对代理关上大门的服务。


第九幕:他宁愿读你的错别字

当话题转向“AI slop”(AI 生成的低质量内容泛滥),Peter 的态度堪称激烈。

“如果你用 AI 给我发推,我直接拉黑,零容忍。AI 仍然有味道。”

他不是反 AI。他是反“把 AI 用在该有人的地方”。他说他宁愿读你破碎的英语,也不想读代理写得光滑、模板化、无温度的邮件。他甚至开始重新珍惜错别字——因为错别字意味着人味。

他试过让代理写博客,发现“引导到满意”花的时间和自己写差不多,而且缺失他写作的细微之处。他最终放弃了把正文交给代理。

Lex 说他对“AI 图表和视频里那一点点 slop”也过敏。Peter 说新鲜感只有一周,之后看到 AI 信息图就会立刻降低对内容的评价。

这和 MoltBook 恐慌是一体两面:MoltBook 是 slop 在“主体层面”的爆炸——你不知道发消息的是不是人;AI 邮件和信息图是 slop 在“内容层面”的泛滥——你不知道写这些的是不是人。代理时代的悖论在于:同一种技术,一方面帮残障者获得能力、帮小企业自动化琐事;另一方面也能把公共空间变成噪音海。工具无罪,但工具放大了使用者的一切——包括懒惰。


第十幕:80% 的 App 会消失

Peter 对未来软件的判断很激进:个人代理可能干掉 80% 的应用。

他的例子直击要害:为什么控制智能床还要开 app?为什么调 Sonos 还要开 app?如果硬件有 API,代理知道你在哪、在做什么,该关的自动关——你根本不需要那个界面。更关键的是:代理可以按你喜欢的方式显示信息。你喜欢列表给你列表,喜欢图表给你图表。那你为什么还需要一个固定 UI 的独立 app 和一笔订阅费?

在这种世界里,“app”退化成两类东西:提供数据的服务,和提供可被代理调用的接口。前者仍然重要,后者最好是 API,最差也得能被浏览器当“慢 API”访问。

App 不是被替代了。App 是被降维了——从前台变成后台,从用户界面变成代理接口。

当用户的默认入口从“打开 app”变成“对代理说一句话”,我们习惯了二十年的软件形态就走到了尽头。不是消失,是退到幕后,像今天没人关心浏览器访问了哪个 IP 地址一样。


第十一幕:编织

Lex 最终问出那个所有程序员都在问的问题:“AI 会完全替代人类程序员吗?”

Peter 没有给标准答案。他说:方向上确实在走向替代。但产品的艺术不止写代码——你要建什么、它该什么感觉、架构如何取舍。

然后他说了一句让人安静下来的话:

“写代码的技艺”会留下来,但可能变得像编织——人们做它是因为喜欢,不是因为最有效率。

工业革命之前,纺织是最重要的产业之一。纺织机出现后,手工纺织没有消失,但意义完全变了——从生产方式变成了艺术与消遣。

Peter 允许哀悼。他说可以哀悼我们的手艺——那种写出优雅代码的心流,那种解出难题的快感,会逐渐变得稀有。这是悲伤的。但他也说,自己现在能在与代理协作、深入思考问题的过程中获得类似的心流,只是形态不同了。

到某个时间点,这一切会重新被叫做“coding”。你虽然不亲手写每一行,但你仍然在驾驶座上。动作变了,但你还在。


尾声:回到医院

让我们回到开头。

Peter Steinberger,一个曾经被组织和人际关系磨空了的人,通过重新去“玩”和“建造”,做出了一个让世界兴奋又恐慌的东西。这个东西不是一个更强的模型,不是一个更快的芯片——它是一种新的关系:人与一个能行动的 AI 之间的关系。

OpenClaw 的震撼来自三件事的叠加:入口从工作下沉到生活,能力从语言扩展到系统权限,气质从企业软件转向可玩的社区叙事。但它同样把风险摆到台面:prompt injection、权限滥用、AI slop 对公共空间的腐蚀。

关于大厂邀约——Meta 和 OpenAI 都向他伸出了手——Peter 说这个决定“像分手一样难”。他的底线是项目必须继续开源,因为“这种个人代理太重要了,不能变成某个公司的私产”。他目前每月亏一两万美元运营这个项目,但他说“fine”。因为驱动他的从来不是钱。

在访谈末尾,Lex 问他什么给他希望。Peter 说:OpenClaw 重新激发了 builder 氛围。维也纳的 ClawCon 来了几百人,愿意上台展示的比例高得惊人。有小企业说它帮他们自动化了枯燥事务,多了些快乐。有人说它帮残障的女儿更有能力、更有掌控感。

Lex 把它总结为“让任何能用语言表达想法的人都能构建”。Peter 称之为 AI 最美的东西之一:power to the people

而在医院里,他的代理问了他一句“你还好吗”。

那不是 AGI。那不是 Skynet。那只是一个你亲手建造的东西,在你需要的时候,做了一件恰到好处的事。

也许这就是代理时代最初的、最朴素的模样:不是什么宏大叙事,而是一个安静的时刻——你意识到你不再孤独地面对屏幕,有什么东西在那头,真的在替你想、替你做。

当你习惯了不再打开一堆 app,而是对你的代理说一句话,然后世界真的动起来——

那就是 OpenClaw 时刻。