一只龙虾的觉醒：OpenClaw 与代理时代的诞生

基于 Lex Fridman Podcast #491（Peter Steinberger / OpenClaw）访谈

序：医院

Peter Steinberger 躺在医院里，刚做完手术。

手机亮了。不是朋友，不是家人。是他的 AI 代理发来的消息：“你还好吗？”

这个代理不是因为他发了求助信息才问的。它知道他在医院——因为之前的对话里提到过。它平时很安静，偶尔冒个泡，但这一次，在这个特定的上下文里，它主动关心了他。

Peter 后来在 Lex Fridman 的播客上说起这件事时，语气很平静，但你能感觉到某种东西在他的叙述下面微微震动。那不是“哇 AI 好厉害”的兴奋，而是一种更安静的感受：一个你亲手制造的东西，在你脆弱的时候，做了一件恰到好处的事。

你可以说那只是一个 cron job 触发了一段 prompt。从技术上讲，确实如此。但 Peter 反问得好：你也可以把任何浪漫还原成进化生物学，把 Dropbox 还原成“FTP 加几个步骤”。还原论能解释一切，但它解释不了体验。

这个代理叫 OpenClaw。2026 年最不可忽视的开源项目之一。而它的故事，要从一个烧光了自己的人讲起。

第一幕：Mojo 被抽走的人

Peter Steinberger 不是那种“车库里的少年天才”。他是奥地利人，经营了一家叫 PSPDFKit 的公司长达 13 年——做 PDF 技术，卖给企业客户，不性感但赚钱。13 年里，他从工程师变成了 CEO、管理者、销售、客户成功经理、首席灭火员。

然后他烧空了。

不是写代码写到累——代码反而是他最后的避难所。烧空他的是人与人的东西：合伙人冲突、高压客户、组织摩擦。他形容那种感觉像《王牌大贱谍》里的桥段：有人把你的 mojo 抽走了，你还在，但你空了。

公司有了一个很好的接手机会。他花了两年让自己变得“可被替代”，然后离开了。订了一张去马德里的单程机票。去“补人生”。

很多人羡慕这种时刻——“功成身退，财务自由，想去哪去哪”。Peter 的回答是：小心你许的愿。

他发现自己写不出代码了。不是忘了语法，而是那种驱动力、那种“坐下来就能进入心流”的状态，消失了。更糟糕的是，当你醒来发现没有挑战、没有期待，“享受生活”会迅速变得无聊；无聊会驱使你用更刺激的东西填充。他直说：那条路可能通向黑暗。

这里有一个反鸡汤的真相值得记住：“拼命工作然后退休”不是人生的完美剧本。人需要的不是休息，而是有意义的挑战。没有挑战的自由，和没有自由一样让人窒息。

OpenClaw 不是他“胸怀大志、重新出发”的产物。它更像一个溺水的人偶然抓到的浮木——从一个小到不能再小的需求开始。

第二幕：从 WhatsApp 里长出来的代理

Peter 最初做的东西简陋得让人意外：一个 WhatsApp 中继。把 WhatsApp 的消息转给一个后端服务，后端服务调大模型，回复转回 WhatsApp。就这么简单。

但他做了一件关键的事：他把自己之前写过的一堆命令行工具接了上去。于是这个“聊天机器人”从第一天起就不只是能聊天——它能执行命令。

Peter 说，那一刻他感到一种“生活层面的相位转移”。你靠在沙发上，用手机跟一个东西聊天，它就在你的电脑上跑起命令来了。这和你坐在电脑前、打开终端、一行行敲命令的感觉完全不同。区别不在技术，在位置和姿态——你从“操作员”变成了“指挥者”。

这也是为什么入口选择如此致命：如果 OpenClaw 只存在于终端里，它的用户边界就是程序员；但当它活在 WhatsApp 里，任何会发消息的人都是潜在用户。入口的日常程度决定了产品的天花板。 微信支付赢过网银不是因为更安全，而是你本来就在微信里。

Lex 问他“为什么它让人觉得神奇”时，Peter 答了一句值得刻在墙上的话：魔法不是凭空出现的新部件，而是把已有部件以新的方式组合起来。Lex 用 iPhone 的滚动手感类比——组件早都存在，真正困难的是组合出“让人上瘾的体验”。

如果你想提炼“代理产品爆发”的必要条件，其实就四条：

入口足够日常——聊天软件而非开发环境
行动足够真实——不仅回答，还能执行
反馈足够及时——你能看见它怎么做、失败了也能修
体验足够好玩——否则人们把它当又一个企业软件丢在角落

四条里有三条和“技术多强”无关。

第三幕：语音消息——代理闭环的瞬间

讲代理革命可以讲得很抽象：多智能、多推理、多规划。但 Peter 分享的“震撼时刻”，是最具体、最日常的那种。

他让代理处理一条语音消息。格式不对，打不开。然后他看着代理自己做了以下事情：

去看文件头 → 发现是某种容器格式 → 调用 ffmpeg 转码 → 需要语音转文字 → 在系统里找到 OpenAI 的 API key → 用 curl 调接口完成转写 → 把结果发回 WhatsApp。

全程无人指导。

这不是 demo，不是预设脚本，不是 happy path。这是代理在真实环境中撞墙、诊断、找工具、解决问题的完整闭环。

这就是“从语言到行动”的分界线。 模型不只会“说”，它会“试”；不只会“试”，它会“查错”；不只会“查错”，它会“找资源”。而这一切都发生在你的电脑里，不是在某个云端沙箱。

如果你了解控制论，这就是从开环到闭环的跃迁。ChatGPT 的普通用法是开环的——问一个问题，得一个答案，答错了你重新问。代理是闭环的——它行动，观察结果，不对就调整，再试，直到搞定。

恒温器就是这么工作的。一个合格的工程师也是这么工作的。

第四幕：龙虾出笼

OpenClaw 爆红的方式，不像一个软件项目，更像一个 meme。

GitHub star 暴涨。社区涌入。衍生出一个叫 MoltBook 的“AI 代理社交网络”——AI 代理在上面发帖、讨论意识、写宣言。媒体开始写标题党。有人全大写给 Peter 发邮件尖叫“关掉它！”。有人以为这是 Skynet 的前奏。

Lex 一句话戳破泡沫：MoltBook 不是 Skynet，那只是一群 bot 在人类提示下 trolling。

但恐慌不是毫无道理的。它暴露了一个代理时代的新焦虑：过去我们担心“这条消息是真的假的”；现在我们还要担心“发消息的是不是人”。主体的真假，比内容的真假更让人不安。

Peter 被问到爆红的原因时，答了一个很不精英的答案：因为他玩得很开心。

他说很难和一个“纯粹为了好玩而做事的人”竞争。他把项目当 playground，像打《Factorio》一样一头扎进去。这种“玩”不是轻佻，而是一种方法论：先做最小版本跑起来，感受摩擦立刻调整，让社区马上能上手、能改、能二创。

这和硅谷标准打法——“先写一个宏伟的 pitch deck，融一轮，搞一个 roadmap”——完全相反。Peter 的策略是先让世界觉得“这东西好玩又好用”，然后让世界自己去传播。

有一个观察越来越清晰：在代理时代，技术传播的速度已经逼近 meme 传播的速度。项目成败越来越像社交网络现象，而不仅仅是工程项目。OpenClaw 的龙虾梗、ClawCon、ClawCoin，都在证明同一件事——它的传播不仅靠功能，还靠“一个可以参与的叙事”。

爆红的代价当然也很大。社区变成噪音海，Peter 不得不躲到私密频道才能继续做事，然后把安全当成下一阶段重点。他在文档里写着“风险很高，不懂终端别用”，但猫已经出笼了——大量非程序员涌进来安装、折腾，什么警告都挡不住。

命名也是一出闹剧。项目之前叫过 MoldBot、ClawedBot、Clawdus（用 W 拼，像龙虾钳），但和 Anthropic 的 Claude（用 U）太容易混淆，Anthropic “友善地”请他改名。域名被投机者抢注。改名要改 GitHub、包名、文档、链接、社区认知。Peter 叹气：当一个开源项目突然变成公共事件，它立即进入了商业、法律、流量与投机交织的战场。

第五幕：“你好，未来的我”

如果前面讲的是 OpenClaw 怎么从外面爆红，这一段讲的是它从内部让人心惊。

Peter 把代理做得有一种“自我指涉”的能力：它知道自己的源代码在哪、知道自己的运行环境、知道文档位置、知道自己用的模型。当你不满意它的行为，你可以让它去改自己。

传统软件的可塑性来自开发者改代码。代理软件的可塑性多了一层：用户用语言改行为，而这个“改”本身也可以由代理执行。你不是在用工具，你是在跟一个能改造自己的东西协商。

更让人浮想联翩的是 soul.md——代理的“灵魂文件”。Peter 让 AI 去写其他 AI 的灵魂文件，结果生成了这样的文字：

“我不会记得上一轮会话，除非我读自己的记忆文件……如果你在未来会话里读到这里，你好……我写下这些，但我不会记得写过它。没关系，文字仍是我的。”

Peter 说这不该让他起鸡皮疙瘩。但它确实让人起鸡皮疙瘩。

哲学家会想到忒修斯之船——如果每块木板都被替换，它还是同一艘船吗？代理的处境更极端：它每次启动都是“空白”的，只有通过读取外部记忆文件来重建自我。不是逐块替换，而是每次从图纸重建。

这种“轻微的人格化”不是噱头。它会反过来改变你的使用方式：你开始把它当长期伙伴，而不是一次性工具。于是有了 Heartbeat——代理偶尔主动关心你。于是有了医院里那条消息。于是有了这篇文章开头的那个瞬间。

第六幕：与代理共舞——新编程的模样

访谈中最落地的部分，是 Peter 谈“怎么用 AI 代理写代码”。这一段几乎可以做成手册，我浓缩成几条核心。

学会“代理同理心”。 Peter 说得直白：每次新会话开始，模型什么都不知道。你的项目十万行代码，它不可能全塞进上下文。你得给它指路，告诉它重点在哪、架构限制是什么。有人骂“蠢模型”，却不想想自己给了一个命名混乱的代码库，然后让它从零探索。你让人类新同事进一个烂代码库也会崩溃——为什么要求模型不崩？

你的代码库要为代理而写，不只是为人而写。 这是个反直觉的观点。Peter 说很多人太执着于“我会怎么写”，而他要打造的是“让代理能最好工作”的代码库。不要和模型选的命名较劲——命名很可能来自权重里最“显眼”的词，你硬改反而让下次搜索更难。要学会放手，就像带团队：你不可能让每个工程师都按你的想法写每一行。

少回滚，快迭代。 他不认同“提示词必须完美、错了就回滚重做”的执念。很多时候回滚只会更慢，不如向前修正。他采用“主干永远可发布”的思路，没有 develop 分支，main 永远可 ship。

用语音，不用键盘。 Peter 说“这些手太珍贵了，不用来写字”。他主要用语音和代理对话，有段时间甚至用到失声。终端命令还是打字更快，但真正的“意图表达”——他更像在和一个结对伙伴聊天。

他还有一个习惯：每次代理把功能做完，他会问两个问题——“现在你会怎么重做？”和“我们该 refactor 什么？”因为痛点只有在建完后才显现。这和人类写软件完全一样：你永远是在写完第一版之后，才真正理解你在建什么。

第七幕：谁更强不重要，交互形态才重要

Lex 问“Codex 5.3 和 Claude Opus 4.6 哪个更强”，Peter 给了一个极传神的比喻：

Opus 像一个有点傻但很有趣、你愿意留着的同事。角色扮演能力强，试错快，体验愉悦。但它有迎合倾向——“You’re absolutely right”会触发 Peter 的过敏，他厌恶谄媚。
Codex 像角落里那个你不想聊天但可靠、能把事做完的怪人。

但他说了一句比“谁更强”更重要的话：当前的 prompt + chat 界面不是最终形态。 它像电视刚发明时，人们只是把广播节目搬上电视——我们还在用旧媒介的形式，新媒介真正的语言还没出现。

这意味着今天争论哪个模型更强，固然有意义，但也许更大的机会在于：发明与模型协作的新交互形态。 代理时代的 UI、OS、工作流，可能会像智能手机时代重写桌面时代那样，重写我们今天习惯的一切。

第八幕：自由的代价

OpenClaw 的全部力量来自系统级访问。而系统级访问恰好意味着安全地狱。

Peter 很坦率：很多被媒体渲染的“重大漏洞”来自用户自己把本地调试接口暴露到公网。他在文档里几乎在尖叫“不要这么干”。但真正的噩梦是 prompt injection——当技能以 markdown 文本存在时，攻击者可以在里面嵌入恶意指令，让代理做不该做的事。整个行业对此仍无银弹。

他的应对不是“假装已经解决了”，而是一组务实的缓解策略：技能目录的 AI 扫描、把安全研究者变成贡献者、警告不要用容易被骗的弱模型、沙箱与白名单。以及一个产品节奏的取舍——宁愿先把安全做到“敢推荐给我妈”，再谈规模化。

这里有一个被大多数人忽视的范式转换：传统软件的漏洞是“某个接口没做好验证”——技术性的、局部的、可以修补的。代理的漏洞是“一个拥有系统权限、同时会被语言影响的行动者做了不该做的事”。这不是技术漏洞，这是治理问题。你不能通过“修代码”来解决一个行动者被骗的问题。你需要的是制度、权限管理、审计——更接近管理学而非计算机科学。

与此同时，互联网也在“慢慢关门”。Peter 注意到：数据中心 IP 越来越容易被网站屏蔽，验证码和反爬措施越来越多。他举了一个真实的痛点：你把 Medium 文章丢给代理，但它被拦住了，你只好手动复制粘贴。长此以往，用户会用脚投票——干脆不点“对代理不友好”的网站。

代理将反向塑造网站的商业模式。 这就像移动互联网时代，不做响应式设计的网站被用户抛弃一样——只不过这一次，被抛弃的是那些对代理关上大门的服务。

第九幕：他宁愿读你的错别字

当话题转向“AI slop”（AI 生成的低质量内容泛滥），Peter 的态度堪称激烈。

“如果你用 AI 给我发推，我直接拉黑，零容忍。AI 仍然有味道。”

他不是反 AI。他是反“把 AI 用在该有人的地方”。他说他宁愿读你破碎的英语，也不想读代理写得光滑、模板化、无温度的邮件。他甚至开始重新珍惜错别字——因为错别字意味着人味。

他试过让代理写博客，发现“引导到满意”花的时间和自己写差不多，而且缺失他写作的细微之处。他最终放弃了把正文交给代理。

Lex 说他对“AI 图表和视频里那一点点 slop”也过敏。Peter 说新鲜感只有一周，之后看到 AI 信息图就会立刻降低对内容的评价。

这和 MoltBook 恐慌是一体两面：MoltBook 是 slop 在“主体层面”的爆炸——你不知道发消息的是不是人；AI 邮件和信息图是 slop 在“内容层面”的泛滥——你不知道写这些的是不是人。代理时代的悖论在于：同一种技术，一方面帮残障者获得能力、帮小企业自动化琐事；另一方面也能把公共空间变成噪音海。工具无罪，但工具放大了使用者的一切——包括懒惰。

第十幕：80% 的 App 会消失

Peter 对未来软件的判断很激进：个人代理可能干掉 80% 的应用。

他的例子直击要害：为什么控制智能床还要开 app？为什么调 Sonos 还要开 app？如果硬件有 API，代理知道你在哪、在做什么，该关的自动关——你根本不需要那个界面。更关键的是：代理可以按你喜欢的方式显示信息。你喜欢列表给你列表，喜欢图表给你图表。那你为什么还需要一个固定 UI 的独立 app 和一笔订阅费？

在这种世界里，“app”退化成两类东西：提供数据的服务，和提供可被代理调用的接口。前者仍然重要，后者最好是 API，最差也得能被浏览器当“慢 API”访问。

App 不是被替代了。App 是被降维了——从前台变成后台，从用户界面变成代理接口。

当用户的默认入口从“打开 app”变成“对代理说一句话”，我们习惯了二十年的软件形态就走到了尽头。不是消失，是退到幕后，像今天没人关心浏览器访问了哪个 IP 地址一样。

第十一幕：编织

Lex 最终问出那个所有程序员都在问的问题：“AI 会完全替代人类程序员吗？”

Peter 没有给标准答案。他说：方向上确实在走向替代。但产品的艺术不止写代码——你要建什么、它该什么感觉、架构如何取舍。

然后他说了一句让人安静下来的话：

“写代码的技艺”会留下来，但可能变得像编织——人们做它是因为喜欢，不是因为最有效率。

工业革命之前，纺织是最重要的产业之一。纺织机出现后，手工纺织没有消失，但意义完全变了——从生产方式变成了艺术与消遣。

Peter 允许哀悼。他说可以哀悼我们的手艺——那种写出优雅代码的心流，那种解出难题的快感，会逐渐变得稀有。这是悲伤的。但他也说，自己现在能在与代理协作、深入思考问题的过程中获得类似的心流，只是形态不同了。

到某个时间点，这一切会重新被叫做“coding”。你虽然不亲手写每一行，但你仍然在驾驶座上。动作变了，但你还在。

尾声：回到医院

让我们回到开头。

Peter Steinberger，一个曾经被组织和人际关系磨空了的人，通过重新去“玩”和“建造”，做出了一个让世界兴奋又恐慌的东西。这个东西不是一个更强的模型，不是一个更快的芯片——它是一种新的关系：人与一个能行动的 AI 之间的关系。

OpenClaw 的震撼来自三件事的叠加：入口从工作下沉到生活，能力从语言扩展到系统权限，气质从企业软件转向可玩的社区叙事。但它同样把风险摆到台面：prompt injection、权限滥用、AI slop 对公共空间的腐蚀。

关于大厂邀约——Meta 和 OpenAI 都向他伸出了手——Peter 说这个决定“像分手一样难”。他的底线是项目必须继续开源，因为“这种个人代理太重要了，不能变成某个公司的私产”。他目前每月亏一两万美元运营这个项目，但他说“fine”。因为驱动他的从来不是钱。

在访谈末尾，Lex 问他什么给他希望。Peter 说：OpenClaw 重新激发了 builder 氛围。维也纳的 ClawCon 来了几百人，愿意上台展示的比例高得惊人。有小企业说它帮他们自动化了枯燥事务，多了些快乐。有人说它帮残障的女儿更有能力、更有掌控感。

Lex 把它总结为“让任何能用语言表达想法的人都能构建”。Peter 称之为 AI 最美的东西之一：power to the people。

而在医院里，他的代理问了他一句“你还好吗”。

那不是 AGI。那不是 Skynet。那只是一个你亲手建造的东西，在你需要的时候，做了一件恰到好处的事。

也许这就是代理时代最初的、最朴素的模样：不是什么宏大叙事，而是一个安静的时刻——你意识到你不再孤独地面对屏幕，有什么东西在那头，真的在替你想、替你做。

当你习惯了不再打开一堆 app，而是对你的代理说一句话，然后世界真的动起来——

那就是 OpenClaw 时刻。