从 Prompt 到 Loop:AI 时代,最重要的能力是创造创造机器(万维钢取向版)

从 Prompt 到 Loop:AI 时代,最重要的能力是创造创造机器

一、一个从“怎么用 AI”长出来的大问题

我们先从一个具体得不能再具体的场景说起。

有个人在用 AI 做量化:让模型写策略代码,跑回测,看收益和回撤,接下来还打算接模拟盘、实盘。他同时还用 AI 做另一件事:让模型去网上翻热门网文,总结里面反复出现的桥段和情绪套路,再拿这些总结去指导新的小说创作。

然后他问了一个看起来很技术的问题:这算不算一种 loop?

这个问题的有趣之处在于,它看上去是在问工具的用法,其实问的是一件大得多的事。因为当你把“量化”和“网文”这两件八竿子打不着的事情摆在一起,发现它们的骨架居然一模一样时,你就已经不是在讨论工具了,你是在讨论一种新的做事方式。

这种做事方式,正在悄悄改变人和机器的关系:从“我发指令、你交结果”,转向“我搭一个能持续试错、持续验证、持续进化的系统”。

这就是今天想跟你展开的核心命题。为了讲清楚它,我们需要先把 AI 的使用方式,拆成三个台阶。

二、三个台阶:prompt、harness、loop

第一个台阶,叫 prompt

你对 AI 说一句话,它给你一段代码、一篇文章、一份报告、一个方案。人是甲方,AI 是乙方。你提需求,它交活儿。这是绝大多数人今天使用 AI 的方式,也是最直觉的方式。

第二个台阶,叫 harness(可以理解成“驾驭工程”或者“工作台工程”)。

到这一步,你不再只给一句话。你给 AI 边界、上下文、工具、数据、测试和评价标准。你不是让它自由发挥,而是给它一个受控环境,让它在限定范围里做事。这个台阶的关键,不是“把 prompt 写得更漂亮”,而是“让 AI 在一个可校验、可追溯、可重复的环境里工作”。

第三个台阶,叫 loop

到这一步,AI 不再只是完成一个任务,而是进入一个循环:提出假设,执行实验,拿到反馈,修正方案,再来一遍。而人呢,既不只是发需求的甲方,也不只是搭工作台的工程师,人开始负责方向、判断、标准、停止条件——还有最要命的一样东西:价值函数。

如果一定要用一句话把这三个台阶串起来,我会这样说:

Prompt,是发明一个答案

Harness,是发明一个工作台

Loop,是发明一个生产系统

而当你把这条路走到尽头,你会发现自己在做的事,其实是发明一个能不断发明东西的东西

划重点:这三个台阶不是“新的替代旧的”,而是层层嵌套。没有 harness 的 loop 会失控,没有 loop 的 harness 只是个更讲究的工具。

三、这就像一个人从学生长成 PI

三个台阶听着抽象,我给你换一个更有画面感的类比:一个人在科研体系里的成长。

学生阶段。 别人给你题目,给你步骤,给你实验 protocol,你负责执行。老师说今天测这个指标,你就去测;老板说这段代码要改,你就去改。这个阶段最值钱的能力是执行力。

对应到 AI,这就是 prompt:一个明确任务,一个结果。

研究生阶段。 情况变复杂了。你不再只是照做,你开始会设计实验条件、控制变量、调参数、判断数据有没有意义。但你通常还在一个既定方向里活动——课题组定了大方向,导师画了边界,你在边界里探索局部的可能性。

对应到 AI,这就是 harness:你给它数据接口、测试脚本、验收标准、代码规范、运行边界,让它在一个受控环境里行动。

PI(实验室负责人)阶段。 角色又变了。你不再亲手做每个实验,你要决定的是:什么问题值得研究,哪些方向值得押注,哪些结果说明路线有戏,哪些结果只是噪音。你配置资源,设计研究组合,判断什么时候继续、什么时候转向、什么时候干脆停手。

这就是 loop。

我想强调一件容易被忽略的事:一个好的 loop,本质上是一个研究计划,而不是一段自动化脚本。它有假设,有实验,有反馈,有记忆,还有淘汰机制。它衡量成败的方式,也和自动化完全不同。

自动化问的是:今天跑通了吗?

研究问的是:这一轮,让我更接近真相了吗?

四、真正可怕的不是失败,是无法归因的失败

科研圈有一句很朴素的经验:不要怕实验失败,要怕不知道它为什么失败。

一个实验没跑出预期结果,可能是理论假设错了,可能是实验条件不对,可能是样本太小,可能是测量工具有问题,可能只是数据处理时出了个 bug。失败本身不丢人,无法归因的失败才是纯粹的浪费——因为它什么信息都没留下。

AI loop 完全遵循同一条规律。

拿量化举例。一个策略回测不好,并不自动证明这个思路无效。它可能是交易成本吃掉了收益,可能是信号半衰期太短,可能是样本外的市场环境变了,可能是因子暴露没有中性化,也可能是代码里藏了一个 look-ahead bias(用到了未来数据)。

所以真正重要的问题从来不是“这一轮有没有赚钱”,而是“这一轮有没有让我搞清楚点什么”。

这正是 loop 和“AI 帮我干活”的分水岭。前者把每一次失败都变成信息,后者只是把失败重复得更快而已。

划重点:判断一个 loop 有没有价值,别看它某一次的产出多漂亮,看它每一轮失败是否产生了可以复用的信息。

五、loop 的本质不是自动化,而是学习

很多人一听 loop,脑子里立刻蹦出来的词是“自动化”。

自动跑脚本,自动生成内容,自动发邮件,自动下单,自动发文章。这当然是 loop 的一部分,但绝不是最要紧的部分。

我们把话说得再直白一点:真正的 loop,不是让机器自己转起来,而是让系统每转一圈都变聪明一点点

如果一个系统每天生成一堆策略、写一堆文章、发一堆内容,却不留下任何判断,不更新任何假设,不淘汰任何错误,不改进任何标准——那它不是 loop,它是一台自动化的噪音制造机。它甚至比手工还危险,因为它把无效劳动的规模放大了。

那么,一个真正会学习的 loop,需要哪些零件?我把它拆成六个。

假设。 你得知道自己在测什么。量化里,是“某个市场结构里存在可捕捉的行为偏差”;写作里,是“某种桥段能引发读者的期待与释放”;产品里,是“某个功能能解决用户的真实痛点”。没有假设的循环,只是在瞎忙。

实验。 这一环恰恰是 AI 最擅长的。写代码、跑数据、生成变体、整理文献、模拟用户、批量造测试用例——实验的成本被 AI 压到了地板价。这是这个时代最大的变量。

测量。 没有测量,实验就只是“行动”。量化要看收益、回撤、夏普、换手、样本外表现;网文要看读者是否读得下去、爽点是否成立、人物是否可信、章节钩子是否勾人;软件要看测试、性能、错误率、用户路径。

解释。 测量告诉你“发生了什么”,解释告诉你“为什么”。很多 loop 死在这一环:不是没有数据,而是数据没有被翻译成理解。

更新。 更新可以是改 prompt、改规则、改数据、改测试、改选题、换模型、调工作流。请记住一件反直觉的事——真正的进步不体现在结果里,而体现在系统结构的更新里

停止标准。 什么时候继续,什么时候转向,什么时候承认方向错了。这一条最容易被忽略,却极其关键。没有停止标准的 loop,会平滑地滑进沉没成本的黑洞:越投入越舍不得,越舍不得越投入。

这六件事加在一起,才配叫“学习”。

所以,如果非要给 loop 一个更准确的定义,我不会说它是 automation(自动化),我会说它是 learning system(学习系统)。AI 让做实验变得极其便宜,但实验本身不会自动长出智慧。智慧来自选择、解释和积累——而这三样,目前主要还得靠人。

六、AI loop 干的是同一件事:把不确定性变成可学习过程

现在我们可以给这一整套东西提炼一个更硬核的说法了。

AI loop 的本质,不是把确定的事做得更快,而是把不确定的事变成一个可以学习的过程

这句话值得咀嚼一下。

传统的自动化,处理的是确定性问题:流程你已经想清楚了,只是不想自己手动重复,于是交给机器。它的前提是“我知道怎么做,只是懒得做”。

而 loop 处理的是不确定性问题:“我还不知道怎么做,我甚至不确定这条路通不通。”面对这种问题,你没法一步到位地“自动化”它,因为你连正确答案是什么都不知道。你能做的,是把它拆成一轮一轮的猜测与验证,让每一轮都逼近答案多一点。

量化本质上是在赌一个你并不确定的市场规律;网文本质上是在赌一个你并不确定的读者反应;创业本质上是在赌一个你并不确定的市场需求。这些事的共同点是:你无法用聪明一次性想明白,只能用循环一点点试明白。

这里有一个很容易被忽略的推论:既然答案是试出来的,那么“试一次的成本”,就直接决定了你到底能走多远。

举个例子。一个策略假设,如果验证它需要你亲手写三天代码、手动下载数据、逐行调试,那么你一年最多也就试个几十次,其中大部分精力还耗在了“把实验跑起来”上,而不是“想清楚这次到底学到了什么”。可一旦 AI 把“跑起来”这件事压到几分钟,你一天就能试几十次。试错的密度提高一个数量级,你能探到的可能性空间,就完全是另一个量级。

换句话说,AI 没有让不确定的事变确定,它让你买得起更多次面对不确定的机会。这才是它真正改变游戏的地方。过去很多好想法之所以没被验证,不是因为它们错,而是因为验证它们太贵,贵到根本轮不到被认真对待。

AI 的真正价值,不是替你把已知的事做完,而是让你在未知的事上,能承受得起大规模、高密度、低成本的试错。

理解了这一层,你对“AI 会不会取代人”这个问题的答案也会变。因为真正在被改变的,不是“谁来执行”,而是“人类第一次有能力,把不确定性当成一门可以系统经营的生意”。

七、为什么 harness 是 loop 的地基

在往下走之前,我想专门停一停,说清楚一件很多人会跳过、但一跳过就要吃大亏的事:harness 不是 loop 的初级阶段,而是 loop 的前提

我们不妨把三个台阶各自最操心的事,写成三个不同的问题。

Prompt 阶段,人操心的是“怎么说”——我该怎么问,才能让 AI 给我一个好答案?

Harness 阶段,人操心的是“怎么约束”——我该给 AI 什么工具、什么上下文、什么限制、什么测试,才能让它稳定地产出可用的结果?

Loop 阶段,人操心的是“怎么进化”——我该怎么搭一个系统,让 AI 的每一轮产出都能被验证、被选择、被记住,并推动下一轮变得更好?

这三个问题一层叠一层,缺了中间那层,整座楼就是危楼。

为什么?因为没有 harness 的 loop,是这个时代最危险的东西之一

想想看:loop 的核心特征,是“高速地转圈”。而 AI 的生成速度又快得吓人。这两件事叠加在一起,意味着一旦方向错了,你的系统不是慢慢犯错,而是在高速地、批量地、不知疲倦地制造错误。它会用它全部的效率,把一个错误的假设放大成一场灾难,等你回过神来,可能已经在错误的地基上盖了二十层楼。

harness 就是那套防止你在错误地基上狂盖楼的东西:边界、测试、版本控制、指标定义、回滚机制、记忆系统。它给这台高速运转的机器装上刹车、装上仪表盘、装上安全带。

所以,如果说 prompt 是给 AI 一个任务,harness 是给 AI 一套制度,那么 loop,是在这套制度之上,再给 AI 施加进化压力。

划重点:先有可校验的环境,再谈可进化的循环。跳过 harness 直接冲 loop,等于给一辆没有刹车的车装上更大的引擎。

八、发明一个会发明东西的东西

聊到这里,一个更大的类比冒出来了:企业。

有一种被反复转述的说法:苹果最伟大的产品,不是 iMac,不是 iPod,也不是 iPhone,而是苹果公司本身。这句话真正厉害的地方,是它把两样东西干净利落地分开了——“产品”,和“生产产品的系统”。

iPhone 是一个产品,它会过时。

苹果公司是一台能持续造出新产品的机器,它可以一代一代往下走。

我们不妨把创造分成几个层级。

一阶创造,是做出一个东西。

二阶创造,是做出一个“能不断做出东西”的东西。

三阶创造,是做出一个“能不断改进自己创造能力”的东西。

AI loop 正在把普通个人,第一次推向二阶创造,甚至隐约摸到三阶创造的门槛。

你不是让 AI 写一个策略,你是在建一个能持续发现、验证、淘汰策略的系统。

你不是让 AI 写一篇小说,你是在建一个能持续提炼桥段、生成变体、吸收反馈、更新写法的系统。

你不是让 AI 写一个功能,你是在建一个能持续理解需求、生成方案、跑测试、修缺陷、沉淀规则的软件生产系统。

这就是“发明一个会发明东西的东西”。

而这,恰恰也是企业的本质。一家好企业,从来不是人、钱、办公室和流程的机械堆叠。它是一个有方向、有反馈、有记忆、有选择机制的创造系统:吸收资源,提出假设,做实验,淘汰错误,放大正确,形成文化,积累能力,然后源源不断地吐出新东西。

划重点:过去,“拥有一个组织”是极少数人的特权,因为它需要很多人、很多钱、很多协调。AI 把这个门槛砸掉了一大块——一个人,现在也能拥有一个组织的骨架。

九、一个人,一个微型公司

请注意,我不是在说“一个人就能取代所有组织”。这是一句会被现实狠狠打脸的大话。

现实世界里的销售、融资、法律责任、客户关系、线下交付、复杂的人际协作,仍然需要真实的人和真实的组织。这些没那么快被替代,也不该被轻率地替代。

但是,在知识生产、软件生产、内容生产、策略研究这些可以被高度符号化的领域,情况确实变了。一个人现在可以用 AI、代码、数据、自动化、知识库和发布系统,搭出一个微型实验室、一个微型媒体公司、一个微型量化团队、一个微型软件作坊。

这里面最稀缺、也最值钱的东西,是试错密度——单位时间里,你能负担得起多少次有信息量的尝试。过去,只有小团队才拥有像样的试错密度;现在,一个想清楚了的个人也能拥有。

于是一种新的个人形态出现了,我们不妨叫它:个人创造系统的架构师。

这个人不是传统意义上的老板,也不是传统意义上的程序员。他更像一个小型组织的设计者。组织里的研究员、工程师、编辑、测试员、分析师、资料员,很多角色都由 AI 和工具链来扮演。而他自己的工作,是设定方向、设计选择压力、维护标准、判断结果,并把每一轮的经验沉淀成系统的记忆。

十、进化论:变异、选择、遗传

要把“loop 到底是怎么运转的”讲透,我发现最好用的模型不是工程学,也不是管理学,而是进化论

进化只需要三个条件:变异、选择、遗传。缺一个,就不会进化。我们把 AI loop 往这三个条件上一套,会发现严丝合缝。

变异,是 AI 的主场。

AI 最擅长的就是低成本地大量生成:十个策略、二十个标题、一百个产品功能、五种架构方案、三种文章结构。过去人脑里的想法很贵,因为每个想法都要花时间酝酿、表达、实现。AI 让变异变得极其便宜——便宜到你需要重新思考“想法多”到底还是不是一种优势。

变异一旦变便宜,选择就变成了瓶颈。

哪些策略留下?哪些桥段有效?哪些代码可维护?哪些功能值得上线?哪些文章值得发布?这些问题,AI 不会自动替你回答。它可以参与评估,但最终的选择压力必须由系统——归根结底由人——来定义。

不同领域的选择压力长得不一样:

量化里,是收益风险比、样本外表现、最大回撤、对交易成本的敏感度。

网文里,是读者停留、情绪释放、爽点密度、人物可信度、对下一章的期待。

软件里,是测试通过率、缺陷率、可维护性、性能、用户路径的转化。

个人成长里,是注意力有没有更自由、判断有没有更清楚、长期积累有没有真正在复利。

最后是遗传,也就是最容易被忽略的一环。

有效的经验怎么被保留下来?失败的教训怎么避免下次重犯?靠的是文档、代码库、测试、prompt、workflow、知识卡、指标体系、复盘记录、版本控制。没有这些,你的系统就是一条没有记忆的鱼:每一轮都从头开始,那不叫积累,那叫折腾。

把这三条合起来,一个 AI loop 就可以写成一行清清楚楚的公式:

AI 负责生成变异;测试、市场、读者、用户、回测负责提供选择信号;文档、代码、数据库、规则、workflow 负责遗传;而人,负责设计选择压力。

这一行里,最后半句是重点中的重点。未来真正强的人,不是最会“调用”智能的人,而是最会“设计一个让智能进化的环境”的人。

这三条里,人们通常只盯着“变异”惊叹——“哇,AI 一下能生成一百个方案”。但你现在应该看得出来,变异是三条里最不稀缺的一条。真正决定进化速度上限的,是选择和遗传。选择决定了你的系统往哪个方向走,遗传决定了它走过的路会不会被记住。一个只会疯狂变异、却没有像样选择和遗传机制的系统,就像一个物种拼命繁殖、却每一代都随机重新洗牌——它不会进化,只会热闹。

这也正是顶级企业家和顶级科研负责人的共同点:他们不亲自做每一个动作,但他们决定——什么样的动作会被鼓励,什么样的结果会被保留,什么样的错误会被淘汰。苹果的厉害,不只在于它有一群聪明人,而在于它有一套极其强烈的审美选择压力,很多东西被砍掉,留下来的才像苹果。一个好实验室也一样:它不是把所有想法都做一遍,而是有一套关于“什么问题有价值、什么证据可信、什么结果可以发表”的标准。

十一、最危险的地方:价值函数错了

到这里,故事已经足够漂亮了:AI 变异,系统选择,工具遗传,人设计压力,一台会进化的创造机器就搭起来了。

但正因为它高效,它才藏着最大的风险。

一台会进化的机器,如果价值函数错了,它会用惊人的效率,把你带向错误。

让我把这个抽象的“价值函数错了”,翻译成四种你一定见过的具体病症。

第一种,过拟合。 这是量化里的经典陷阱。一个策略在历史数据里表现得天花乱坠,不代表它未来能赚钱。如果你的选择压力只奖励“历史收益”,你就是在诱导 AI 去挖掘数据里的偶然纹理。回测曲线越漂亮,往往未来越危险——因为它可能只是把噪音背下来了。

第二种,指标幻觉。 你以为你在优化一个重要的东西,其实你只是在优化一个容易测量的东西。因为“重要”往往很难量化,而“容易测”的指标随手就有,于是系统会不知不觉地把靶心,从“重要”悄悄挪到“好测”上。

第三种,只追短期爽点。 内容创作里最常见。如果你的选择压力只奖励短期刺激,AI 会不断强化反转、悬念、标题党和情绪操控,最后写出一堆廉价套路。读者短期被钩住,长期却不再信任你——你透支的是自己最值钱的资产。

第四种,只追可测指标。 产品里俯拾皆是。只优化点击率,就会牺牲用户的真实收益;只优化留存,就可能把产品设计成让人上瘾;只优化收入,就可能一点点烧掉品牌信用;只优化“测试通过”,就可能写出一堆表面正确、实则没人敢维护的代码。

这四种病,看着各不相同,其实是同一条定律的四张脸。它常被转述为古德哈特定律(Goodhart’s Law):一个指标一旦成为目标,它就不再是个好指标。

道理并不玄。指标之所以有用,是因为它和“你真正想要的东西”之间存在某种相关性。但一旦你开始死命优化这个指标,系统就会想尽办法钻空子,专挑那些“能把指标做高、却和你真正想要的东西无关”的路径去走。相关性被优化压力一挤,就断了。于是你得到了一个漂亮的数字,和一个越来越空的实质。你越努力,跑偏得越彻底。

AI loop 会把这条定律放大到极致。因为 AI 特别擅长追逐明确的数字——你一旦告诉它“把这个数拉高”,它就会不知疲倦、不择手段地朝那个数狂奔。它不会停下来问一句:这个数,真的是你想要的东西吗?

所以我想把话说得重一点:一台创造机器最核心的零件,不是发动机,而是价值函数。

发动机决定它跑多快,价值函数决定它往哪儿跑。发动机弱一点,无非是慢;价值函数错一点,是全速冲向悬崖。

这也正是为什么,人不会在 loop 里消失。恰恰相反,人最不可替代的位置,就在这里:

AI 可以生成更多可能性,但人要决定什么叫“好”。

AI 可以优化任何指标,但人要决定这个指标值不值得优化。

AI 可以跑完任何实验,但人要判断实验结果到底有没有意义。

AI 可以沉淀任何规则,但人要不断回头审查:这些规则,有没有正在把系统带偏。

十二、人的位置:从劳动力,变成制度

沿着这条线再往深走一层,你会看到一个更根本的变化:AI 让人第一次有机会,把自己的判断力,外化成一套能自己运转的系统

过去,一个人的能力,是长在身体里的。你会写代码,是因为你亲手写;你会看文章的好坏,是因为你亲自读;你有经验,是因为你亲自踩过坑。能力被牢牢锁在你这一具肉身、这一段时间里。你在,能力才在;你累了,能力就停摆。

现在不一样了。你可以把一部分能力,写成 prompt、脚本、测试、文档、workflow、agent、数据库和发布流水线。

这意味着什么?

意味着你正在把自己,从一个劳动力,变成一种制度

你的判断,不再只体现在某一次具体的选择里,而体现在“系统如何做选择”里。

你的品味,不再只体现在某一篇具体的文章里,而体现在“写作流程如何定义什么是好文章”里。

你的工程经验,不再只体现在某一次 code review 里,而体现在测试、规范、模板和质量门禁里。

你的研究能力,不再只体现在某一次灵感里,而体现在一个能持续提出和检验假设的 loop 里。

这是一次很大的迁移。在传统世界里,“制度”通常是公司和机构才配拥有的东西,个人只能有“习惯”。习惯不可扩展、不可复用、也很难传给下一段时间的自己。而 AI 时代,个人第一次可以拥有属于自己的微型制度:一个内容生产制度,一个投资研究制度,一个学习制度,一个软件开发制度。它们不必宏大,只要有方向、有反馈、有记忆、有淘汰、有复盘,就已经是一个组织的胚胎。

所以,“我在用 AI”这个说法,正在变得越来越不够用。

你不只是在用 AI。你是在用 AI,把自己的一部分能力,浇筑成一个可以脱离你的身体独立运转的外部结构。

十三、别在循环里修补结果,要在循环之上修补规则

这里要引入一个特别实用的区分:in the loopon the loop

In the loop,是人待在循环里,一件一件地补救结果。

AI 写了一段代码,你逐行去改。AI 写了一段文章,你手工去润色。AI 给了一个策略,你自己去调参数。你当然也在参与——但你参与的方式,是“局部修补”。这种参与有一个致命的问题:它不可扩展。AI 的产出速度越快,你越是补不过来,最后你会变成一个被 AI 追着跑的、更累的自己。

On the loop,是人站在循环之上,去修改规则。

AI 写的代码总是不合项目结构?你不只是改这一次,而是补上规则、测试和上下文,让它下次不再犯同一类错。

AI 写的文章总是“冷感”太重、只讲道理不给画面?你不只是改这一次的句子,而是把“场景先于结论”“观点要落到行动”这类要求,写进你的写作 harness。

AI 生成的策略总是过拟合?你不只是删掉这一次的结果,而是加上样本外验证、交易成本压力测试、因子暴露检查和明确的停止标准。

一句话对照:in the loop 修补结果,on the loop 修补规则。

这个转变为什么如此关键?因为 AI 的执行速度越快,你就越不可能靠“手工修补每一个结果”活下去。你唯一的出路,是把自己的判断,升级成规则、工具和自动检查机制——让判断本身变得可以规模化。

这其实就是“带团队”的道理。

一个新人每次提交代码都忘了跑测试,你当然可以每次都去提醒他。但更聪明的做法,是把测试放进 CI,让没过测试的代码根本合不进来。

一个编辑每次都忘了检查标题,你当然可以每次都替他看一眼。但更聪明的做法,是把标题检查写进发布前的 checklist。

AI 团队,也是团队。只不过这个团队的成员很便宜、很快、还特别健忘(每次都可能丢掉上下文)。你没法用情绪去管理它,你只能用制度去管理它。

十四、个人创造系统的五个器官

如果一个人真要动手搭一套属于自己的、AI 原生的创造系统,它至少需要五个“器官”才能算是活的。

第一个器官:方向感。

方向感决定系统往哪里积累。没有方向感,AI 会把你带进一种“随机的繁忙”:今天做量化,明天写小说,后天做 App,大后天又研究短视频。每件事看着都挺有意思,但彼此之间没有复利,你只是把精力平摊在了一地碎片上。

方向感不等于“只能做一件事”,而是要求不同的事之间有一条共同的主线。比如量化、网文、AI 编程,表面上南辕北辙,其实可以被同一个主题串起来:如何用 AI 建造可验证、可迭代、可沉淀的创造系统。 主线在,繁杂的事就开始互相喂养;主线不在,再勤奋也只是四处漏气。

第二个器官:评估标准。

什么叫“变好”?没有标准,就没有进步,只有自我感动。量化有指标,写作有读者,产品有用户,软件有测试,个人成长也得有反馈。标准不一定都是数字,但它必须能帮你做出“要 A 不要 B”的选择。一个不能帮你做选择的标准,等于没有标准。

第三个器官:记忆系统。

每一轮尝试,都要留下可以被下一轮调用的经验,否则你只是在不停地“重启”。记忆系统可以是文档、数据库、知识卡、commit、issue、实验记录、读者反馈索引、失败案例库。它不需要一上来就完美,但它必须存在——因为进化论早就说了,没有遗传,就没有进化。

第四个器官:资源分配。

哪些方向加码,哪些方向暂停?哪些项目只是探索,哪些项目进入生产?哪些结果值得请最贵的强模型来精雕细琢,哪些结果只配让便宜模型先草拟一版?这就是资源分配。它和投资组合是同一个道理——你不会把所有钱都押在一只高风险的股票上,也不会全部存定期。没有资源分配的 loop,会像一个不设预算的部门,安安静静地把你的时间和注意力吞光。

第五个器官:品味和价值观。

这是最难自动化,也最不该被自动化的部分。它决定这台系统最终会创造出什么,而不只是“提高了哪个指标”。你要不要写廉价爽文?你要不要为了收益牺牲风险控制?你要不要为了发布速度牺牲准确性?你要不要为了效率牺牲对人的基本尊重?这些统统不是技术问题,是价值问题。

关于这最后一个器官,我想留下一句可能有点扎心的话:

一个创造系统,可以没有很强的模型,但不能没有价值观。 模型弱一点,你可以补工具、补测试、补流程;价值观一旦错了,模型越强,它就越危险。

十五、把一次深聊,变成一篇文章,再变成一个 skill

绕了一大圈,现在我们回到这篇文章本身。

因为这篇文章,它自己就是一个 loop 的产物。它不是凭空写出来的,它是一个循环一圈一圈滚出来的。我把这个过程摊开给你看:

第一轮,是对话。 一个很小的直觉:prompt、harness、loop,人的角色好像在变。

第二轮,是类比。 这个变化,像不像一个人从学生长成 PI?执行、设计实验、设方向。

第三轮,是扩展。 它又像企业——最伟大的产品是公司本身,因为公司是那个“能持续造产品的东西”。

第四轮,是抽象。 我们把它拧成一串更硬的概念:二阶创造、创造机器、进化系统、选择压力、价值函数。

第五轮,是外化。 把讨论写成初稿,交给另一个更强的模型去润色,再发布到个人网站和阅读 App 上。

第六轮,是制度化。 把这一整套流程,沉淀成一个 skill。以后每当一次深聊足够有价值,就调用这个 skill:整理对话、提炼思想、写初稿、调用强模型润色、发布、验证,最后再把这一轮的经验,更新回 skill 本身。

你看,这件事本身,就是我们从头到尾在讨论的主题。

你不只是写了一篇文章。

你顺手发明了一台把深聊转化为长期资产的机器。

这就是 loop 最迷人的地方:一次有价值的思考,不再随着聊天窗口的关闭而蒸发。它被整理、被发展、被发布、被复用,最后成为下一轮思考的起点。而当这个 skill 还能根据每次使用的效果,反过来改进它自己时——你就已经在悄悄触碰三阶创造了。

十六、未来的高手,会是什么样的人

如果把前面所有的讨论,收束成一句判断,我会这样说:

AI 时代最强的个人,不是最会使用 AI 的人,而是最会建造创造系统的人。

这个人不一定是传统意义上的程序员,也不一定是传统意义上的企业家。他可能是研究者、作者、交易者、产品经理、独立开发者、老师、顾问、投资人,或者一个横跨好几种身份的杂食者。

但他们身上有一组共同的特征:

他不满足于一次性的产出,他要的是持续产出。

他不只关心结果,他更关心结果如何被验证

他不只让 AI 执行,他给 AI 搭建环境

他不只收集反馈,他把反馈转化成下一轮的规则

他不只拥有想法,他拥有一个能让想法被测试的系统。

他不只是一个劳动力,他是一个会生长的制度

这类人会越来越重要,因为 AI 正在重写世界的基本成本结构。执行变便宜了,生成变便宜了,试错变便宜了,表达也变便宜了。而越是这样,方向、标准、判断、记忆和价值函数,就越贵。

所以未来的差距,不会拉开在“谁能让 AI 多写几段代码、多生成几篇文章、多跑几次回测”上。真正的差距,会拉开在下面这几件事上:

谁能定义出值得循环的问题;

谁能设计出好的选择压力

谁能分辨出真进步和指标幻觉

谁能把失败变成信息

谁能把经验变成制度

谁能在飞快的速度里,依然守得住价值判断

十七、结语:重新理解“创造”

过去我们说“创造”,脑子里浮现的往往是灵感、作品、天才、灵光一现的瞬间——一个人写出一本书,做出一个产品,提出一个理论。创造,是名词,是一个孤零零的成果。

AI 时代,创造的重心正在整体上移。

真正重要的,可能不再是创造某一个作品,而是创造一个能持续产生作品的系统

不是写出一篇文章,而是建一个能不断从对话里提炼思想、发展成文、发布沉淀的系统。

不是写出一个策略,而是建一个能不断发现、检验、淘汰策略的系统。

不是写出一段代码,而是建一个能持续把需求变成可靠软件的系统。

不是学会一个知识点,而是建一个能持续吸收、验证、应用知识的系统。

这,就是从一阶创造,走向二阶创造。而当这个系统还能根据反馈改进自己时,它就开始触碰三阶创造。

所以也许,我们现在真正要面对的问题,不是那句被问烂了的“AI 能帮我做什么”,而是另一句更大的:

我能和 AI 一起,建成一个什么样的创造机构?

这个机构可以很小。它也许只是一个目录、一组脚本、几份文档、几个 agent、一个发布脚本、一个回测框架、一张读者反馈表。它小到不值一提。

但只要它有方向、有反馈、有记忆、有淘汰、有价值判断,它就不再是“零散地使用 AI”,而是一个会生长的东西

从这个角度看,AI 编程、量化策略、网文创作、个人网站、skill 沉淀——这些看似分散的事,其实是同一件事的不同切面:

人类,正在学习如何发明“会发明的机器”。

而这台机器最终会发明出什么,不取决于它有多强,只取决于——我们把什么样的判断、品味和价值,写进了它的循环里。