量化炒股入门：把凭感觉买卖变成用系统做决策

本文仅供学习交流，不构成投资建议。

量化不是更聪明地猜。它是承认自己不够聪明，然后用规则来弥补。

大多数人对量化的想象——几块屏幕、跳动的数字、自动赚钱的程序——抓住了表面，遮住了本质。量化的核心是把模糊的、情绪化的交易行为，翻译成可以写下来、检验、复盘、迭代的规则系统。

这件事在 A 股已经有了明确的法规边界。证监会把程序化交易定义为通过计算机程序自动生成或下达交易指令进行证券交易，2024 年施行，深交所细则明确个人投资者也可以参与。量化不是灰色地带，而是有规则、有边界的正规交易方式。

学量化的第一步不是找神策略。第一步是理解：量化不替你思考，它只是逼你把思考变得更严格、更诚实。

凭感觉的判断必须变成明确条件。靠「应该没事」硬扛的亏损必须变成事先定义好的阈值。行情好时的自大和行情差时的自疑，都要被记录和检验。

量化最大的价值不是让你赚更多，而是逼你把「我觉得」变成「在什么条件下我会这么做，以及这么做的长期结果大概是什么」。

一、量化炒股到底是什么

交易就是一串决定：买什么、什么时候买、买多少、什么时候卖、亏多少停、赚多少走、什么时候空仓。

主观交易者临时做这些决定。量化交易者提前回答这些问题，用规则执行。

区别看一个例子就够了。

主观交易者说：「这只 ETF 走势不错，感觉要突破了。」这句话没有信息量。什么叫走势不错？什么叫要突破？突破到什么程度算成立？回落多少算失败？仓位多大？这些问题没答案，所谓交易逻辑只是情绪和印象的混合物。

量化做的第一步是翻译。把「感觉要突破」翻译成：若收盘价创 60 日新高，且 20 日均线向上、成交额不低于 20 日均值的 0.8 倍，则下一交易日开盘买入，仓位 30%；跌破 20 日均线则卖出。

这套规则未必赚钱。但它可执行、可回测。这两个特性是主观判断永远不具备的。

量化的本质：把交易从临场发挥变成规则系统。简单到一条均线，复杂到多因子加机器学习，做的都是同一件事。

量化先是方法论，后是技术栈。先是认知，后是工具。

一个成熟的量化系统有四层。研究层提出假设。验证层检验假设。执行层把信号变成订单。风控层在系统出错时保护账户。大多数人以为核心是公式。核心是系统设计。

二、四种常见误解

量化等于 AI。 不是。大量赚钱的策略很朴素——趋势跟随、资产轮动、均值回归。规则明确、可回测、可执行，就是量化。AI 只是工具箱里的一把扳手，不是整个工具箱。

量化等于高频交易。 高频只是量化的窄窄一支。它需要超低延迟和专业基础设施。沪深交易所认定标准：每秒 300 笔以上或单日 20000 笔以上才算高频。个人投资者真正适合做的是日频或周频策略。你的优势在于可以慢。

量化天然更客观。 程序减少情绪干扰，但不消灭偏见。数据怎么选、复权怎么做、有没有偷看未来、成本算了没有——这些偏差不会因为你写了代码就消失。量化把自欺欺人从拍脑袋升级成了写代码骗自己。

量化是一劳永逸的赚钱机器。 市场是复杂适应性系统。环境会变，资金结构会变，策略拥挤度会变。量化系统需要持续校准、维护、复盘。它不是水龙头，是实验装置。

三、系统的五层结构

量化系统是一条流水线。

数据层。 行情数据、交易日历、标的信息、复权信息。核心问题不是有没有数据，而是数据是否干净、连续、口径一致，是否能还原当时真实可得的信息。

策略层。 把想法翻译成信号。趋势会延续？定义趋势。强者恒强？把强转成可排序指标。均值回归？把偏离程度写成公式。策略层写的不是故事，是条件链。

组合层。 回答「买多少」。仓位管理往往比选标的更重要。全仓还是等权，按波动率调整还是设行业暴露上限，这些选择显著影响最终结果。

执行层。 信号不等于成交。收盘生成信号、下一开盘成交？考虑滑点了吗？考虑成交量约束了吗？执行层决定了研究离现实有多远。

风控与复盘层。 限制错误。单日亏损过大触发降仓？数据更新失败自动中止？日志和报告记录每个操作的原因。没有复盘的量化是自动化赌博。

好的量化项目未必复杂，但一定结构清楚。

四、为什么从 ETF 开始

先别碰个股。ETF 更适合当第一站。

ETF 帮你隔离了大量不该在第一阶段处理的复杂性——业绩爆雷、黑天鹅、停牌断层、题材熄火、ST 和退市风险。

对初学者来说，建造系统比追求 alpha 重要得多。个股策略会迅速把你拖入复杂度泥潭——股票池选择、财务数据频率、调仓日和财报日对齐、停牌处理、涨跌停限制、分红送转、成分股回溯。这些都值得学，但是第二阶段的事。

ETF 像一块干净的实验台。你可以很快跑出完整闭环：下载数据、计算信号、生成持仓、跑净值曲线、算指标、做报告、做样本外验证。

量化最怕的不是策略差，而是工程项目太大，最后什么都没做完。先做小，做完，做对。

在 A 股语境里，证监会提出「先报告、后交易」。入门者先做研究、回测、信号输出、日报生成，再逐步走向半自动决策支持，是更务实的路径。

五、数据：地基，也是最大的坑

垃圾进，垃圾出。几乎所有初学者都在数据层吃亏。

大多数人把精力花在策略公式上，结果发现真正决定结果有没有意义的，是那些看起来琐碎的细节：交易日对齐了吗？复权对了吗？停牌日有空缺吗？某些字段当时能不能拿到？

以 Tushare Pro 为例。A 股日线接口默认未复权，停牌期间不提供数据。这些 API 细节在量化里是生死线：忘了复权，信号被扭曲；没意识到停牌无数据，「没交易」被误当成「价格稳定」；没对齐交易日历，不同标的之间的比较就是错的。

复权不高深。它只是说历史价格要放在同一把尺子上看。不做处理，价格图会出现假断层，策略信号会被误导。

点时可得性也很关键。你在某个交易日做决策时能看到什么信息？财报 4 月 30 日发布，4 月 10 日的回测里不能用。量化里最值钱的诚实：承认当时的你不知道后来发生的事。

实用原则：建立本地缓存。数据源当采集器，本地 Parquet 或 SQLite 当真相源。先落地、清洗、标准化，再由回测模块读取。可复现比速度重要。

数据问题不会「解决一次就没事了」。每引入新资产、新字段，问题重新出现。成熟思维：默认数据迟早会出问题，系统里必须为此留位置。

六、先学趋势，再学轮动

不是因为最赚钱，而是因为最适合当学习框架。

趋势跟随。 双均线策略：短均线上穿长均线买入，跌破卖出。或者收盘价站上长期均线持有，跌破空仓。

趋势策略的价值不在于收益。它逼你面对关键问题：信号按收盘价还是盘中生成？成交假设在下一开盘还是下一收盘？参数固定还是搜索？手续费和滑点会不会把优势吃掉？

极简版本：一只宽基 ETF，20 日和 60 日均线。20 日在 60 日上方且空仓就买，跌回下方且持仓就卖。做完你得到的不是圣杯，是你的第一份量化实验报告。

ETF 轮动。 几个 ETF 按过去一段时间的收益打分，定期持有得分最高的。加绝对动量过滤：标的本身收益为正才买入，否则空仓。

轮动比趋势多了横向比较，但没有个股多因子那么复杂。你会学到组合调仓、排序逻辑、再平衡频率、换手率控制。

轮动策略会让你意识到：量化不是预测一切，而是在有限标的中做相对更优的选择。

多因子和机器学习可以最终走到。但别当第一站。先把简单系统做扎实。

七、回测的五个陷阱

量化最吸引人的是回测。量化最危险的也是回测。

一条漂亮的历史净值曲线会让你相信：过去有效，未来也差不多。但回测不是承诺。它是在一组历史条件下、基于一套假设做的模拟实验。改变任何前提，结论可能反转。

未来函数。 在历史里使用了当时不可能知道的信息。收盘价假设盘中成交。季报数据提前用于选股。今天存活的 ETF 名单做过去的策略。不报错，但结果是虚构的。

幸存者偏差。 只拿今天还在的标的回看过去。退市的、清盘的被你删掉了。

信号与成交混淆。 收盘后才能确认信号，却假设当日就能成交。一个细节让漂亮回测大幅缩水。

忽略交易成本。 零摩擦世界里的惊艳策略，加入真实成本后变平庸甚至转负。

过拟合。 不断调参数直到找到完美的历史组合。这组参数很可能只是刚好适配过去。过拟合给你最强的心理奖励——「找到了！」——恰恰在你最该怀疑的时候。

防自欺机制：样本内外拆分、walk-forward 滚动验证、参数敏感性分析、不同市场阶段对比、强制加入成本、数据版本固定。

回测的价值不是让你兴奋。是让你清醒。

八、读懂回测报告

第一眼盯总收益率没错。只盯这一个数字就错了。

一份有用的报告回答四个问题：赚不赚？难不难熬？靠什么赚的？什么情况下最脆弱？

年化 18% 最大回撤 55%，和年化 12% 最大回撤 12%，不能用简单算术比。决定能不能长期拿住的，是亏损的可承受性，不是收益的上限。

最大回撤是账户从高点到低点最深的坑。数学上不对称：回撤 10% 需涨 11% 回本，回撤 20% 需涨 25%，回撤 50% 需涨 100%。风控不是保守，是复利的数学前提。

夏普、波动率、卡玛比率衡量收益的平滑程度和回撤效率。过程剧烈抽搐的策略，在真实持有中几乎无法坚持。

胜率容易误导。80% 胜率每次小赚偶尔大亏，总体可能是负的。35% 胜率靠少数大赚覆盖大量小亏，反而赚钱。真正重要的是盈亏比和长期期望值。

换手率太高意味着成本被放大。低频、稳定、能解释的策略，比高频炫目的策略更适合长期推进。

成熟的报告包含：分年度表现、月度分布、回撤区间、持仓变化、交易摘要、参数说明、成本假设和失败阶段分析。

九、风控是系统的一部分

风控不是出问题了才止损。它从策略诞生的第一秒就该存在。

你设计的不是「怎样赚」。是「怎样在可能赚的同时不被打死」。

仓位。 最基础的风控。10% 仓位和满仓是两个完全不同的游戏。仓位管理的本质不是降低收益，而是确保你有资格活到下一次机会。市场不会因为你亏了就暂停。

分散和暴露管理。 几个看似不同的 ETF 可能高度相关。分散是暴露结构问题，不是数量问题。

退出机制。 什么时候减仓、空仓、停止交易、认定策略失效，都要前置。退出不靠情绪。你可以用价格、波动率、回撤、信号反转或系统错误率来定义退出。但不要让「再等等看」成为默认选项。

操作和工程层面。 数据更新失败、接口异常、回测结果突变。工程失误造成的损失可能比市场波动更大。

风控不是悲观。是提前承认自己一定会犯错，然后为错误设计边界。

十、工程化才是护城河

把量化当几个公式，会很快碰到天花板。让量化变成可持续能力的，是工程化。

清晰的项目结构。 数据采集、清洗、策略、回测、指标、报告各归各位。不要塞进一个 Notebook。没有边界的项目，每加一个需求都在引入混乱。

可复现。 今天的结果下周还能复现吗？重视配置文件、数据版本、日志输出、结果归档。认真复盘时最痛苦的不是亏损，是不知道为什么得到这个结果。

研究和执行分离。 研究提出和验证假设。执行翻译成操作。第一阶段不是自动下单，而是每天更新数据、计算信号、生成报告、输出候选动作，人工确认。系统化加人工风控。

测试的敬畏心。 均线对不对？交易日对齐对不对？手续费重复扣了没有？最可怕的错误不是程序崩溃，是程序看起来正常运行，悄悄给你错误结论。

会写策略的人很多。能把系统搭稳的人很少。差距不在策略，在工程。

十一、90 天路径

三个月做出一个小闭环。不是半年做出顶级系统。先跑通，再做深。

第一个月。 一两只宽基 ETF，本地数据缓存，双均线策略，净值曲线、收益、最大回撤、交易记录。不追求策略强。逻辑清楚、结果可重复、能解释每笔交易。

第二个月。 加入 ETF 轮动。参数配置。样本内外拆分。交易成本和滑点。生成报告。从试写策略变成做研究工具。

第三个月。 Walk-forward 验证。参数敏感性分析。不同 ETF 池子测试。每天自动生成次日候选持仓。关键不是更复杂，是复杂了还能清晰和可解释。

三个月后你可能没赚到大钱。但你拥有了一套可持续迭代的金融实验系统。这个系统是你真正的杠杆——它能被复用、被改进、被累积。策略可能过时，但做系统的能力不会。

十二、回测好看，实盘难受

每个做量化的人都会遇到。

回测面对已经发生的世界。你知道结局。实盘面对你不知道结局的世界。连续亏损三周时，你不知道这是正常波动还是永久失效。

实盘还多了大量摩擦——忘记更新数据、手动确认犹豫、实际成交和假设不一致、流动性不足、系统异常。单笔看不大，长期叠加改变结果。

还有一个不太被承认的原因：人在回测时会挑自己喜欢的结果。不好看的参数和时段被无意识筛掉。

实盘和回测之间的桥梁不是找更强的策略。是让假设更接近现实，让执行更接近纪律，让心理预期更接近真实的亏损体验。

成熟的量化不是回测有多漂亮。是回测和实盘之间的落差有多小。

十三、高频问题

零基础能学吗？ 能。需要一点 Python、一点数据处理、一点统计常识、一点交易规则理解、一点做项目的耐心。难的不是第一段代码，是把杂乱知识拼成稳定系统。

必须先学高级数学？ 不必。入门阶段最重要的是把简单规则做正确。

资金小有必要吗？ 有。入门阶段产出的是方法，不是收益。小资金适合做实验。

一开始就全自动下单？ 不必。先做研究、回测、信号输出、人工确认。自动化是系统成熟后的自然结果。

神策略能直接抄？ 可以研究。先问：数据口径、执行假设、成本计算、样本外表现。公开策略最厉害的地方常常是省略了让结果变差的细节。

回测不漂亮就没价值？ 恰恰相反。太漂亮的反而可疑。真实可用的策略往往只是「逻辑清楚、回撤可控、样本外没崩」。平庸但稳定，胜过惊艳但脆弱。

什么时候算入门？ 当你能回答：系统为什么可能有效？依赖什么前提？最可能在哪里失效？成本和摩擦是什么？风险边界在哪里？失效时怎么处理？

能回答这些，你开始从写代码的人变成做系统的人。

结语

量化训练的不是交易技巧。是一种思维方式。

把模糊直觉翻译成清楚规则。把想象中的优势放进严格验证。把「我可能是对的」换成「我怎样证明自己不是在骗自己」。

它不消灭亏损和不确定性。它甚至比主观交易更残酷——错误会被一条条暴露，没有「运气不好」的借口。

但正因如此，它才值得投入。

量化把交易从情绪反应变成系统工程。把运气驱动变成流程驱动。把一时冲动变成长期可复盘的能力。

真正的入门不是找到神秘公式。是开始承认：市场复杂，自己会犯错，任何优势都要检验，任何收益都要付出风险代价，任何系统都要维护。

到那一步，你写的不是买卖程序。是帮助自己在不确定世界里做出更稳定决策的工具。

这才是量化的杠杆所在：不是放大收益，而是放大你做决策的质量。

李文业的思考笔记