追本之箭 — 善猎者善守
追本之箭 — 善猎者善守
2026-04-15 Wed 19:33
起点
善猎者善守。
通常的读法是英雄式的:"最猛的进攻者也最懂防守。" 攻守一体,孙子兵法,be water——一套很顺滑的话。
但这套读法有个洞:它把"善守"解释成进攻的副产品(省下能量去防守),却没回答最锋利的那个动作到底是什么。
洞要被现实砸实:执行率最高的猎手,单季命中率可能 <30%,净收益却远超那个执行率 95% 的对手。命中率高、动手勤,不是善;少动手、每动必狠,才是。 善守不在"守得勤",在"忍得住手不动"——勤动手的那个,正被自己的勤奋一刀刀放干血。(Fish 自己 BTC 69% / ETH 37% 的执行率缺口,量的就是这条裂缝:计划写满,扳机扣不动。)
把它机械地看一次:狩猎的核心不是"追"也不是"守",是一次出手决定——在某个时刻,把不可逆的资源(体力、位置、暴露、子弹)投出去。出手有成本,信号有真伪。于是"善猎"和"善守"塌缩成同一个量的两端:
善猎 = 只在高期望值的稀有信号上出手(低频、高确信)。
善守 = 把不出手的门槛守住,不被噪音诱出手。
不是两种能力。是同一个出手阈值:猎是阈值之上扣扳机,守是阈值之下按住手。隐藏的杠杆不是"能量守恒",是信噪比——你能不能把真信号从噪音里分出来,以及你愿不愿意为此一直不动。
三个反直觉命题,要逐个钻到底:
- 机制:"善"不是名词(一种人,信噪比天生高),是一个可写出的出手判据——善在某一个变量上,且那变量可被指认。
- 证伪:门槛不是越高越善。抬到无穷高(永远不出手)不是极致善守,是另一种死法——零假阳换来了零命中。
- 最深(killer):"善守的耐心"和"恐惧的瘫痪"输出完全相同(都不动),内核完全相反。分不开这两者,这篇就是鸡汤。
第一层:出手是一个信号检测问题 —— 把"善"写成判据
先把"该不该出手"形式化。这是经典的信号检测论(signal detection theory):
每一次面对世界,你收到一个观察。它要么是真信号(真机会),要么是噪音(看起来像机会)。你只有两个动作:出手 / 不出手。于是四种结局:
| 真信号 | 噪音 | |
|---|---|---|
| 出手 | 命中(hit)✅ | 假阳(false alarm)❌ 暴露、亏损、不可逆 |
| 不出手 | 漏掉(miss)⚪ 机会成本 | 正确按住(correct reject)✅ |
差猎手追猎物 = 假阳率爆表:把每个晃动都当信号,频繁出手,被假信号一刀刀消耗。
怕事者永远不动 = 漏掉率爆表:把每个真信号都当噪音,错过所有真机会。
"善"善在哪?——善在把出手阈值放在让期望值最大的那个点上。出手的判据只有一条:
出手 ⟺ EV = P(真信号) × 收益 − P(噪音) × 不可逆成本 > 0
P(真信号) 就是信噪比:这次观察里,真信号占多少。
不可逆成本 是关键——它不是简单的"亏多少",是这步走出去能不能收回。成本越不可逆,阈值就该越高,出手就该越稀有。
所以巴菲特的 "you don't have to swing at everything—you can wait for your pitch":棒球有三振,你必须挥;投资没有 called strikes,你可以一直不挥,直到一个肥球进入你的甜区。一年出手几次,不是因为机会少,是因为只有几次 EV 真正为正,其余全是诱你假阳的噪音。
善猎者善守,第一层翻译:他不是两件事都强,是他守住了一个让 EV 最大化的出手阈值。 猎是阈值之上的果断,守是阈值之下的纪律。
第二层:阈值有两个方向的死法 —— 漏掉也是成本
证伪逼出来的第一刀:门槛不是越高越好。EV 公式里有两项,只压一项会喂大另一项。
把阈值抬到无穷高,假阳率确实归零(永远不会上当)——但漏掉率同时冲到 100%(所有真信号都被你当噪音放走)。你不是赢了,你是用"从不犯错"换来了"从不命中"。
这就是 漂流 那篇的囤积选择权:一直保留"我还没出手、一切皆有可能"的姿态——而囤积选择权到极致的人,最后一个选择权都没行使。也是 对齐 那篇的用不行动假装在对齐:不出手没有错误可被记录,于是感觉很安全。
所以阈值是个双边优化,不是单边收紧:
阈值太低 → 假阳主导 → 被噪音消耗致死(乱猎)
阈值太高 → 漏掉主导 → 错过所有真机会致死(只守不猎)
最优阈值 → 让 [假阳 × 不可逆成本] 和 [漏掉 × 机会成本] 在边际上相等
注意右边那个常被忽略的项:漏掉 × 机会成本。只守不猎的人以为自己零成本,其实他在持续支付机会成本——只是这笔账不出现在对账单上,所以他看不见,还误以为自己很"稳"。
德鲁肯米勒 2% 起手、两层验证才加到两位数:这不是"胆小",是他把阈值卡在了边际相等的那个点——小仓位试探(控制假阳成本),确认是真信号(P 升高)再压上重注(不漏掉)。低频,但每次出手 size 极大。善守不是少下注,是少在 EV≤0 时下注;一旦 EV 为正,他比谁都狠。
这就引出了真正的 killer:既然最优阈值下"经常不动"是对的,那——
第三层(killer):耐心 vs 瘫痪 —— 同一个"不动",相反的内核
这是本篇的命门。善守的耐心和恐惧的瘫痪,输出完全相同(都不出手),但它们是两套完全不同的机制。混淆这两者,是绝大多数人读"善猎者善守"读歪的地方——他们用"我在善守"给自己的瘫痪发了通行证。
把它们放进同一个 EV 框架,差别立刻显形:耐心是阈值正确、扳机随时能扣;瘫痪是阈值被劫持、扳机已经焊死。
| 善守的耐心 | 恐惧的瘫痪 | |
|---|---|---|
| 表面行为 | 不出手 | 不出手 |
| 阈值由什么决定 | EV 公式(信噪比 × 不可逆性) | 情绪(怕亏、怕错、怕被评判) |
| 真信号出现时 | 立刻、重仓扣扳机 | 照样不动,事后找理由 |
| 不动时的内在状态 | 平静的扫描:在等、在算 P | 焦虑的回避:不敢看、盼它别来 |
| 错过后的反应 | 接受(EV 当时为负,对了) | 后悔 + 合理化("我本来就要等更好的") |
| 对"漏掉成本"的态度 | 已计入 EV,主动权衡 | 假装不存在,这样就没有错 |
单一可证伪的判据——区分耐心和瘫痪,只需要看一件事:
当一个 EV 明确为正的肥球真的进来时,你扣不扣扳机?
扣 → 你之前的不动是耐心(阈值正确,只是没到)。
不扣,还在等"更完美的" → 你之前的不动是瘫痪(阈值被劫持成了无穷)。
耐心的人渴望信号出现,因为不动只是手段,猎才是目的;瘫痪的人恐惧信号出现,因为信号一出现,他就必须面对"我到底敢不敢"。这就是为什么 Fish 的 BTC 600 枚 6 档执行率 69%、ETH 4 万枚 5 档只有 37%——计划写得清清楚楚(阈值正确),但肥球进甜区时手停住了(扳机焊死)。计划是耐心,执行率的缺口是瘫痪。两者住在同一个人身上,用同一个"我在等更好的点"做掩护。
所以"善猎者善守"的真正难点不在守——守(不动)谁都会装。难在:你的不动,是不是一个随时能瞬间转成猎的不动。 能扣扳机的静止叫埋伏,扣不动扳机的静止叫僵住。外人看不出区别,只有信号到来的那一刻会揭穿你。
第四层(meta-killer):EV 这把尺自己有适用边界 —— 不可逆面前,生存先于期望
前三层把"善守"建在 EV 之上,可 EV 公式从没被自己的证伪逻辑打到过。现在打它。
EV = P × 收益 − P_noise × 成本 能写出来,默默吃进了三个前提:
- 博弈可重复——"期望值"是大数定律的产物。重复 N 次,实际收益才收敛到 EV;只玩一次,EV 是一个你永远不会经历的虚拟均值。
- 基率可估且稳定——P 来自历史频率。可若信号分布本身在漂移(对手在适应、世界在变),历史频率就不是未来的 P,你算的是一把作废的尺子上的刻度。
- 失败可承受——输了还能再玩。EV 为正之所以"该出手",前提是单次的坏结局不会把你踢出游戏。
三个前提同时成立,EV 才是金科玉律。抽掉任何一个,整套信号检测论就失去地基。 而真正要命的局,恰恰同时抽掉它们:
- 单次不可逆的生死局:一把定输赢,没有"长期",没有 N。EV 为 +30% 又如何?20% 的那条尾巴一旦命中就是清零,而你只摇这一次骰子。期望值在这里是个统计学的鬼魂——它描述一群平行的你的平均命运,可你只是其中一个,而且可能正好是死掉的那个。
- Knightian 不确定性(奈特不确定性):P 根本不可知,不是"已知但偏小的概率"。你以为在算风险(已知分布),其实面对的是不确定性(分布未知)。把不可知的 P 硬塞进 EV 公式,精确的形式掩盖了它喂进去的是猜的数——GIGO,公式越漂亮,越骗人。
这时"善猎者善守"的含义翻转:
可重复 + 可承受 → 善守 = 算 EV、卡阈值、EV 为正就狠(前三层)
不可逆 + 不可知 → 善守 = 先保证不被单次清零,再谈出手
前三层的善守是最大化期望;这一层的善守是先不死。不是同一件事的程度差异,是目标函数换了。面对吸收壁(absorbing barrier),第一原则不再是 max(EV),是 P(survive) = 1——因为期望值的全部意义,建立在"你还在桌上"。赌徒破产(gambler's ruin)的数学冷酷得很:只要每一把都押上可能清零的注,哪怕每把 EV 都为正,无限玩下去破产概率趋近 1。正期望救不了你,一次踩到吸收壁就出局,后面所有的正 EV 都与你无关了。
所以善守在这里升级成一条凌驾于 EV 之上的硬约束:
永不押上无法承受的注——哪怕 EV 为正。
这正是凯利公式被人误用的地方:凯利给的是长期增长率最大的下注比例,但它内置了一条破产边界——押超过凯利,长期增长率不升反降,且破产概率飙升。凯利的深层不是"下多大注最赚",是"为了能一直玩下去,你最多只能押多少"。求的不是单次最优,是生存约束下的最优。Fish 的四层钱包、仓位上限、"无法承受就不押"——不是胆小,是给自己装吸收壁的护栏:把"单次不可逆"硬拆成"多次可承受",让任何一把都打不死自己,这样 EV 那把尺才重新有意义。
于是第三层那个 killer 要打补丁:"EV 为正就该狠"——只在可重复 + 可承受时成立。Fish 的 ETH 37% 执行率,有一部分确实是瘫痪(扳机焊死);但另有一部分是这一层的清醒——身体察觉到这一把的 size 越过了"可承受"边界,在 EV 之外踩了刹车。怎么分这两者? 还是一条可证伪判据:
把这笔注砍到"输光也不出局"的 size,你扣不扣扳机?
扣 → 之前的不动是瘫痪(怕的是亏,不是死);砍小了照样下不去手,就是它。
还是不扣,因为"小注不值得" → 之前的不动是生存纪律(怕的是吸收壁,size 一旦可承受,问题就回到纯 EV)。
瘫痪怕的是亏损本身;善守怕的是清零。两者又一次输出相同(都没下大注),但砍小 size 这一刀,把它们分开了:亏损可以承受,清零不能。
第五层:校准阈值 —— 把"善"做成可练的旋钮,而非天赋人格
前面几层有个隐患:听起来"善猎者"是天生信噪比高的人。不是。阈值是一个可以校准的旋钮,校准它的不是性格,是反馈与暴露。
为什么大多数人阈值跑偏?因为两类反馈不对称地打他。把阈值随时间的漂移粗粒度写成一条更新方程:
Δθ_t = α · 假阳之痛 − β · 漏掉之痛 且 α ≫ β
θ 是出手阈值。每次假阳(出手亏了)立刻、剧烈、可见,痛被足额计入,以系数 α 上推阈值;每次漏掉(没出手而错过)延迟、模糊、可否认,痛几乎不可见,本该下拉阈值的 β 项形同虚设。α ≫ β 是这条方程的全部要害:正项满载、负项失重,于是 Δθ_t 几乎恒为正——阈值单调上漂,永不自动回落。
结果不是噪声里的随机游走,是一条有方向的棘轮:人的默认漂移就是"越来越像善守、实则越来越瘫痪"。 这正是 killer 的机制级答案——为什么老手比新手更怂: 不是变笨,是 α 把每一次假阳的痛刻进了阈值,而 β 那一侧的漏掉账单从不寄到他手上。新手 t 小、漂移没累积;老手 t 大、α ≫ β 积分了千百次,阈值早被推到了甜区之外。怂不是退化,是这条方程的必然解。(价格 那篇的 edge 同理:真 edge 是稀有的真信号,大多数"机会"是噪音;问题不是 edge 不够,是你分不清,于是要么乱挥要么僵住。)
校准的动作,就是人为地把那个被忽略的成本项重新放回账本:
- 给漏掉建账(对抗不对称反馈):每次"没出手",像记交易一样记下来——后来它是真信号还是噪音?只记假阳不记漏掉的人,阈值必然单边漂高。
- 小仓位探针(廉价地采集 P):不确定信噪比时,用极小的不可逆成本去测真伪(德鲁肯米勒的 2%)。探针不是出手,是降低 P 的不确定性——把"猜信号"变成"测信号"。探针还有第四层的第二重作用:它把"单次不可逆"主动拆成"多次可承受",这正是把生死局拉回 EV 适用域的那把刀。
- 预先写死阈值,事中只执行不重谈:在冷静时(无情绪)写下"满足 A/B/C 即出手",信号到来时禁止临时抬高门槛。临时抬门槛 = 瘫痪的标准动作,且总以"我在善守"为名。(唯一幸存者:活下来的不是阈值最高的,是阈值校准且能执行的——只守不猎和乱猎一样会出局。)
但探针不是免费的真相机: ① 探针信号本身带噪——一次小注的盈亏可能纯属运气,N=1 的探针估出的 P 方差极大,你以为"测"到了,其实只是又抽了一次签;② 小注的信号分布 ≠ 大注的(exploration-exploitation mismatch):小仓位不触发对手反应、不移动价格、不勾起你重仓时的情绪与流动性约束,探针世界里的 P 系统性偏离重注世界里的 P。所以"小仓位就能廉价拿到真 P"是过度乐观——探针压缩的是不确定性,不是消除;它给的是一个有偏、带方差的 P 估计,该配更厚的安全边际,不该当成已知真值直接喂进 EV 公式。
善猎者不是感官天生敏锐的猎手。是一个给漏掉建了账、用探针测信噪比、把阈值写死在纸上不让情绪改它的普通人。"善"不是名词(一种人格),是动词(一套校准)。
终点:出手前先认世界,再跑判据 + 两张自检
钻到底,"善猎者善守"不是一句心法("攻守一体""be water"),是一套出手前的检验流程。但跑判据之前,先问一个前置的元问题——它决定你接下来该用哪套尺。
判据零:这把属于哪个世界?(选尺)
输了这一把,还有下一把吗?这笔注的坏结局,会不会把我踢出游戏(吸收壁/清零/不可重建的身体与基因)?
P 是可估的概率(已知分布),还是根本不可知(奈特不确定性)?
- 可重复 + 可承受 + P 可估 → 走纯 EV:跑判据一、二、三,EV 为正就狠。
- 不可逆 / 不可承受 / P 不可知 → 生存优先:先把 size 砍到"输光也不出局",再回头跑 EV。 砍不到可承受 → 直接弃,无论 EV 多漂亮。
先认世界,再选尺。在生死局上用重复博弈的尺,是把统计学的鬼魂当成真人。
判据一:这是真信号还是噪音?(估 P)
我凭什么认为这是真信号?证据是独立可验证的,还是我手痒之后给自己编的故事?
信噪比能不能用一个小仓位探针便宜地测一下,而不是直接重注?
P 说不清 → 先探针,别重注。讲不出独立证据,基本是噪音。
判据二:成本有多不可逆?(定阈值)
这步走出去,能不能收回?不可逆性越高,EV 为正所需的 P 就越高,阈值就该越高。
可逆的事 → 低阈值,快试(试错就是采集 P)。不可逆的事 → 高阈值,慢动(反脆弱:把单次不可逆的大注,拆成多次可逆的小探针)。
判据三:漏掉的账记了吗?(对抗单边漂移)
如果这次不出手,后来证明是真信号,我认不认这笔机会成本?
还是我会用"我本来就在等更好的"把它从账本上抹掉?
抹账 = 阈值正在被恐惧单边推高。记账才让你看见自己是不是已经从耐心滑成了瘫痪。
自检 A:耐心 / 瘫痪(可重复世界里用)
| 此刻你不出手,问自己 | 答"是"→ 耐心(埋伏) | 答"是"→ 瘫痪(僵住) |
|---|---|---|
| EV 现在为正吗? | 否(在等它转正) | 是,但我还是没动 |
| 真肥球进来我扣得动扳机吗? | 能,且会重仓 | 会再找个理由继续等 |
| 我在等什么,说得出具体条件吗? | 说得出(A/B/C) | 说不出,只是"更好的" |
| 我盼还是怕信号出现? | 盼(猎是目的) | 怕(信号逼我面对敢不敢) |
| 把注砍到可承受 size,我扣得动吗? | 能(怕的是亏不是死,问题回到纯 EV) | 还是不动(那不是生存纪律,是瘫痪) |
右列中任意两个为"是" → 你不是在善守,你在用"善守"给瘫痪发通行证。
自检 B:这把会不会清零(不可逆世界里用)
| 问自己 | 是 → 生存先于期望 |
|---|---|
| 输光这一把,我会被踢出游戏吗? | 是 → 无论 EV 多正,先砍 size |
| 这把的 P 是真估出来的,还是猜的? | 猜的 → 当不确定性处理,留更厚的安全边际 |
| 砍到"输光也不出局"还划算吗? | 不划算 → 弃;划算 → 拆成探针再玩 |
任意一个踩到吸收壁 → 生存约束凌驾 EV。永不押上无法承受的注。
谁死在哪个判据(对号入座)
前三层各守一道判据。每道判据放走一类特定的人——不是泛泛的"乱猎/只守",是有面孔的死法:
| 判据 | 守的是什么 | 死在这里的人 | 怎么死的 |
|---|---|---|---|
| 判据零(生存) | 不被单次清零 | 有显性 alpha 的交易员——信噪比真高、EV 真为正,正因为太信自己的尺 | 把每把都押满,凯利越界,千次正 EV 抵不过一次吸收壁,赚到的全吐回去再清零 |
| 判据一(估 P) | 真信号 ≠ 噪音 | 手痒的行动派——把"在做事"当美德,每个晃动都编个故事 | 假阳率爆表,被噪音一刀刀放干血(乱猎) |
| 判据二(定阈值) | 阈值校准且能执行 | 被假阳训练过度的老手——α≫β 把阈值棘轮到甜区之外 | 漏掉率趋近 100%,真肥球进来也焊死扳机,慢性失血当成了稳健 |
| 判据三(记漏账) | 看见单边漂移 | 理工思维者——只认对账单上的数,漏掉不进账=不存在 | 持续支付看不见的机会成本,误判自己在"善守",其实早滑成瘫痪 |
判据零最反直觉:死在这里的恰恰是 alpha 最强的人——尺越准,越敢押满,越容易在不可逆的那一把上踩穿吸收壁。强 edge 不豁免生存约束,它放大违反生存约束的后果。
三个该(把上表翻成动作)
✅ 先认世界再选尺——可重复用 EV,不可逆用生存约束;在生死局上算期望值是把鬼魂当真人(治判据零的死)
✅ 守住一个写死的阈值,而不是守住"不动"本身——能瞬间转猎的静止才叫埋伏(治判据二的死)
✅ 给漏掉建账 + 用探针测信噪比——记账治判据三的盲区;探针双重作用:测 P(治判据一),且把"单次不可逆"拆成"多次可承受"(治判据零)
收口
善猎者善守,不是因为他攻守皆能,也不是因为他无我如水。
是因为他先认清这一把活在哪个世界:
可重复时,他只在 EV 为正时扣扳机,其余按住手——肥球真进来,他扣得动。
不可逆时,他先保证自己不被一把清零——因为期望值的全部意义,是你还在桌上。
按得住,是守。扣得动,是猎。先不死,是守的守。
三件事,用的是同一根手指。
差别只在那一刻:信号来时,你的手,是松开了,是焊死了,还是——压根不该把整条命押在这一指上。
(箭到底了。)
