囚徒困境


博弈论里面有一个著名的问题,就是囚徒困境。也是行为金融学中最为大众熟知的理论,在短线投资中以行为金融学为指导,在长线投资中以价值投资基本面宏观经济分析作为指导,而我的投资策略是以基本面分析与行为金融学相结合作为投资指导,首先来介绍一下囚徒困境。

警察抓到了两个嫌疑人,分开审讯,并告知了嫌疑人认罪与不认罪的后果:

  1. 如果两个人都认罪,结果各判五年;
  2. 两个人都不认罪,结果是各判一年;
  3. 如果一个人认罪,一个人不认罪,认罪的人免刑,不认罪的人加刑到十年。

两个嫌疑人的博弈矩阵如下

嫌疑人A \ 嫌疑人B 认罪 不认罪
认罪 A判5年,B判5年 A判0年,B判10年
不认罪 A判10年,B判0年 A判1年,B判1年

很显然,对于A和B两名嫌疑犯而言,选择都不认罪是上述情况的最优解,两人分别都只被判1年。但现在两人不知道对方的情况,结果必然变成双双认罪,为什么呢?

因为在嫌犯A看来,自己认罪的话,两种可能分别为“5年”和“无罪”,平均刑期2.5年;不认罪的话,两种可能分别为“10年”和“1年”,平均刑期5.5年;当然是选择认罪——嫌犯B也同样这么想,结果就是双双认罪。两个人明明都是选择对自己最有利的策略,叠加到一起反而不是最优解,这种局面被总结为:理性选择导致次优结果。

那囚徒困境跟投资有什么关系呢?本文将介绍四个投资中的囚徒困境

首先要说明一点,我并不是建议大家去把握这些机会,只是想以此为案例,理解囚徒困境这一经典的博弈行为在投资上的表现。

联合做庄的抢跑

2002年以前是A股的“庄股时代”,可谓无股不庄,常常有一些实力不够的资金联合做庄。联合做庄最脆弱的环节是在出货环节,必须统一指挥,利用牛市氛围边打边撤,如果有人率先出货,造成股价崩盘,结果就是除了这个先走的人,大家谁也走不了。

当然,嫌犯是分别审讯,不能通气,但联合做庄一般都是很熟悉的人,事后有严格的约定,所以在牛市,联合做庄的出货阶段一般没有问题,抢跑反而赔了夫人又折兵。

但出货阶段进入熊市,在危险与利益的选择面前,信任感荡然无存,博弈情境就跟囚徒困境一样了。

提前抢跑的两个可能分别是大赚(别人没跑)和逃出一部分,剩余随股价崩盘而深套(一起抢跑),不提前抢跑的两个可能是股价正常下跌,小赚(大家都没跑)和全部深套(别人抢跑)。

投资博弈

很明显,熊市信号明确后,最优策略就是“抢跑”,大家都“抢跑”,结果就是股价崩盘。事实上,导致“庄股时代”终结的,正是2001年进入熊市后,一起又一起的“抢跑”导致的强庄股、长庄股的崩盘。

献礼行情

重大节日或敏感时间前,都会有神秘力量在某些时候出手去稳定指数——这就成为第二个“囚徒困境”博弈的场景。明知未来的某个明确时间点,会有神秘力量托盘,那么在这个时间点之前,就会有资金介入博弈这个“XX行情”。这一类博弈性机会因为太明确,利润空间可能就几个点,买入成本决定了最终的利润,所以博弈资金一般只会在大盘下跌时介入,如果之前的行情涨得太高,就出现了囚徒困境博弈

并不是只有你一家去博弈,如果大家齐心,一起卖给前来托盘的“神秘力量”,那当然是最优选择,但如果大家一起卖,神秘力量恐怕托不住,这么一来,最优解就是提前一天卖。常规的XX行情,抢跑博弈会出现在“大日子”的前一天。可提前一天卖这种聪明人也不是一个人,自然有人想到提前两天卖,特别是手上已经有利润的。囚徒困境博弈的时间点,跟“大日子”前的上涨幅度有关,涨得越高,抢跑的博弈点越提前。

不过,经典的“囚徒困境”是一次博弈,机会只有一次,其结果必然更加惨烈,但重大节日的博弈是多次博弈,提前太多天卖完之后,只要大日子没有到,只要跌下来,很多资金还会重新杀进去再来一轮博弈。

这就导致了另一种情况,如果市场上的资金充裕,做多氛围大好,抢跑的资金卖出后又重新进场,就会导致博弈点出现在“大日子”当天,甚至第二天——就是这一次的“剧本”。但不管盘面如何强,节日博弈资金有明确时间节点,博弈的多空转换非常迅速,涨得越多,跌得也越快,就连原本不是博弈的资金,也因为盘面空头氛围过于明显,忍不住先卖空。重大节日博弈,因为有明确时间点和神秘力量,博弈的难度降低,收益或损失也相对较小,而下面介绍的“事件博弈”,因为不确定,难度和空间都大大增加。

没有明确时间点的事件博弈

这一类博弈最经典的是某一类重大政策,有些人提前知道了,提前介入体现在盘面上,导致更多的人关注和参与,但这类博弈难就难在没有明确时间点,甚至是否会发生也不确定。而失去“神秘力量”托盘后,能不能炒起来,完全看参与者多不多,预期有多高,会不会有实实在在的业绩增长的逻辑。所以,“事件博弈”最难的是判断事件的级别,当然,这不是本文的重点,“囚徒困境”体现的是最后的获利兑现阶段。

综合“联合做庄博弈”和“重大节日博弈”,何时卖出的决策,本质上都是在计算博弈矩阵中的“不抢跑”的结果和“抢跑”的结果,前者取决于你对行情的判断,后者取决于你已有的涨幅。“事件博弈”之所以复杂,是因为你对事件影响力的分析是不断发生变化的,股价涨幅在变化,博弈矩阵中的数值也在发生变化——事件越大,你的退出时间点越晚——不抢跑的收益越大。而且,你还要判断其他人对事件的看法,参与者越多越乐观,你的退出时间点越晚——不抢跑的收益越大。

更难的是,联合做庄博弈和重大节日博弈都是囚徒困境博弈,有肉眼可见的严格优势策略。但博弈并非只有“囚徒困境”这一种,事件博弈有时更类似于情侣博弈,你找不到严格优势策略,只有相对优势策略,会出现纳什均衡,此时,你的决策需要随其他人的行为而灵活变化。还有一些有经验的个人投资者,只赚最大级别行情的最确定的10%,这就是另一种智猪博弈。因为本文的主题是囚徒困境,所以情侣博弈智猪博弈就不展开了,建议大家自行了解,特别是情侣博弈,是抱团行情形成的行为金融学上的重要原因。这两类炒作,价值投资者完全不需要参与,但下面介绍的周期股的博弈,涉及到基本面的判断,对价值投资者同样重要。

周期股的博弈

周期股为什么会引发囚徒困境的博弈呢?假设某周期性行业进入价格上行期,公司A目前市值50亿,20年归母净利润为2个亿,机构一致性预测21年业绩为10亿。业绩一年涨5倍,股价会不会涨5倍呢?不一定,周期股在业绩低谷时,股价已经包含了未来反转的预期;同样,未来的业绩高点时,股价也会包含未来向下反转的预期,PE会降低,股价涨幅小于业绩涨幅。

假设投资者根据历史经验,判断21年底的合理PE是1015倍,达到100150亿市值,现在是50亿,还有一到两倍的上涨空间,很明显,投资者可以在现价买入。随着产品价格的上涨,盈利预期越来越明确,股价迅速上涨,也激发越来越多的投资者研究公司发现机会,不断出现的买盘将股价推升到90亿。从50亿到90亿的这一段,基本上一两周时间就能实现,周期股一旦预期明确,第一浪的行情力度往往是最猛烈的。

假设此时有两个投资者A、B,对公司的预测分别落在下限10倍的100亿市值和上限15倍的150亿市值。投资者A介入比较早,离成本有30%的空间了,投资者B刚刚研究完,还没来得及买。对于投资者A而言,从90亿到100亿,还可以再涨10%,空间看上去有,但这里有三个问题:

  • 第一,10倍PE是基于当下的市场氛围,如果大盘转熊,就不是如此了;
  • 第二,投资者A的风格是做赔率,赢利模式就是反转的第一波;
  • 第三、虽然到了年底100亿的可能性很大,但如果现在有人基于上面两个原因抢跑,股价会在80~90亿左右停留很久,到年底还有半年时间,从资金效率上看不划算。

任何一种可能,都会导致A抢跑,就成为一个典型的囚徒困境,股价也会在市值90亿左右因为第一批资金的跑路出现第一次震荡。当然,这个位置的博弈不会停留很久,对于投资者B而言,他是看150亿的,还有60%的空间,抢跑留下的股价震荡相当于一次清盘,抬高了所有人的成本,也是他买入的最佳时刻

这样,与B有同样预期的投资者把股价从80亿市值的震荡区间,推升到了120亿左右,基于上面的理由,就会出现第二次囚徒困境博弈。随着股价进入100~150亿的“当年合理市值区间”,第二次博弈将比第一次更激烈,因为周期股的终局近在眼前,到了这个位置,博弈关系类似联合做庄。虽然庄股完全没有价值,而周期股当下有价值,但下行总是要来的,资金必然会分批抢跑,晚跑的能不能顺利跑掉,就看产品价格能维持多久的强势,市场有多少把周期当成长、把补库存当成持续需求的韭菜。

所以,一旦大盘下眣,基于博弈的周期股,往往下跌速度更快,这也是囚徒困境造成的。相反,如果现货产品价格实在是强势,市场一致认为周期持续到2022年,并大幅提高了2022年的盈利预测,合理市值提升,那么博弈有可能还有第三次,但现货产品的价格不可能无限上涨,第三次博弈必然更剧烈。可以参考本轮的航运、锂电上游。相反,很多强周期股的预期如果过于一致,甚至没有第二波的博弈,第一波就涨几倍,股价直接到位,剩下的时间就是顶部反复震荡,直到产品价格反转,进入下行周期。可以参考2019年的猪肉股行情。任何缺乏长期价值的公司,短期业绩的增长因为存在明确的“终点”,都会引发“囚徒困境”博弈,投资者可以乐观,也可以谨慎,无非是预期的高低,唯一致命的错误,是把“博弈资金撤退但业绩还没出现向下拐点”的低PE公司看成低估,当成投资机会。

当然,万物皆周期,成长股只是周期更长的“长周期股”,同样有终点,未来同样会进入“囚徒困境”博弈,以前的成长股或价值股,要不断评估低估值是否因已经终局临近而进行“囚徒困境”博弈。

囚徒困境是否有解?

在联合坐庄的案例中无论机构是否坚守阵地,散户的最优解都是立即离场

在联合坐庄的博弈矩阵中投资者A和B可以都是机构,也可一个机构和一个散户,也可都为散户。它只是一个交易模型,便于我们理解囚徒困境在其中发挥的作用

因此,囚徒困境也就解释了当股灾到来的时候,散户和机构都会争先恐后的立即割肉离场,导致股价进一步下跌,然后再割肉,这个无解的死循环。如若不然就会被活埋。以上的分析只是基于将机构和散户具体化来讨论的。股市实际的情况远比上述模型复杂的多,我们假设参与博弈的散户和机构都是理性的,都是为自己争取最大利益的。那么当散户和机构陷入两个人的囚徒困境中,谁来解救呢?如果把模型中的散户和机构变成真实股市中成千上万的机构和散户,这可是千万人的囚徒困境,谁又来解救呢?

囚徒根本原因是二人的信息无法沟通,导致二人无法合作获取最优解。因此在股灾中企图希望机构之间,或者机构和散户的合作来稳定市场也是不现实的,因为每个投资个体都是独立的,是无法知道市场中其他的投资者是怎么想的,更进一步即使他知道其他投资者怎么想的,也可能为了自己的最大利益而选择背叛,

所以在股市暴跌的单边行情中,你不可能指望着机构和散户二者互相合作来自救。所以要解救股市中千万人的囚徒困境有以下方法:

  • 一是靠国家队给众人兜底
  • 二是看外资抄底给众人一个积极入市的信号

总而言之解决囚徒困境需要外力介入


Author: 顺坚
Reprint policy: All articles in this blog are used except for special statements CC BY 4.0 reprint polocy. If reproduced, please indicate source 顺坚 !
评论
 Previous
umi运行时配置 umi运行时配置
umi约定,src/app.js或 src/app.tsx文件为运行时配置,运行时配置和配置的区别是他跑在浏览器端,无需引用他们,应用启动时执行。其实就是几个封装好的函数,使用他们可以做特定的事情,不可以自定义函数 + src - ap
2021-11-25
Next 
主力运作股票的过程 主力运作股票的过程
股市中的涨跌背后的原理就是多空双方的资金博弈,散户与庄家分别在心理和资金上轮番对战。庄家资金量大,资金密集,消息面广,对股价操纵能力强,在博弈中往往处于主动地位。你曾否有想过形态分析的本质?你曾遇上指标失灵的时候?你曾试过忍心割肉后股价就大
2021-11-20
  TOC