第一部分 熵的故事
内幕消息
凯利是这样描述他的想法的:一个“有内幕消息的赌徒”可以提前知道棒球赛或者赛马的结果。这些消息或许不是百分之百可靠,但足以让下注者占尽先机。下注者能够按照正常的“公平”赔率进行下注。凯利提出的问题是,下注者应该如何使用这份内幕消息?
这并不像你想的那么容易。举一个极端的例子。一个贪婪的赌徒可能会受内幕消息的诱惑,将他全部的资金都押注在一匹赛马上。他押注的钱越多,赢的就越多。
采取这个策略的问题在于所收到的信息不一定准确。处于优势的赛马迟早都可能会输掉比赛。一旦内幕消息有误,那么总是赌上自己全部资金的赌徒将会输光一切。
同样,采取相反的策略也不好。胆小的赌徒可能每次收到内幕消息后都做最小额押注。这样即使信息有误,他也不会损失太多。但是,最小额押注也就意味着盈利最小。那么,胆小的赌徒就浪费了内幕消息提供给他的巨大优势。
赌徒应该怎么做呢?他如何能在不破产的前提下充分利用内幕消息?
那些以此发家致富的幸运儿们是通过“连本带利赌博”(parlaying)的方式实现这一点的。他们赢了之后会把赢得的钱的一部分或者全部押注在另一匹赛马上,以此类推,这样每一次都会让财富呈指数增加。凯利的结论是赌徒应该像股票或债券投资者一样关注“累积收益”。赌徒应该用每场比赛的盈利百分比来衡量是否成功,而不是用美元来衡量。最佳策略就是能够让你在没有破产风险的前提下获得最高累积收益的策略。
凯利后来表明香农在他的噪声信道理论中用到的数学运算同样适用于贪婪却谨慎的赌徒。正如有可能在不出现任何差错的情况下在通道中发送消息一样,赌徒也可以在不承担破产风险的前提下最大限度地累积财富。香农理论中的鱼和熊掌兼得的属性同样适用于赌博。
凯利对赛马赌博的派利分成法㊟进行了分析。在美国以及很多亚洲赛马场,赌徒们自己设定赔率。马场将特定场次比赛的所有“获胜”赌注累加起来,扣除马场手续费和税,将剩下的钱分给押对获胜马的人。
因此,受益取决于押在获胜马上的赌金有多少。在没有手续费的情况下最容易解释。假设有六分之一的钱押注在“聪明的琼斯”(Smarty Jones)这匹马上,然后“聪明的琼斯”最终获胜,那么每个押注这匹马的人拿到的收益都是本金的6倍。通常可以用赔率来表示:“聪明的琼斯赔率是5:1。”意思是说,如果某个人赌了10美元,那么他将获得50美元盈利+10美元本金(共60美元)。
凯利描述了一种收到内幕消息的赌徒押注的简单方法,仅适用于马场不收手续费的情况(根本没有这样的马场)或内部消息可信度极高的情况。策略就是每场比赛都将全部资金拿来押注,根据收到的内幕消息——每匹马的获胜概率按比例分配押注金额。
在这个系统中,你实际上对每匹参赛马都进行了押注,肯定有一匹马会获胜。那么,每场比赛中你肯定有押对的马,这样你就永远不会彻底破产。
奇怪的是,这也是增加你财富的最快方式。大多数人觉得难以置信,因为在轮盘赌中对每个数字进行押注是不会发家致富的。
那是因为轮盘赌中的胜率是有利于赌场的。这与我们假设的不收手续费的赛马场和拥有内幕消息的情况是不同的。看一看赌金结算公示板。张贴出来的赔率反映了所有不知道内部消息的笨蛋们的普遍看法。如果你能根据公示的赔率进行押注,那么每场比赛中你都能将赌金赢回来(依然假设马场不收手续费)。如果“海饼”(Seabiscuit)这匹马的赔率是2:1,意味着大家相信自己有三分之一的获胜机会,你将把资金的三分之一押在“海饼”上。如果它赢了,你将拿回三倍赌金,也可能是你的全部初始赌资。同样,对于其他任何一匹马皆如此,无论是你偏爱的赛马,还是从长远的角度出发选择的赛马。
凯利的赌徒忽略了公布的赔率信息。内幕消息为其提供了更加精确的赛马取胜的概率,然后他根据对概率的仔细估算合理分配押注金。
举个最清楚的例子。内幕消息说“战神”(Man o'War)肯定会赢。根据以往的经验,如果内幕信息从未失误过,你就能确定“战神”一定会赢,其他马获胜的概率为0。那么,你就知道怎么分配赌金了——全部押注在“战神”上。当“战神”获胜后,你就可以根据赌金结算公示板上公布的赔率获得相应的收益。显然,这是从完全正确的内幕消息中获利的最佳方法。
凯利(和香农)的这一系统更多时候是处理不确定性问题的。在现实世界中,不存在完全确定的事情。内幕消息有时候可能会出错或者有意欺骗顾客——或者线路中存在噪音使你无法确定听清消息。也可能内幕消息为你提供的只是可能性,像天气预报一样,或者内部消息的隐含意义必须要靠你自己去理解(比如,“菲尔·莱普没吃早饭”)。
香农的噪声信道定理中描述了一个被恰当地称为“含糊性”(equivocation)的量——对含糊性的测量。在不可靠来源(假设你选择将这种来源视为通信通道的一部分)的情况下,含糊性可能取决于发音相似的词、错别字、故意为之的模糊陈述、错误、托词,或者谎言。含糊性阐述了接收错误信息的可能性。香农表示你必须要从信道中去除含糊词,这样才能获得正确信息。
凯利的赌徒也必须要考虑到含糊性因素。他要根据对胜率的最佳估算进行押注。当你相信“战将”(War Admiral)获胜的概率为24%的时候,你应该将24%的资金押在“战将”上。这种方法被叫作“信念下注”。
长期来看,“信念下注”将会让你可能获得的累积收益最大化——前提是你对赔率的评估比其他人更加准确。
你或许还在疑惑为什么不只押注在最可能获胜的赛马上,简洁地回答,就是最可能获胜的赛马也可能会输。假设你收到非常精确的通讯消息,于是相信“北地舞者”(Northern Dancer)获胜的概率为99%,你把99%的钱押在了“北地舞者”上,那么你兜里还能剩下1%的钱。
“北地舞者”输的概率为1%。如果它输了,那么你就只剩下兜里那点钱了。你可以把留在兜里那点钱押注在其他所有赛马上,这样可能会更好地实现赌资对冲。那样你可能会获得些收益,也可能是很多收益。押在你认为会输的赛马上的钱是一份非常珍贵的“保单”。一旦罕见的灾难降临,你会为拥有一份保单而倍感欣喜。
“信念下注”暗含一种诗意的优雅。你扮演快乐的傻瓜就好。忽略掉公示板上的赔率,根据自己对内幕信息的信念按比例对每匹马进行押注。没有比这更简单(头脑简单)的事情了,但也没有比这能让投资赚钱的方法了。
那些思想不够诗意的人会发现在真正的赛马场上“信念下注”几乎没什么用处。美国各地的赛马场收取的手续费占赌金总额的14%~19%不等,在日本则高达25%。也就是说,任何一个每场比赛都赌上全部资金的人实际上每次都要把这笔赌资的14%~25%交给马场。要想克服这一点,除非获得非常精确的内幕消息。
针对同一个基本体系,凯利阐述了另外一种方法,一个更加有用的版本。我列出的公式与凯利在1956年文章中列举的稍有不同。这个更容易记住,还可以应用到多种形式的赌博获利中。这就是赌徒们现在所说的“凯利公式”(Kelly Formula)。
凯利公式提出你应该按照这个比例对一项有利赌博进行下注:胜率/赔率。
“胜率”(edge)指的是你对获胜的期待程度。一般来说,假设你可以在相同的概率下不断进行此类投注。它是一个分数,因为收益总是与下注金额成比例。
“赔率”(odds)指的是公众或赌金结算公示板公开的赔付比例。衡量的是如果获胜,你将获得的收益。赔率可能是8:1,意思就是如果获胜,你获得的收益将是8倍投注金+投注本金。
在凯利公式中,赔率未必能对概率做出很好的衡量。赔率是由市场力和其他每个人对获胜概率的信念决定的。这种信念可能是错误的。事实上,一定要是错误的,这样凯利的赌徒才能够占有优势。凯利的赌徒收到的内幕消息中并不包含赔率的信息。
例如,赌金结算公示板上“海饼”的赔率是5:1。赔率也是一个分数,5:1的意思是5/1或者5。其中,这个“5”就是你想要的一切。
内部消息告诉你“秘书”(Secretariat)实际的获胜概率为1/3,那么在“秘书”上押注100美元,就有1/3的机会获得600美元。平均来看,总值就是200美元,净收益为100美元。这样,胜率就是100美元净收益除以100美元投注金,结果是“1”。
凯利公式中,胜率/赔率是1/5。这就是说,你应该把赌金的1/5押在“秘书”上。
下面列举几种情况帮助你理解。首先,如果没有内幕消息,你的胜率就是“0”或者负值。如果你没有内幕消息,那么别人不知道的信息你也不知道,你的胜率就是“0”(或者扣除马场手续费,胜率其实是负值)。如果胜率为“0”,那么根据凯利公式,胜率/赔率=0,所以不要下注。
其次,如果胜率与赔率相等,那么这就是一场稳赢的赛马。你从内幕消息中获得的最有益的信息就是得知这场比赛结果已经确定,这匹马肯定会赢。那么,你能从一场稳赢的赛马中获得多少收益取决于赔率。如果赔率是30:1,那么投注100美元将获得3000美元利润。如果这匹马一定会赢,那么你的胜率和公众赔付率相等(这个案例中都是30)。凯利公式的结果就是30/30或者100%,那么你可以赌上一切财产。
除非你认为内定马赛的人并不总是值得信任。“含糊性”将会降低你估算的胜率,同时也会降低你的投注金额。
凯利的一个方程式——G=R,像E=mc一样大胆漂亮。
“G”指的是赌徒资金的增长率。这是根据赌徒“投资”计算累积收益的一种方法。下角标max是指我们所谈论的是最大可能收益率。
凯利将这种最优化收益等同于“R”,这是香农理论中的信息传输率。最大收益率等于“内幕消息”的传输率。
对于爱因斯坦的很多同龄人来说,E=mc根本说不通。质量和能量是两个完全不同的概念。凯利方程式同样让人迷惑不解。金钱=信息量?你怎样把比特和字节与美元、日元和欧元划等号呢?
好吧,先不管货币单位,这并不重要。G描述的是收益率,就好比每年收益一个百分点或者多个基准点(一个基准点是年收益一个百分点的一百分之一,即0.0001)的用法。收益7%指的是在任何货币形式中收益都是7%。
“R”是每时间单位以字节计算的信息率。等式两边的时间单位必须相同。如果你用每年多少百分比来计算收益,那么你就同样需要用每年多少字节来计算信息率。
今天,马场消息可能会通过手机或互联网传输过来。这些带宽相对高的信道可能会使用上千甚至上百万个字节,就只为了表达“海饼肯定能赢”这条信息。密报者可能还会闲聊几句,占用更多带宽。
很显然,闲聊并不能增加赌徒的潜在收益。同样,如果可以利用文本信息或者其他更精确的方式使用更少的字节传输相同的信息,那么语音通道的存在也就没有什么意义了。凯利的方程式只是设定了在特定带宽下你能获得的收益上限。只有当获胜赛马信息以可能的最少字节传输时才能实现这个最大值。再想想最初的通信服务,当时情报员要用镜子反光或者不反光这样的信号在通信沿线发送获胜信息。
从8个同样可能获胜的竞争者中确定一个最终获胜者的最简明方法是使用三位数代码。共有8个三位数的二进制数字(000,001,010,011,100,101,110,111),给每匹赛马都分配一个数字,然后你需要3个字节来发送获胜马信息。
如果这个三位代码的信息是正确的,那么赌徒就可以把全部赌金押注这个代码代表的那匹马上。在不收手续费的马场中,所有这8匹马被认为获胜的可能性相同,那么押在获胜马上的每元钱都将变成8美元。凯利的赌徒们每次收到一个三位代码都可以增加8倍财富。请注意,8=2。“3”是指数,决定赌徒财富累积的速度。这个指数与接收的内幕消息的字节数位相等。
在更加现实的情况下,内幕消息并不总是正确的,必须要去除含糊词,那么每场比赛的信息率就少于3个字节。由于信息并不完全可信,赌徒最优化财富增长率也会变慢。
E=mc暗示最小颗粒的物质包含的能量足以为一座城市提供能量,或者足以将一座城市烧毁。G=R则表明,几个字节就能够创造出超越任何组合投资经理或者放高利贷者梦寐以求的收益。一个字节(每年或者你可以选择任何时间单位)——比如一个人发送了一个词,代表一场胜负机会均等的拳击比赛的结果——将会使一个赌徒赢回双倍的钱,那么1字节的收益率就是100%。
把G=R翻译成华尔街用语就是:1字节价值10000个基准点。