|
关键字:埃罗模型(ELO model) , RateForm , TR(Team Rating) , 泊松分布(Poisson distributing)
RateForm的概念,最早由Professor Elo在「The Rating of Chessplayers」一书中提出,用以从比赛结果中公平地分析强者与弱者的真正实力差距,其后在「The Punter's Revenge」一书中被Tony Drapkin和Richard Forsyth引用来预测足球赛果,并广泛沿用至今。其基本运作如下:
1. 每队在季初均获的一相同的固定底分 (e.g. 1000)
2. 主队及客队各投入其底分的某个百分比进「彩池」内,主队投入的百分比较高以反映「主场之利」 (e.g. 主队7% vs 客队5%)
3. 胜方获得「彩池」内的全部分数
4. 打和时双方平分「彩池」内的分数
研究ELO模型已经有一年多的时间, 期间曾经在网上找过很多有关ELO系统的资料,绝大部分是英文资料, 中文的资料好像只有本版的几篇文章有介绍. 不过发现在手头上有的资料当中,都并没有对埃罗模型在预测足球比赛方面进行深挖和拓展. 「The Punter's Revenge」一书是86年出版的(以下简称书), 20年时间其中的elo模型似乎没有什么发展, 甚至连书中所阐述的几点原理都没有人做过解释. 现在就我建立ELO模型的思路作一个说明, 算是给国内研究ELO模型的朋友一点参考.
elo模型是一个相对封闭的系统 ,它最基本的特点是公平原则.
elo模型在季初对于每队球队都赋予相同的等级分(一般是1000), 就是说在赛季初每支球队的起步线是相同的, 球队通过比赛才能体现出自身的实力. 换一个角度,我们把球队看作拳击手,每场比赛比赛看作是拳手之间的比赛. 赛前双方均要下一定数额的筹码, 根据比赛结果, 重新分配财富. 通过一系列的比赛,财富越多的拳击手, 则实力越高.
1.投入分配系数,等效得失球数,Poisson函数
前面说过两支球队在交锋之前必须要投入一定的筹码,应该怎样分配投入比例才公平呢?比赛有主客场之分, 主队拥有场地,球迷,心理等等的优势, 因此需要下注的数额比例一般情况下要高. 在统计过世界范围内50000多场足球比赛数据后发现, 主队的进球数与失球数之比约等于7:5, 净胜球约为0.38球. 具体到英超联赛,根据统计威廉,立博对英超比赛开盘的平均等价让球约为0.34左右. 就是说当两支等级分为1000的球队比赛,主队的主场优势为0.34球. 这里不得不提到净胜球和等级让球的区别,在我印象中B版曾经谈过类似的话题,但可以很容易理解得到,球队面对不同的对手净胜球的能力是不同的,所以净胜球≠ 等价让球。 这里我要提出一个观点, 书中所说的投入比例7:5是基于总体平均入球数与失球数之比得出, 把所有主场球队和所有客场球队分别看作两个独立整体,则它们之间的平均实力差≈0.38。 但真实的情况是比赛双方球队的实力差往往不等于0.38,因此它们下注的比例不可能总是7:5。 既然双方赛前投入的比例与得失球数有关,那么在我的设计理念中就得引入等效得失球数这个概念。
说到等效得失球数必须提到poisson函数的应用,下图是等效得失球数与主客得失球数的关系。
等效得失球是poisson函数的衍生产物,其决定因素分别有主队主场进球数,主队主场失球数,客队客场进球数,客队客场失球数,主客实力差,中值和平局率等等。 其中最关键的是主客实力差,因为它主宰着比赛概率的分布。在我设计的模型中两队投入的分配系数就是等效得(失)球数占总体的百分比。
4.“财富”的分配方法
「The Punter's Revenge」中提到有关赛后分配的方法是“胜方获得「彩池」内的全部分数 , 打和时双方平分「彩池」内的分数”。在这个基础上我对分配方法进行细分,虽然比赛结果只有三个(胜平负),但比分却有很多个,例如主胜有1:0,2:0,2:1等等。不同的比分有不同的概率,净胜球数越高的比分概率越小,从客队获得的财富也越多。比分的概率可以通过Poisson函数表得出,从而可以计算出在该比分下主队可以从客队身上取走多少财富。
5.球队实力的连贯性
elo模型设定了从每季开始的时候各队的原始等级分都是一样(e.g 1000) , 但实际上每支球队的实力是不同的, 因此在财富投入和分配的时候需要加上往季的实力因素. |
|