老饼讲解:一步一步上手学习
接上文《评分卡实例-逻辑回归建模》
前文提要与本文概述
上节我们通过建模,得到评分卡中的逻辑回归模型:
一般不用逻辑回归模型进行预测,而是制作一张评分卡,使用时通过评分卡,计算用户的评分。
下面我们就来一起看看什么是评分卡,以及如何制作评分卡。
本节讲解如何将逻辑回归模型制作成评分卡。
逻辑回归模型得到的客户逾期的概率,而评分卡最终输出的是客户评分,模型转评分就是指将逻辑回归模型转为评分输出,转换方法是把逻辑回归模型的线性部分抽出,并作一定的线性缩放, 转换公式如下:
-------- (1)式
可以看到,它其实就是把逻辑回归的WX+b部分通过offset和factor两个参数来进一步线性映射为分数,而其中的offset和factor则是待定的参数。
好了,factor和offset两个参数怎么确定呢,其实factor和offset一般不直接设定,而是通过设定init_socre,init_odds,delta_score,delta_rate四个参数来间接计算,四个参数的意义如下:
init_socre,init_odds:odds为init_odds时,评分为init_socre。
delta_score,delta_rate:odds每降低 delta_rate倍时,分数提升delta_score分。
备注: ,即odds是“是坏客户"的概率与"是好客户"的概率的比值。
这里我们只讲模型转评分是怎么做的,关于四个参数与offset和factor等原理详见《模型转评分-原理》。
根据业务需要设好四个参数后,再用以下公式确定 factor 和 offset:
理论上,设置好四个参数,就可以得到 factor 和 offset,再通过(1)式就可以计算客户的评分了。但实际上,评分一般不用上述公式,而是制作为评分卡,通过查表的方式来计算评分,下面我们说说评分卡表怎么制作。
接下来我们说说评分卡表是怎么制作的。
由于(1)式可以化为以下形式:
把上式中的 看作基础分,看作特征得分,那么用户的总分就是每个特征的得分(FetureScore),再加上基础分(BaseScore), 因此,把各个特征的各个分组的得分与基础分一起制成如下表格:

在计算用户得分时,只需根据用户各个特征所属分组,在表中查得特征得分,再加上基础分就是用户的总评分。
上面说的都是理论,下面我们通过实例,来更具体的看看是如何基于模型制作出评分卡表的。
在本实例中,评分卡模型转评分的过程如下:
一、参数设置
先设置 init_socre,init_odds,delta_score,delta_rate四个参数的值。
一般设为:
它的意思是,当 odds(坏账概率 : 不坏账概率) = 50 : 1时,分数为600,当 odds每降低2倍(例如从50 : 1降为25 : 1),分数提高20分,这个设置就是最标准的设置了,这套参数(600、50、20、2)老饼没有去细究,但国外文献、软件一般都是用这套参数,而在国内有时候习惯限制在100分内,那就要自己适当调整了。
二、计算offset 、 factor
设置好上述参数后,使用公式计算offset 和 factor :
三、计算基础分与特征得分
根据offset和factor就可以计算评分卡的基础得分与特征得分,具体如下:
1. 计算基础得分
由模型的阈值b = -2.5393,代入基础分计算公式,得到基础分为:
2. 计算特征得分
以rev为例,rev的系数为0.6668,当分组为0时,woe值为−1.5056,可算得当特征rev为第0组时的得分为:
如此类推,把各个特征变量的各个分组的得分都计算出来,就得到评分卡表了。
将基础分与各个特征的得分汇总,就是最终的评分卡表了,本实例中,汇总后的评分卡表如下:

模型应用时,即对客户评分,如下使用:
(1) 先通过客户特征数据,判断客户各个特征属于哪一组。
(2) 通过特征所在分组,查询特征评分表,获取各个特征的评分。
(3) 计算总分:总分= 各特征评分 + 基础分。
备注:在将评分卡布署到生产时,往往会将所有分数都进行取整
好了,根据上述流程,就把评分卡表制作出来了,但评分时还需要依靠阈值才能确定用户是否通过,下张文章再我们再来讲解如何制作评分卡的阈值表~它可以用来辅助我们确定评分阈值。
简单来说,模型转评分其实就是设置好相关参数来得到factor和offset, 然后就可以计算出基础分和各个特征各个分组的得分了,组合在一起就是评分卡表了,在这里我们更倾向于"怎么做评分卡",对于一些原理在这里我们是能忽略就忽略的,如果想深究,可以在"进阶篇"中详细了解。
评论