【评分卡】评分卡入门与创建原则——分箱、WOE、IV、分值分配

全栈程序员-站长 • 2026年3月20日上午9:03 • 未分类 • 阅读 1

这里写图片描述

本文主要讲“变量选择”“模型开发”“评分卡创建和刻度”

变量分析

单因子分析，用来检测各变量的预测强度，方法为WOE、IV；

WOE

这里说一下，有的地方计算WOE时使用的是 $\frac{bad占比}{good占比}$ 的，其实是没有影响的，因为我们计算WOE的目的其实是通过WOE去计算IV，从而达到预测的目的。后面IV计算中，会通过相减后相乘的方式把负号给抵消掉。所以不管谁做分子，谁做分母，最终的IV预测结果是不变的。

IV

IV	预测能力
<0.03	无预测能力
0.03~0.09	低
0.1~0.29	中
0.3~0.49	高
>=0.5	极高

根据IV值来调整分箱结构并重新计算WOE和IV，直到IV达到最大值，此时的分箱效果最好。

分组一般原则

组间差异大
组内差异小
每组占比不低于5%
必须有好、坏两种分类

举例说明

例如按年龄分组，一般进行分箱，我们都喜欢按照少年、青年、中年、老年几大类进行分组，但效果真的不一定好：

Age	good	bad	WOE
<18	50	40	$ln(\frac{50/330}{40/220}) = -0.3955$
18~30	100	60	$ln(\frac{100/330}{60/220}) = 0.7826$
30~60	100	80	$ln(\frac{100/330}{80/220}) = -0.3955$
>60	80	40	$ln(\frac{80/330}{40/220}) = 0.1781$
ALL	330	220

根据IV值可以看出，预测能力低，建议重新调整分箱。

建立模型

评分卡

评分卡计算方法

设置比率为 $\theta_0$ （也就是odds）的特定点分值为 $P_0$ ，比率为 $2\theta_0$ 的点的分值为 $P_0+PDO$ 。带入上面公式可得到：
$\begin{cases} P_0 &= A+Bln(\theta_0) \\ P_0+PDO &= A+Bln(2\theta_0) \end{cases}$
求解上述公式，可以得到A、B值：
$\begin{cases} B &= \frac{PDO}{ln2} \\ A &= P_0-Bln(\theta_0) \end{cases}$

$P_0$ 和 $P D O$ 的值都是已知常数，可以设置 $P_0 = 600$ 和 $P D O = 20$ ，
可以计算出A、B值。
这里 $P_0$ 和 $P D O$ 主要是根据你想要分数落在一个什么范围内，然后进行人为设定，不用太纠结取值的意义。

分值分配

之前步骤中每个变量都有进行分箱操作，分为若干类。所以下一步的话，把每个变量对应的分数，分别乘以变量中每个分箱的WOE，得到每个分箱的评分结果。

变量	分箱类别	分值
基础分数	–	$A+B*w_0)$
$x_1$	1 2 … $i$	$Bw_1)WOE_{11}$ $Bw_1)WOE_{12}$ ··· $Bw_1)WOE_{1i}$
$x_2$	1 2 … $j$	$Bw_2)WOE_{21}$ $Bw_2)WOE_{22}$ ··· $Bw_2)WOE_{2j}$
···	···	···
$x_n$	1 2 … $k$	$Bw_n)WOE_{n1}$ $Bw_n)WOE_{n2}$ ··· $Bw_n)WOE_{nk}$

以上步骤都完成后，假如新产生一个用户，我们只需将此用户每个变量对应到各分箱中得到其对应的WOE值，再根据上面的公式计算出这个样本在每个变量下的分数。最后将所有变量对应的分数相加，即为最终评分结果。

最后说一下，特征选择方面，并不是维度越多越好。一个评分卡中，一般不超过15个维度。可根据Logistic Regression模型系数来确定每个变量的权重，保留权重高的变量。通过协方差计算的相关性大于0.7的变量一般只保留IV值最高的那一个。

引用
《信用风险评分卡研究》Mamdouh Refaat著
《互联网金融时代消费信贷评分建模与应用》单良著
手把手教你用R语言建立信用评分模型
《统计学习方法》李航著

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/201588.html原文链接：https://javaforall.net

【评分卡】评分卡入门与创建原则——分箱、WOE、IV、分值分配

变量分析

WOE

IV

分组一般原则

举例说明

建立模型

评分卡

评分卡计算方法

分值分配

关于作者

全栈程序员-站长

发表回复

【评分卡】评分卡入门与创建原则——分箱、WOE、IV、分值分配

变量分析

WOE

IV

分组一般原则

举例说明

建立模型

评分卡

评分卡计算方法

分值分配

关于作者

全栈程序员-站长

相关推荐

java jasypt_Jasypt「建议收藏」

阿里云通义千问宣布 Qwen-MT 机器翻译模型：支持 92 种语言互译

零基础也能行！本地部署DeepSeek-R1模型全流程指南

科大讯飞：升级后的星火X1在知识问答等任务上效果显著提升

stat 文件_readlink函数

pycharm使用anaconda虚拟环境_conda和anaconda

发表回复