评分卡生成

评分卡生成模型建立以后得到的 log odds 值是建模样本的好 坏比的对数 分值可以为负值 使得分值的可解读性很差 为了使得评分的结果更容易理解 更加具有实用性 我们希望看到评分卡的样子 通常对变量的特征值进行线性比例变换 并加上一个偏移量 公式如下 Score factor log odds offset factor a woe b of

模型建立以后得到的log(odds)值是建模样本的好/坏比的对数,分值可以为负值,使得分值的可解读性很差,为了使得评分的结果更容易理解,更加具有实用性,我们希望看到评分卡的样子,通常对变量的特征值进行线性比例变换,并加上一个偏移量,公式如下:

其中,比例因子factor和偏移量offset可以通过以下行业规则确定:

  • 好:坏 = 20:1 时,评分刻度为600;
  • 评分每增减20分,好坏比增加一倍。

    代码如下:

    def make_scorecard(formular,woe,basescore=600.0,base_odds=50.0/1.0,pdo=50.0): """ 一般行业规则,一般设定当odds为50时,score为600 Odds翻倍时,score+20 score = -(woe*b +a/n)*factor + offset/n factor = pdo/np.log(2) offset = basescore - factor*np.log(base_odds) basescore = float(600) base_odds = 50.0/1.0 pdo = float(50) #计算所需要的参数 """ a = formular[formular[u"参数"] == "Intercept"].ix[0,u"估计值"] formular = formular.iloc[1:,:] n = float(len(formular)) factor = pdo/np.log(2) offset = basescore - factor*np.log(base_odds) #生成评分卡 scorecard = pd.DataFrame() for i in formular[u"参数"]: woe_frame = woe[woe['var_name'] == i][['var_name','interval','min','max','PctRec','bad_rate','WOE']] beta_i = formular[formular[u"参数"] == i][u"估计值"].iloc[0] #woe_frame['score'] = woe_frame['WOE'].apply(lambda woe : offset/n - factor*(a/n-np.abs(beta_i)*woe)) woe_frame['score'] = woe_frame['WOE'].apply(lambda woe : offset/n - factor*(a/n+beta_i*woe)) scorecard = pd.concat((scorecard,woe_frame),axis=0) return scorecard

[1]参考资料:《SAS开发经典案例解析》(杨驰然)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/212201.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月18日 下午8:35
下一篇 2026年3月18日 下午8:36


相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号