风控模型的基础知识

风控模型的基础知识风控模型根据设定的y变量与可获得的x变量不同,大致可以分为三类:即A卡,B卡,C卡。今天就让我们聊聊三者的区别。1、A卡(Applicationscorecard)A卡即申请评分模型,此类风控模型的目的在于预测申请时点(申请信用卡、申请贷款)未来一定时间内逾期的概率。Y变量的设定观察点为申请时点,定义为表现期内是否逾期。X变量一般只有客户填写的申请书信息,加上外部查询的数据与征信报告。2、B卡(Behaviorscorecard)B卡即行为评分模型,此类风控模型的目的在于预测使用时点(获得贷

大家好,又见面了,我是你们的朋友全栈君。

一、 风控模型的A卡、B卡、C卡
风控模型根据设定的y变量与可获得的x变量不同,大致可以分为三类:即A卡,B卡,C卡。今天就让我们聊聊三者的区别。
1、A卡(Application score card)
A卡即申请评分模型,此类风控模型的目的在于预测申请时点(申请信用卡、申请贷款)未来一定时间内逾期的概率。Y变量的设定观察点为申请时点,定义为表现期内是否逾期。X变量一般只有客户填写的申请书信息,加上外部查询的数据与征信报告。
2、B卡(Behavior score card)
B卡即行为评分模型,此类风控模型的目的在于预测使用时点(获得贷款、信用卡的使用期间)未来一定时间内逾期的概率。Y变量设定观察点为使用期间的某一时点,定义为表现期内是否逾期。由于行为评分模型的观察点在获得贷款或信用卡之后,这段时间内是可以获取到贷款或信用卡的使用还款行为数据的。另外使用过程中同样可以查询外部数据和征信报告的变化,这些行为数据衍生成x变量后,模型的效果会大大提升。
3、C卡(Collection score card)
C卡即催收评分模型,此类风控模型的目的在于预测进入催收阶段后未来一定时间内还款的概率。Y变量设定的观察点为进入催收阶段的时点,定义为表现期内是否还款。催收评分模型有一个特有的数据,那就是催收的行为。比如打过几次电话,是否约定还款等等,这些催收行为x变量会影响催收模型的效果。

适用场景:

1.使用的时间不同。分别侧重贷前、贷中、贷后;
2.数据要求不同。A卡一般可做贷款0-1年的信用分析,B卡则是在申请人有了一定行为后,有了较大数据进行的分析,一般为3-5年,C卡则对数据要求更大,需加入催收后客户反应等属性数据。
3.每种评分卡的模型会不一样。在A卡中常用的有逻辑回归,AHP等,而在后面两种卡中,常使用多因素逻辑回归,精度等方面更好。

二、表现期&观察期
何为目标(即所谓的y值),在风控模型的门类中一般就是指某个客户或账户是否逾期(通常以0,1)来区分。我们在建立风险模型的时候,不能简单地将逾期客户定为1,未逾期客户定义为0。这需要结合时间点、逾期程度来判断。
在这里插入图片描述

  1. 观察期
    观察期是相对于观察点而言的。需不需要观察期要根据建立模型的业务应用场景来设定。如果是申请类的模型,只需要观察点就可以了。因为所有的申请信息都是在申请动作完成的那个时点获得的。如果是行为类的模型,就需要一个观察期,在观察期中提取客户行为表现数据,以便进行后续的建模操作。
    阶段总结一下,观察点和观察期是衍生x变量的时点或时期,所有的衍生变量要只能在此时间点和此时间点之前生成,不能使用此时间点之后的信息,否则就会产生使用未来信息的情况。
  2. 观察点
    在这一时间点上,账户和客户的信息被作为“当前月”信息进行提取,等同于对账户/客户进行风险评估的生产系统中的当前月。一般来说,可以使用一个“观察点”来提取历史数据,但如果受到样本量的限制,可以考虑采用迭式(stacking)的方式,即选取多个“观察点”,以便扩大样本量。另外,如果业务发展受季节影响较大,可以考虑在每个相应的季节选取一个“观察点”。
  3. 表现期
    表现期是对观察点上账户/客户表现进行监控的时间周期。这些账户根据截止到表现点的表现被分类成“好”和“坏”。表现期需要有足够的长度,不能够太短,从而保证样本群体分类的稳定性,使账户/客户的行为充分表现出来。但也不能够过于长,即使可获得很长时间的历史数据,还需要在完整性和数据质量之间保持平衡。
  4. 表现点
    截止到此时间点账户被分类成好账户和坏账户。
    阶段总结,表现期和表现点是定义y变量的时期。

e.g.

弄清了这么几个概念,我们就可以进行目标定义的环节了。风控模型定义y变量的时候,要保证表现期足够,业务不同表现期定义也不同。以信用卡业务为例,一般表现期为一年或一年半。风险表现一般都是滞后的,不经过足够的时间是看不出来的。
其次,坏客户的逾期程度也需要有定义。目的就是让坏人彻底坏,好人真的好。如果坏人不够坏,比如定义逾期1天以上就算坏人的话,是跟好人区分不开的。因为很多人可能是忘记还款了,提醒一下就会还款。
我们设置的好坏客户定义可以这样,如下例:
坏:表现期内发生逾期60天及以上的逾期客户
好:表现期内未发生逾期的客户

三、信用风险
信用风险是银行贷款或投资债券中发生的一种风险,也即为借款者违约的风险。 在过去的数年中,利用新的金融工具管理信用风险的信用衍生工具(Credit Derivatives)发展迅速。 适当利用信用衍生工具可以减少投资者的信用风险。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/138708.html原文链接:https://javaforall.net

(0)
上一篇 2022年5月30日 下午11:16
下一篇 2022年5月30日 下午11:16


相关推荐

  • 如何让PPT转成PDF后占满整个页面

    如何让PPT转成PDF后占满整个页面将 PPT 转成 PDF 格式是我们日常经常会使用的 但有时候转换后的 PDF 文件总觉得尺寸不对 是怎么回事呢 要怎么转换才能让保存的 PDF 图片可铺满整个页面呢 首先我们要进行分辨确实是 PDF 文档页面尺寸不对 两侧或上下有空白 还是我们打开 PDF 的页面比例不对呢 可以将 PDF 的页面比例调整到 100 也就是实际大小再查看 如果仍不是我们想要的效果如下图中的图 1 则可进行下一步设置 其中最简单的方法则是利用 PPT 转 PDF 的其中一种方式虚拟打印 我们在打印时 在打印设置中将 布局 中的打印方向调整为横向 并将页面尺寸

    2025年9月14日
    6
  • Python 字母大小写的转换

    Python 字母大小写的转换1name="AdaLovelace"2print(name.upper())3print(name.lower())

    2022年7月6日
    24
  • 数据库选型之内存数据库eXtremeDB

    数据库选型之内存数据库eXtremeDB鉴于内存数据库访问速率快的特点,本文分别从单线程、多线程(并发访问)和多线程读/写混合访问角度对eXtremeDB数据库读写速率展开测试。需要指出的是,本文读取操作包含将数据读取后,并在控制台显示出来

    2022年7月2日
    46
  • acwing1106. 山峰和山谷(宽搜bfs)「建议收藏」

    acwing1106. 山峰和山谷(宽搜bfs)「建议收藏」FGD小朋友特别喜欢爬山,在爬山的时候他就在研究山峰和山谷。为了能够对旅程有一个安排,他想知道山峰和山谷的数量。给定一个地图,为FGD想要旅行的区域,地图被分为 n×n 的网格,每个格子 (i,j) 的高度 w(i,j) 是给定的。若两个格子有公共顶点,那么它们就是相邻的格子,如与 (i,j) 相邻的格子有(i−1,j−1),(i−1,j),(i−1,j+1),(i,j−1),(i,j+1),(i+1,j−1),(i+1,j),(i+1,j+1)。我们定义一个格子的集合 S 为山峰(山谷)当且仅当:

    2022年8月9日
    9
  • mysql数据库存储过程讲解与实例分析_数据库存储过程的优点

    mysql数据库存储过程讲解与实例分析_数据库存储过程的优点存储过程简介SQL语句需要先编译然后执行,而存储过程(StoredProcedure)是一组为了完成特定功能的SQL语句集,经编译后存储在数据库中,用户通过指定存储过程的名字并给定参数(如果该存储过程带有参数)来调用执行它。存储过程是可编程的函数,在数据库中创建并保存,可以由SQL语句和控制结构组成。当想要在不同的应用程序或平台上执行相同的函数,或者封装特定功能时,存储过…

    2025年7月31日
    4
  • EFK(Elasticsearch+Filebeat+Kibana)日志收集系统

    EFK(Elasticsearch+Filebeat+Kibana)日志收集系统

    2021年6月2日
    105

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号