大数据风控模型是什么?有哪些?

大数据风控模型是什么?有哪些?摘要:在互联网金融行业,不少人可能这样觉得:认为只要数据够“大”,就能有最牛逼的风控体系和行业最低的坏账率。在互联网金融行业,不少人可能这样觉得:认为只要数据够“大”,就能有最牛逼的风控体系和行业最低的坏账率。这种理解有些过于简单了。其实,做大数据风控是一个挺细致的事儿,大数据风控,重要的不是数据本身,而是对数据的理解。类似的话,哈佛大学的GaryKing教授也说过,…

大家好,又见面了,我是你们的朋友全栈君。

摘要:在互联网金融行业,不少人可能这样觉得:认为只要数据够“大”,就能有最牛逼的风控体系和行业最低的坏账率。

在互联网金融行业,不少人可能这样觉得:认为只要数据够“大”,就能有最牛逼的风控体系和行业最低的坏账率。这种理解有些过于简单了。

 

其实,做大数据风控是一个挺细致的事儿,大数据风控,重要的不是数据本身,而是对数据的理解。

大数据风控模型是什么?有哪些?

 

类似的话,哈佛大学的Gary King教授也说过,Big data is not about the data——大数据的价值不在于数据本身,而在于它背后的数据分析。

 

 

相比传统风控,大数据技术对零散的碎片数据具有很好的整合能力,这一点特别适用于证信业,它可以搜集更多的数据维度,实现征信信息的有效补充。

 

大数据风控模型是什么

 

指标体系

 

大数据圈流行一句话:数据决定了数据分析的上限,而模型做的是逼近这个上限。因此,构建一个完善的指标体系是非常重要的,大数据风控模型则主要涵盖下面几类指标:

 

申请信息:年龄、性别、籍贯、常驻地、工作、联系人;

 

用户使用过程信息:资料修改频率、IP定位、设备重复、填写顺序、其它行为记录;

 

交易数据:借款相关交易频次、金额,还款等;

 

第三方数据:一类是电商、社交、搜索、新闻、物流等信息的爬虫或接口导入;一类是设备信息的读取,还有一类是向第三方征信和风控公司进行购买。

大数据风控模型是什么?有哪些?

 

风控模型

大数据风控更多应用与小微互金贷款,因此更多是还款意愿的控制,欺诈风险会比较高,因此构建好的反欺诈模型就非常重要,目前一般分三种:

 

1. 规则:根据经验总结规则,形成规则库;而基于规则的主要手段是交叉验证,对规则库,证件、通信、定位、指纹,面部识别进行交叉验证,保证客户真实性。

 

2. 黑名单和灰名单:基于以往发生的行为,进行名单匹配,对黑名单客户一刀切,对灰名单客户深入关注。

 

3. 机器学习模型:利用聚类等模型发现一些违反常识的规则,反推,在应用于后续的客户验证。

 

另外,传统信贷中非常关注的信用风险,大数据风控同样非常重视。信用风险对模型的应用应该说很成熟了,包括ABC评分卡在信用卡领域的使用,芝麻信用在支付领域的使用等。评分模型最常使用的就是LR模型,现在大数据风控在此基础上补充了XGboost,FFM等模型来尝试新的方向,不过据了解,目前还是LR模型最稳定常用,新的机器学习模型或许还需要一段时间的实践和迭代。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/137697.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 浅谈 MVC与三层架构

    浅谈 MVC与三层架构引言:使用Eclipse开发工具写JavaWeb项目时会发现,一个中型或者大型项目随着代码的增多,会发现:代码既可以写在src目录下,也可以写在WebContent目录下。src下可以建很多包,WebContent下可以建很多文件夹。所以问题就来了:一个新的类到底往哪个目录下的哪个文件夹里写?此时解决办法就是:需要一个模式去规范,到底哪个类该往哪里写。…

    2022年6月25日
    25
  • git常用命令汇总

    git常用命令汇总

    2021年9月18日
    30
  • 如何理解95%置信区间_95的置信区间和90的置信区间

    如何理解95%置信区间_95的置信区间和90的置信区间1.点估计与区间估计首先我们看看点估计的含义:是用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示,所以称为点估计。点估计虽然给出了未知参数的估计值,但是未给出估计值的可靠程度,即估计值偏离未知参数真实值的程度。接下来看下区间估计:给定置信水平,根据估计值确定真实值可能出现的区间范围,该区间通常以估计值为中心,该区间则为置信区间。2.中心…

    2022年9月23日
    3
  • Q学习(Q learning) 强化学习的简单例子 Matlab实现 可视化「建议收藏」

    Q学习(Q learning) 强化学习的简单例子 Matlab实现 可视化「建议收藏」参考链接:https://blog.csdn.net/Maggie_zhangxin/article/details/73481417实现的内容很简单,存为.m文件可以直接在matlab上运行,就是利用Q学习(Qlearning)完成自主路径寻优简单示例,并进行可视化,Q学习部分参考了如上链接中的内容,供大家交流学习使用,请多提宝贵意见如图为最终路径,红色方框代表机器人,绿色区域代表障碍…

    2022年10月3日
    3
  • Linux lamp_lamp搭建和配置

    Linux lamp_lamp搭建和配置LAMP架构LAMP架构是目前成熟的企业网站应用模式之一,指的是协同工作的一整套系统和相关软件,能够提供动态Web站点服务及其应用开发环境。LAMP是一个缩写词,具体包括Linux操作系统、Apache网站服务器、MySQL数据库服务器、PHP(或Perl、Python)网页编码。在构建LAMP平台时,各组件的安装顺序依次为Linux、Apache、MySQL、PHP。其中…

    2022年10月17日
    2
  • 到底什么是集群&分布式

    到底什么是集群&分布式

    2020年11月12日
    219

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号