风控模型开发全流程

风控模型开发全流程本篇我们对开发金融风控模型做一个总结,先给出流程图:建立模型,当然需要数据,金融风控的数据一般来源于内部与外部,内部是在公司业务系统内已有的,外部主要靠采购三方数据扩展。三方数据的采集标…

大家好,又见面了,我是你们的朋友全栈君。

本篇我们对开发金融风控模型做一个总结,先给出流程图:

风控模型开发全流程

建立模型,当然需要数据,金融风控的数据一般来源于内部与外部,内部是在公司业务系统内已有的,外部主要靠采购三方数据扩展。三方数据的采集标准可参考文章:

金融风控之三方数据评测

风控模型的目标是对客户的好坏程度进行概率预测,转化为模型术语,就是分类问题。首先需要确认好坏客户的标准,通过滚动率分析可以给出量化标准。通过逻辑回归对该分类问题进行建模。

从【为什么要用sigmoid函数】到真的懂【逻辑回归】

有了样本与目标变量,我们根据证据权重(woe)修正对客户先验认知的增量,对变量进行分箱,提高模型的可解释性与鲁棒性,基于IV值筛选指标

WOE编码与IV值

进行IV值筛选后的变量,对woe转换后的数据做多因素分析,要考虑模型建立后的多重共线性问题。一般可以通过方差膨胀因子逐步回归检测

多重共线性

到了这一步,特征工程已经全部做好。下一步就是模型建立,在建立模型前需要根据数据质量与业务要求确立好模型的评价指标,调参过程用学习曲线与验证曲线去搜索最佳的超参数,防止模型过拟合。模型建立好后用测试集数据对模型进行评估测算,并且转化为标准评分

机器学习之模型评估

评分卡建模指标与评分转换

最后在模型上线后,需要紧密监控其数据表现

评分卡模型监控(前端分析)

评分卡模型监控(后端分析)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/139683.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 动态规划 4、基础背包问题总结(从01开始)「建议收藏」

    动态规划 4、基础背包问题总结(从01开始)「建议收藏」一、01背包问题简述:n种物品,每种一个,选或不选随你,背包一定有容量,求不超过容量的情况下,价值最大。递归方程:dp[i][v]=max{dp[i][v],dp[i-1][v-c[i]]+w[i]}

    2022年7月3日
    26
  • manifest文件使用(manifest文件作用)

    解决难以打开MANIFEST文件的问题打开MANIFEST文件的麻烦MicrosoftNotepad已删除你尝试加载MANIFEST文件并收到错误,例如“%%os%%无法打开MANIFEST文件扩展名”。通常情况下,这意味着MicrosoftNotepad没有安装在%%os%%上。由于您的操作系统不知道如何处理此文件,因此无法通过双击将其打开。提示:如果你…

    2022年4月11日
    182
  • WBEM简介_叶文玲的简介

    WBEM简介_叶文玲的简介from:http://blog.csdn.net/hkbyest/archive/2007/07/16/1693649.aspx%windir%\system32\wbem文件夹是什么wbem文

    2022年8月1日
    5
  • 基于Linux安装redis

    基于Linux安装redis一、下载redis压缩包进入redis官网https://download.redis.io/releases/选择要下载的版本将下载好的压缩包使用Xftp上传至Linux系统中或者直接在Linux中使用命令直接下载wgethttps://download.redis.io/releases/redis-4.0.0.tar.gz使用tar命令解压tarxzfredis-4.0.0.tar.gz二、安装redis进入redis文件夹中,使…

    2022年6月16日
    20
  • Oracle-帝国的崛起![通俗易懂]

    Oracle-帝国的崛起![通俗易懂][编者本段]Oracle的起源  oracle是瓦砾(YinXu)出土的甲骨文(oracleboneinscriptions)的英文通译的第一个单纯词,在英语里是“神谕”的意义。  [编者本段]Oracle市场份额  在二零零七年Oracle在数据库市场仍然保持着强劲的大势,盘踞了数据库领域48.6%的市场份额。作为数据库软件市场的领跑者,Oracle数据库从上年推出了11g版本以来,在整个

    2022年9月23日
    3
  • ip地址分类和子网掩码「建议收藏」

    ip地址分类和子网掩码「建议收藏」ip地址分类和子网掩码1.ip地址分类A类网络的IP地址范围为1.0.0.1-127.255.255.254;第一个八位是网络地址后三个八位是主机地址。B类网络的IP地址范围为:128.1.0.1-191.255.255.254;第二个八位是网络地址,剩下的三个是主机地址。C类网络的IP地址范围为:192.0.1.1-223.255.255.254;第三个八位是网络地址,剩下的三个是…

    2022年6月7日
    43

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号