浅谈大数据风控平台的功能需求

浅谈大数据风控平台的功能需求导读 大数据风控业务的开展依赖智能风控平台 智能风控平台的技术基础是大数据技术 智能风控系统技术架构也是以大数据系统技术架构为基础演进而来的 智能风控系统技术架构主要分为访问层 展现层 系

浅谈大数据风控平台的功能需求

浅谈大数据风控平台的功能需求

导读:大数据风控业务的开展依赖智能风控平台,智能风控平台的技术基础是大数据技术,智能风控系统技术架构也是以大数据系统技术架构为基础演进而来的。

智能风控系统技术架构主要分为访问层、展现层、系统层、大数据平台四部分,其中大数据平台又分为接入层、清洗层、计算层、数据层四部分。本文主要介绍大数据风控平台。

浅谈大数据风控平台的功能需求

浅谈大数据风控平台的功能需求

大数据平台是智能风控系统技术架构的持久层,但又超越了传统的持久层功能,是以持久层为基础进行了技术应用的丰富。持久层又叫数据访问层,是指把数据永久地保存在存储设备中,它直接与数据库交互。

大数据平台的创建不仅服务于智能风控体系,还服务于业务的其他场景,例如业务的营销场景、运营场景等。考虑到智能风控系统技术架构的数据还会服务其他业务场景,因此在初期搭建规划的时候应该考虑数据层的通用性、易用性、非耦合性等;并且伴随互联网业务的快速增长以及大数据技术的广泛运用,传统持久层的设计也不再局限于数据库以及数据的交互,而是以持久层为基础升级革新为大数据平台,统筹管理、规划数据的应用。

智能风控系统技术架构的大数据平台划分为接入层清洗层计算层数据层四部分,这里只着重介绍接入层、清洗层、数据层的技术应用。

01

接入层

接入层负责智能风控平台的内部接入,包括大数据平台以及系统层的系统产品的数据接入,通常接入的数据有结构化数据和非结构化数据两类,常用的技术应用有MQ、HTTP、HTTPS、FTP等,具体的技术介绍如下。

  • MQ(Message Queue,消息队列)是基础数据结构中“先进先出”的数据结构,一般用来解决应用解耦、异步消息、流量削峰等问题,是一种能够实现高性能、高可用、可伸缩和最终一致性的架构。
  • HTTP(Hyper Text Marked Language,超文本标记语言)是一种标识性语言,包括一系列标签,通过这些标签可以将网络上的文档格式统一,使分散的网络资源连接为一个逻辑整体。
  • HTTPS(Hyper Text Transfer Protocol over Secure Socket Layer)是以安全为目标的HTTP通道,在HTTP的基础上加入SSL层通过传输加密和身份认证保证了传输过程的安全性,被广泛用于万维网上安全敏感的通信,例如交易支付等方面。
  • FTP(File Transfer Protocol,文件传输协议)是在网络上进行文件传输的一套标准协议,用于将文件传输到主机或与主机交换文件。FTP可以使用用户名和密码进行身份验证,匿名FTP允许用户从互联网访问文件、程序和其他数据,而无须用户ID或密码。


02

清洗层

清洗层是数据清洗处理层,负责智能风控平台接入数据的清洗处理。清洗处理后的数据再被推送到计算层、系统层和数据层。通常大数据平台清洗层使用的技术应用有Kafka、ETL,具体的技术介绍如下。

  • Kafka是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写。Kafka是一种高吞吐量的分布式发布订阅消息系统,可以处理消费者在网站中的所有动作流数据。但大部分研发人员都会把kafka当作一个分布式消息队列,利用它的高性能、持久化、多副本备份、横向扩展等能力。生产者向队列里写消息,消费者从队列里取消息进行业务逻辑运算。
  • ETL(Extract-Transform-Load)是用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据模型,将数据加载到数据仓库中。虽然ETL一词常用在数据仓库,但其对象并不限于数据仓库。


03

数据层

数据层是数据的载体层,大数据技术的基础是数据,因此大数据平台的基础是数据层。大数据平台的数据层为智能风控平台提供系统产品使用的数据,而智能风控平台系统产品产生的数据会回传到大数据平台的数据层,两个平台的数据相互循环迭代,数据量不断增加。数据层实际就是数据库,数据库根据数据存储方式分为关系型数据库、非关系型数据库,同时随着知识图谱技术的发展和应用,图数据库也被用到智能风控平台中。

大数据平台常用的数据库有MySQL、MongoDB、HBase、Giraph、SSD等,具体的技术介绍如下。

  • MySQL是一个关系型数据库管理系统,由瑞典MySQL AB公司开发,属于Oracle旗下产品。MySQL是最流行的关系型数据库管理系统之一,在Web应用方面,MySQL是最好的关系数据库管理系统应用软件之一。
  • MongoDB是一个基于分布式文件存储的数据库,由C++语言编写,旨在为Web应用提供可扩展的高性能数据存储解决方案。
  • HBase(Hadoop Database)是一个分布式的、面向列的开源数据库,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC设备上搭建起大规模结构化存储集群。
  • Giraph是一个迭代的图计算系统,是基于Hadoop建立的上层应用。
  • SSD(Solid State Disk或Solid State Drive,固态驱动器),俗称固态硬盘,用于数据库等文件的存储。


智能风控的核心技术是大数据风控技术,智能风控系统技术架构的设计应该以大数据平台为基础,充分融入大数据系统技术架构。

本书摘编自《智能风控平台:架构、设计与实现》,经出版方授权发布。

浅谈大数据风控平台的功能需求

关于作者:郑江,资深的互联网金融风控从业人员,现就职于融360。资深产品经理,尤其擅长风控平台的产品设计和研发,曾参与和主导了AI风控平台、SaaS风控云平台、大数据风控平台等各种类型的风控平台的建设,积累了丰富的经验。

推荐语:本书从智能风控平台的业务架构、功能架构、技术架构以及产品的设计与实现角度详细讲解了如何构建一个完整的、通用的智能风控平台,从而让风控变得更容易、更高效、更精准和更智能。

浅谈大数据风控平台的功能需求

浅谈大数据风控平台的功能需求

扫码关注【华章计算机】视频号

每天来听华章哥讲书

浅谈大数据风控平台的功能需求

更多精彩回顾

书讯 | 9月书讯 | 秋天的第一本书,来了

资讯 | 什么是Serverless?有哪些应用?终于有人讲明白了

书单 | 10本书,帮你看清未来的科技趋势

干货 | Linux30岁生日:Linux 成功的真正原因

收藏 | 终于有人把Scrapy爬虫框架讲明白了

上新 | 【新书速递】“帆船书”——数据库领域殿堂级作品,全新升级第7版!

赠书 | 【第71期】破案了!库里为何会花18万美元买一个猴子头像?

浅谈大数据风控平台的功能需求

浅谈大数据风控平台的功能需求

点击阅读全文优惠购买

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/201366.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月20日 上午9:32
下一篇 2026年3月20日 上午9:33


相关推荐

  • 模型微调:让通用AI成为你的专属专家

    模型微调:让通用AI成为你的专属专家

    2026年3月14日
    2
  • SQL语句增加字段、修改字段、修改类型、修改默认值[通俗易懂]

    SQL语句增加字段、修改字段、修改类型、修改默认值[通俗易懂]–一、修改字段默认值altertable表名dropconstraint约束名字——说明:删除表的字段的原有约束altertable表名addconstraint约束名字DEFAULT默认值for字段名称——-说明:添加一个表的字段的约束并指定默认值–二、修改字段名:altertable表名renamecolumn…

    2022年5月21日
    56
  • 二阶常系数齐次线性微分方程的通解

    二阶常系数齐次线性微分方程的通解本文略去了很多证明 只记录结论 文中的微分方程均指代二阶常系数线性微分方程二阶常系数齐次线性微分方程的形式为 ay by cy 0ay by cy 0ay by cy 0 由于是二阶线性微分方程 所以它有两个解 记为 y1 y2y1 y2y 1 y 2 若 y1y2 Cy1y2 C frac y 1 y 2 neqC 即两个解之比不为常数 则 y1

    2026年3月20日
    3
  • OpenClaw 为啥叫 “小龙虾”?名字里藏着大秘密

    OpenClaw 为啥叫 “小龙虾”?名字里藏着大秘密

    2026年3月13日
    2
  • VSCode自动保存文件设置

    VSCode自动保存文件设置很多时候敲了一大堆代码 结果手贱或者电脑没电或者电脑突然崩溃 如果没有保存 只能说 GG 好在 VSCode 有自动保存代码的功能 而且有好几种自动保存的模式选择 设置方法如下 进入 gt 文件 gt 首选项 gt 设置 之后你可以搜索关键字 save 找到如下可以看到一共有 4 种选择 off 关闭自动保存 这是默认选项 afterDelay 会每隔若干秒保存一次 OnFocusChang 编辑器是去焦点时自动保存文件 比如说你打开了多个文件 你编辑好了 A 然后切换到 B 文件 那么此时 A 文

    2026年3月18日
    2
  • 列举6个常见且实用的Web前端性能优化方法[通俗易懂]

    列举6个常见且实用的Web前端性能优化方法[通俗易懂]在如今这个信息爆炸的时代,人们的节奏总是快速的,对于一个网站的耐心毕竟是有限的可怜的,如果网站不进行优化必定会流失相当一部分的客户,带来不必要的损失。那么从Web前端的性能优化上来说有哪些常见、实用的方法呢?下面小千就列举6个常见且实用的Web前端性能优化方法。1、使用CDNCDN(内容分发网络)部署在各大运营商机房,当用户通过浏览器请求资源时可以直接反馈给用户,极大的减轻了服务器数据中心的压力。本质上CDN也是一种缓存,如果你的所在地距离某个CDN节点很近,那么网站响应的速度提升也是非常明显的。另外

    2022年6月23日
    25

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号