分享一个不错的数据分析实战案例【全程附图】EXCEL

分享一个不错的数据分析实战案例【全程附图】EXCEL利用最近一次的营销活动的信息,分析什么对推销结果的影响最大,如何确定银行定期产品推销中最具价值的客户。

大家好,又见面了,我是你们的朋友全栈君。

大家早上好,本人姓吴,如果觉得文章写得还行的话也可以叫我吴老师。欢迎大家跟我一起走进数据分析的世界,一起学习!

感兴趣的朋友可以关注我或者我的数据分析专栏,里面有许多优质的文章跟大家分享哦。


项目来源

https://www.kaggle.com/janiobachmann/bank-marketing-dataset

项目简介

利用最近一次的营销活动的信息,分析什么对推销结果的影响最大,如何确定银行定期产品推销中最具价值的客户。

PS: 这是最初上传到UCI机器学习库的经典营销银行数据集,该数据集提供了有关金融机构营销活动的信息,但在本篇博客当中我们仅会用到EXCEL进行数据分析,使用机器学习进行分析我们留到之后再介绍。

1 数据理解

字段名 理解
age 年龄(数值)
job 职业(分类:admin, bluecollar, entrepreneur, housemaid, management, retired, self-employed, services,student, technician, unemployed, unknown)
marital 婚姻状况(分类:divorced, married, single, unknown)
education 学历(分类:primary, secondary, tertiary and unknown)
default 失信状况(分类:yes, no)
balance 资产余额(数值)
housing 房屋贷款(分类:yes, no, unknown)
loan 个人贷款(分类:yes, no, unknown)
contact 联系方式(分类:cellular, telephone)
day 最后一次电话营销的日期(数值:月份中的哪一天)
month 最后一次电话营销的月份(分类:jan, feb, mar, apr,…,nov, dev)
duration 通话时长(数值:以秒为单位,0的话最终输出结果必然是0)
campaign 联系次数(数值:此活动中联系该客户的次数)
pdays 距上次联系完客户后的天数(数值:999代表未联系过该客户)
previous 这次活动前与这位客户联系的次数(数值)
poutcome 上次营销的结果(分类:yes, no, unknown)
deposit 定期存款(分类:yes, no)客户是否已购买定期存款

2 数据清洗

此次数据除了部分未知数据(unknown),其它暂不需要清洗。

3 确定思路

首先这个balance,我不太确定具体指什么,目前推测应该是客户存放在银行的资金(负数应该代表欠了银行钱吧哈哈),总不可能是代表这个人的个人全部资产吧(银行得不到这方面的信息),所以暂时留着。

然后这个day和month,如果说有年份的话还能将其分为周一周二等,但是没有,数据集出处也没有明确标注是哪一年,所以如果用来分析的话可能也只能按月来分析,但按以往的经验和数据量的大小来看,应该用处不大。

至于duration的话,因为当duration为0时结果必然是失败的,说明这个数据的记录应该是银行人员在营销完记录下的,而现实中你无法在营销前就得到该数据,所以这个数据没有用。

那么接下来我们如何下手呢?
首先我们可以将数据分为两种类型:
1、客户的个人信息
2、营销人员与客户的联系信息
那么接下来我们可以按照这两种数据提出几个问题:
1、用户的个人信息是否对结果有着明显的影响(哪些属性影响大)?
2、营销人员的行为是否对结果有着明显的影响(哪些属性影响大)?

4 分析过程

4.1 年龄

此时我们探究年龄与结果是否有明显的影响。
首先我们可以查看以下数据集中的年龄统计分布情况:

在这里插入图片描述
可以发现共有11162名最小值为18,最大值为95,最小值为18。我们可以按照我们的认知,将客户分为几个不同年龄阶段。

在这里插入图片描述

分组的话主要是用到了VLOOKUP函数进行分组。
在这里插入图片描述
此时得到分组后,我们可以生成数据透视表来查看情况。

在这里插入图片描述
从图当中我们可以明显的看到在老年人群体中最终购买了定期存款的比例最大,为80.2%,而其他群体最终的结果并没有明显的差距。

4.2 失信状况default

在这里插入图片描述
有失信记录的在结果上没有什么差别,无失信记录的最终购买的比例低于没有购买的,但是数据量较小,不能作为参考。

4.3 个人资产balance

同年龄一样,balance是数值型,因而最好先将其分组。

在这里插入图片描述
这里我主要采用箱型图来查看balance数据的分布,以便后续进行分组。
可以看到的是数据主要是集中在0-2000之间,有少部分低于该区间,然后有部分大于该区间。

按下图进行分组:

在这里插入图片描述
结果如下:

在这里插入图片描述
这里主要可以发现的是负资产的客户最终购买的可能性较低,而资产较高的客户购买的可能性稍微大些。

4.4 housing&loan

接下来的房屋贷款和个人贷款,这个我打算放在一起进行分析。
具体如下:

在这里插入图片描述
可以看到无房贷和无个人贷款的客户最终购买的可能性最大,为59.65%。其余的只要有任何一个贷款购买的可能性就比较低。

4.5 上次营销结果poutcome

同理,生成透视图查看一下:

在这里插入图片描述
(包括这次在内,当生成透视图时发现有部分数据(如unknown、other)是我们不想要的,记得筛选掉)

从图中我们可以明显发现,上次营销成功的客户这次购买的可能性也极大。

5 总结

结论:从上述结果我们可以发现,老年人且上次营销成功的群体最有可能购买产品,而有贷款且低资产的用户购买的可能性会很小。

PS: 这次没有其他过多的因素考量,如产品实际的业务情况、数据具体来源等,而我主要也是利用自己以往的经验来选取数据进行分析,没有做过多的分析比较。

推荐关注的专栏

?‍?‍?‍? 机器学习:分享机器学习实战项目和常用模型讲解
?‍?‍?‍? 数据分析:分享数据分析实战项目和常用技能整理

关注我,了解更多相关知识!

CSDN@报告,今天也有好好学习

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/137747.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Maven配置环境变量后不起作用的原因「建议收藏」

    Maven配置环境变量后不起作用的原因「建议收藏」Maven配置环境变量后不起作用的原因一.首先去maven官网下载maven相关文件点击左侧download选项选择图片中的Binaryziparchive apache-maven-3.8.1-bin.zip进行下载并解压到本地这个是解压后的文件二.配置环境变量1.添加MAVEN_HOME环境变量D:\Java\maven\apache-maven-3.8.12.添加M2_HOME环境变量(后面学习Spring会用到,可以先不进行配置)D:\Java\maven\apa

    2022年7月25日
    77
  • visual studio 2015序列号_怎么激活win7旗舰版

    visual studio 2015序列号_怎么激活win7旗舰版我安装的是VisualStudioTeamSystem2008版本,适用版本90天。用了两个月后,每次打开出现提示:还有30天过期了,29天过期了,28天过期了。。。每次看到这个提示心中总有不爽。于是上网找序列号, 在网上找了好久,好像就一个序列号:PYHYP-WXB3B-B2CCM-V9DX9-VDY8T。 下面是win7的操作1,控制面板\程序\程序和

    2022年8月10日
    13
  • Cloudra公司CCP:DS——认证数据专家

    Cloudra公司CCP:DS——认证数据专家

    2022年2月1日
    72
  • pycharm英文读音_pycharm英文界面翻译

    pycharm英文读音_pycharm英文界面翻译使用的是PyCharm2018.3.4代码的自动补全在PyCharm中找到PowerSaveMode选项,将前面的对勾去掉。在左上角File的展开栏的倒数第二行在PyCharm的最右下角有个????的样子(在????旁边),单击点开就可看到PowerSaveMode选项在这个Currentinspectionprofile中可以设置HighlightingLevel即检查代码严格程度。(过多的不…

    2022年8月27日
    6
  • oracle的rac集群详解_Oracle rac

    oracle的rac集群详解_Oracle racORACLERAC数据库服务器上srvctl常用的一些操作命令,检查节点状态,检查VIP状态及配置等.作为笔记,以备不时之需.srvctl是ORACLERAC集群配置管理的工具,通过srvctl这个强大的工具来管理RAC,以下为对srvctl命令使用总结.检查节点应用程序状态[grid@db1~]$srvctlstatusnodeappsVIPdb1vipisenabl…

    2025年10月27日
    2
  • vsftp 用户_linux虚拟用户

    vsftp 用户_linux虚拟用户Vsftp与PAM虚拟用户使用yum安装vsftpyum install vsftpd pam pam-* db4 db4-* 创建一个保存用户及密码的文件cd /etc/vsftpd/ touch virtual_login 添加用户(一行用户一行是密码)vim  virtual_login dongnan nandong

    2022年9月24日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号