《数据分析实战:基于EXCEL和SPSS系列工具的实践》——1.5 如何成为数据分析高手…

《数据分析实战:基于EXCEL和SPSS系列工具的实践》——1.5 如何成为数据分析高手…

大家好,又见面了,我是全栈君。

本节书摘来自华章计算机《数据分析实战:基于EXCEL和SPSS系列工具的实践》一书中的第1章,第1.5节,作者 纪贺元,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.5 如何成为数据分析高手

在工作中接触数据比较多的朋友,由于提高工作效率的需要,或者考虑到职业发展前途,经常会关心一个问题:我怎么样成为一个数据分析高手?这种想法非常自然,如同一个下围棋的人经常会想“我怎么样成为围棋高手”一样。

根据我个人的理解,要想成为数据分析高手,要做到如下几个方面。

1.5.1 “拳不离手,曲不离口”

我培训的课程大概有10多门,不过课程的频度不同,有的课程一年要上好多遍,而有的课程相对比较冷门,一年也上不了几次。然后我就发现,那几个冷门课程,我每次上课之前都要备课,因为有些细节我忘记了。

项目中也是如此,自己写的系统代码,隔段时间不看了,就会有点看不懂了,需要静下心来仔细看一看。

所以,要成为数据分析的高手,第一要旨就是你工作中的数据很多,而且天天要做表、做分析,做得多了,自然熟练了,感觉也有了。

记得卖油翁的那句话吧:无他,唯手熟尔。

1.5.2 熟练掌握常用工具

“工欲善其事,必先利其器”,这话一点不假,身处信息时代的我们,掌握(尤其是熟练掌握)一些工具是非常有必要的。

第2章会比较详细地介绍统计分析工具,以下只是谈谈我自己的一些体会。

1.贵精不贵多

我曾经碰到过这样的人,他平时工作用EXCEL,也用VBA,根据我对他的了解,他的VBA用得一般,基本就是入门的级别吧。他报名去学习Matlab,也自学过R,2015年碰到他的时候,他说现在要考虑学Tableau。首先,我很赞赏和佩服他的学习精神,毕竟要学这么多东西,是要耗费很多时间和精力的(包括要花不少钱),但是,我绝对不赞成他的这种风格。要知道,对于一个分析工具的掌握需要长时间的学习和实践,有人说大部分人只掌握了EXCEL中5%的功能,我个人基本表示赞同。我使用VBA近20年,仍然觉得对VBA的很多功能还是知之甚少。再说,如果你熟练地掌握了一种工具,再学其他的也比较容易。

2.工具之间往往是互补的

我们需要掌握一个工具组合,一个有效的工具组合可以基本解决你的大部分问题。实际上,我在分析数据时,经常是多种工具一起使用。我会用EXCEL VBA表来收集数据,用EXCEL来预处理数据,用EXCEL数据透视表和SPSS来分析数据,用XLSTAT来做对应分析和决策树(因为我觉得XLSTAT虽然是个小工具,但是它在多重对应分析和决策树这两个模块上做得特别好),然后我会用clementine来处理关联分析。因此,“组合拳”还是很有必要的。

1.5.3 最好能编点程序

记得曾经看过一篇文章,写的是在美国,很多小孩都能编点简单的程序,有的小学生甚至能够熟练地掌握双重循环,也就是说,编程这个技巧,起码在美国,大家没认为它是一个很高端的技能。

国内的情况则大大不同,个人的感觉是很多企业人员对编程都比较害怕,甚至到了恐惧的程度。我曾经在班上问过一些学员,在大学的时候有没有学过编程,有1/3的学员举手。实际上,现在的大学在大一的基础课中是有VB和C语言的。不过即使这样,我仍然觉得很多学员包括学过VB或C语言的学员都不大喜欢或者不大愿意去接触编程。

我们的很多学员,还没有开始编程,就已经掉头撤退了,他们已经把自己归类到不可能学会编程的那个行列中去了!

本书的主旨不是探讨为什么很多有点编程基础的人不愿意编程,这里想说的是,编程技能几乎是数据分析高手的必备技能。如果学会一种编程语言将极大地提高数据分析的能力,如果精通的话那实在是太棒了。

试想,人家在跑代码,而你是手工做数据,这可是天壤之别!数据量大到一定程度,步骤多到一定程度,手工就没法做了。

1.5.4 一定要通晓业务

做数据分析,不能为了做分析而分析,做数据分析的出发点是业务需求,例如,我们要做商务预测,或者我们要找到有兴趣购买我们产品的客户,因此但凡是数据分析高手,基本上都有两个特征:一是懂业务,二是会做数据。

曾经有企业领导问我,他们要建一个数据团队,如何组建?我跟他说,不管你是内部选拔还是外部招聘,建议你团队里面一定要有几个从业务口出来的人,这几个人懂业务,跟企业其他人员也熟,沟通、交流都方便。后来,我得知,他们的数据团队有两个副经理,一个是偏业务的内部人员出身,一个是外部招聘的统计学硕士,我觉得这个设置比较合理。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/108357.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • pycharm2020 激活码【中文破解版】

    (pycharm2020 激活码)JetBrains旗下有多款编译器工具(如:IntelliJ、WebStorm、PyCharm等)在各编程领域几乎都占据了垄断地位。建立在开源IntelliJ平台之上,过去15年以来,JetBrains一直在不断发展和完善这个平台。这个平台可以针对您的开发工作流进行微调并且能够提供…

    2022年3月28日
    62
  • Attributable_文件属性里没有自定义

    Attributable_文件属性里没有自定义在做项目的时候,用没人写的代码和看Android源码时,经常看attr.xml的使用,每次都不知道是什么意思,今天网上查了些资料,终于明白了,这里做一个笔记,方便以后使用这里与一个关于AttributeSet的应用场景:一个自定义控件的有些属性内容是随着外部条件而动态改变的,forexample:一个自定义的ListView控件,需要在底部添加一个View,而这个View在不同的模块使用

    2025年7月17日
    7
  • MonoDroid学习笔记(三)—— 浅析Hello World程序及增添一些新的代码

    MonoDroid学习笔记(三)—— 浅析Hello World程序及增添一些新的代码

    2021年8月15日
    80
  • 局域网内不同网段的设备互相连接设置

    局域网内不同网段的设备互相连接设置这个问题是我在实际中遇到的,如下图所示,我的主机有一个公司内网的IP,可以自动获取,也可以设置固定IP,不管怎么样,网段是172.16.0.xxx,不同的部分只是这里的xxx,我的主机IP是172.16.0.83。但是有时候,我们会从别的地方拿过来一块开发板,而开发板内部的IP基本是写死的,假如这个IP是192.168.253.10,我们会使用一个交换机,然后把外网引进来,而我…

    2025年10月26日
    3
  • mybatis的两种分页方式:RowBounds和PageHelper「建议收藏」

    mybatis的两种分页方式:RowBounds和PageHelper「建议收藏」原理:拦截器。使用方法:RowBounds:在mapper.java中的方法中传入RowBounds对象。RowBoundsrowBounds=newRowBounds(10,100);//offset起始行//limit是当前页显示多少条数据publicList<ReportDatainfo>findRecords(ReportDatainforeportD…

    2025年12月5日
    5
  • VMware 虚拟机的三种网络连接方式「建议收藏」

    VMware 虚拟机的三种网络连接方式「建议收藏」VMware的虚拟机有三种网络连接方式,分别是桥接(Bridged)模式、NAT模式和仅主机(Host-only)模式。在安装VMware之后,宿主机上会出现几个相关的虚拟设备,每个设备的功能如下:VMnet0:桥接(Bridge)模式下的虚拟交换机。VMnet1:仅主机(Host-only)模式下的虚拟交换机。VMnet8:NAT模式下的虚拟交换机。VMwareNetworkAdapterVMnet1:宿主机与Host-only虚拟网络进行通信的虚拟网卡。VMwareN

    2022年6月20日
    44

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号