平均数、中位数和众数及它们之间的关系

平均数、中位数和众数及它们之间的关系迁移到:http://www.bdata-cap.com/newsinfo/1741421.html本文内容平均数中位数众数参考资料演示最近大BOSS“迷上”了一个网络游戏(什么游戏就

大家好,又见面了,我是你们的朋友全栈君。

迁移到:http://www.bdata-cap.com/newsinfo/1741421.html

本文内容

  • 平均数
  • 中位数
  • 众数
  • 参考资料
  • 演示

最近大 BOSS“迷上”了一个网络游戏(什么游戏就不多说啦~),让我写个程序帮他算一下(现在他让另一个同事写了,我要改 bug 没时间,所以,我主要是没事时“凑热闹”提点想法)。期间,发现这个游戏一定是基于某个数学模型,于是在网上找了一个 VaR 模型,虽然现在觉得正态分布更合适。 VaR 模型最初是 J.P Morgan 用来预测金融风险的数学模型,现在有很多改进型。我对里边使用的一些统计名词有些模糊,就找资料回忆了一下,毕竟我不是学统计学的,虽然知道点,但认识得不深、不系统。

本文主要说明平均数、中位数和众数,以及它们之间的关系,这三种的目的类似,都是为了反应一组数据的一般情况(代表性),只是适用的场景不同。我们对平均数很熟悉,但它并不是“万能的”,若数据中出现极大或极小值,则平均数受到的影响很大,而中位数则不会。这也就是为什么,早先一些娱乐节目,台下的评委评分后,主持人会去掉一个最小分数和一个最大分数,再取平均数的原因。或是,上学时,老师对成绩差的学生会特别“愤怒”,常说“你拉下了全班的成绩”、“拖了大家的后退~”。

平均数


平均数(Mean),或均值是统计中的一个重要概念。是集中趋势的最常用测度值,目的是确定一组数据的均衡点。这里的平均数是指算术平均数,即一组数据的和除以这组数据的个数所得的平均值,也叫算术平均值。

计算

平均数的计算公式为:

clip_image002

在统计中,算术平均数常用于表示统计对象的一般水平,描述数据集中程度的一个量。我们既可以用它来反映一组数据的一般情况,也可以用它进行不同组数据的比较,以便看出组与组之间的差别。用平均数可以直观、简明地表示一组数据的情况,所以日常生活中经常用到,如中小学学生的平均身高,由于生活条件的改善,现在孩子的身高肯定比80年代要高;平均成绩,这个一定不陌生,上学时,老师对成绩差的学生会特别“愤怒”,常说“你拉下了全班的成绩”、“拖了大家的后退~”。

统计学上,算术平均数较中位数、众数更少地受到随机因素影响,但缺点是它更容易受到极端值影响。

除了算术平均数,还有几何平均数、调和平均数、平方平均数、移动平均数等。

算术平均数用于数值型数据,不能用于分类数据和顺序数据。

示例

若有包含 7 个数值的数组 clip_image002[4],则算术平均数为 24.7。

若有包含 8 个数值的数组 clip_image002[6],则算术平均数为 25.7。

平均数很简单,但引出它主要是为了跟后面的中位数和众数进行比较。

中位数


中位数(Medians)是一个统计学的专有名词,代表一个样本、种群或概率分布中的一个数值,可以将数值集合划分为相等的两部分,即,若设连续随机变量 X 的分布函数为 F(X),那么满足条件 F(X)=1/2 ,称为 X 或分布 F 的中位数。中位数是用来衡量集中趋势的方法。对于一个有限的、有序的数集,位于中间位置的那个数值就是中位数,用 Me 表示。

“中位数”中的“位”,即“位置”,看后“意义”小节,你会理解这段话的意思。

计算

若集合的项数为奇数,则处于中间位置的数据为中位数;若项数为偶数,则中位数为处于中间位置的两个数值的算术平均数。

实数 clip_image002[8],按大小顺序(降序、升序都可)排列为 clip_image002[10] 。则实数数列 的中位数为 :

clip_image002[12]

示例

若有包含7个数值的数组 clip_image002[14],按升序为 clip_image002[16],则中位数为 23。

若有包含8个数值的数组 clip_image002[18],按升序为 clip_image002[20],则中位数为 (23+25)/2=24。

意义——算术平均数与中位数

中位数趋于数据集合的中间,是所有数据的代表值,它不受分布数列的极大或极小值影响,对极大极小值不敏感,一定程度上提高了中位数对分布数列的代表性。有些离散型变量的单项式数列,当次数分布偏态时,中位数的代表性会受到影响。

中位数的作用与算术平均数相近,也是作为数据的代表值。在一个等差数列或一个正态分布数列中,中位数就等于算术平均数。

在数列中出现了极端值的情况下,用中位数作为代表值比算术平均数更好。如果研究的目的是为了反映中间水平,应该用中位数。在统计数据的处理和分析时,可结合使用中位数。

例如,有序组数 x=(200, 250, 300, 1000,2000),其平均数为 750,中位数为 300,因为一半比 300 多,另一个半比 300 少;若有序数组为 x=(200,250,300,500,1000),其平均数变为 450,但中位数还是 300。

因此,平均数的变化较大。而中位数相对于平均数不太受极大极小值的影响。

众数


众数(Statistical Mode)是数据中出现频率最多的数。用众数代表一组数据,适合于数据量较多时使用,且众数不受极端数据的影响,并且求法简便。在一组数据中,如果个别数据有很大的变动,选择中位数表示这组数据的“集中趋势”就比较适合。

当数值或被观察者没有明显次序(常发生于非数值性资料)时特别有用,由于可能无法良好定义算术平均数和中位数。例子:(苹果, 苹果, 香蕉, 橙, 橙, 橙, 桃) 的众数是“橙”。

一组数据可能没有众数或有多个众数。在高斯分布(正态分布)中,众数位于峰值。

众数主要用于分类数据,也可用于顺序数据和数值型数据。

示例

若有数组  (2, 2, 3, 3, 4),则其众数为 (2, 3);若数组为 (1, 2, 3, 4) ,则其没有众数。

算术平均数、中位数和众数之间的关系


平均数、中位数和众数三者之间,一个有趣的经验关系是:

clip_image002[22]

参考资料


 

演示


下载 Demo

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/155588.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Python关键字查询

    Python关键字查询Python 中的关键字 及其长度

    2025年7月27日
    4
  • 微信小程序开发环境(阿里云服务搭建+可运行的demo)「建议收藏」

    最近微信小程序异常火爆,很多人在学习,下面带着大家搭建下微信小程序的调试环境(client+server),并调试一套demo源码(JavaScript和node.js基础即可,微信推荐使用的语言,无前端编程基础,去菜鸟教程简单学习下JavaScript,node.js,mysql即可),方便大家学习。微信小程序搭建环境必需的两点:云服务器,域名,下面一步步给搭建演示如果在一台阿里云服…

    2022年4月16日
    118
  • PyCharm配置_pycharm安装配置

    PyCharm配置_pycharm安装配置pycharmpycharm是一个比较好的pythonIDE,可以在MACOS和windows上使用,补全功能强大,而且界面十分友好,特别适合python编程人员使用。pycharmPycharm安装Pycharm配置修改成灰底主题显示行号修改字体大小编程字体我推荐运行调试Pycharm安装pycharm的安装地址:http://www.jetbrains.com/

    2022年8月26日
    5
  • ID卡(工卡)复制到手机NFC「建议收藏」

    ID卡(工卡)复制到手机NFC「建议收藏」1.很多单位的工卡都是ID卡,而读卡机,一般是多频的,支持多种卡,那么如何把ID卡写到手机NFC中,实现“忘带卡自由”呢?2.前提条件:用手机NFC,在单位的刷卡机上刷卡,提示“非法卡”。说明打卡机支持NFC,如果不支持,请略过本文3.在单位的打卡机上正常刷卡,屏幕上会提示卡号。或者有的工卡上带卡号,一般ID卡号是00开头或000开头的10位卡号。如果不是,说明不是ID卡,请略过本文。有的单位的人事系统里也会记录员工的物理ID卡号。或者用其他读卡器读ID卡,也能读到卡号。4.获取到ID物理卡号后

    2022年5月1日
    1.6K
  • 【最全】软件测试基础理论选择题(含答案)[通俗易懂]

    【最全】软件测试基础理论选择题(含答案)[通俗易懂]一、选择题(每题1分,共90分)1、软件测试的目的是()A、试验性运行软件B、发现软件错误C、证明软件正确D、找出软件中全部错误【答案】B2、下面说法正确的是()A、经过测试没有发现错误说明程序正确B、测试的目标是为了证明程序没有错误C、成功的测试是发现了迄今尚未发现的错误的测试D、成功的测试是没有发现错误的测试【答案】C3、软件测试中白盒法是通过分析程序的…

    2022年6月12日
    44
  • 数学开区间和闭区间的区别_数学封闭区间什么意思

    数学开区间和闭区间的区别_数学封闭区间什么意思       开区间用(a,b)来表示,闭区间用[a,b]来表示。闭区间包括了两个端点a和b,而开区间不包含两个端点a和b。      下面这个游戏是我以前的老师告诉我的。游戏的规则是:两个人分别在开区间(a,b)内取一个数,两个人取的数不许相同,谁取的数大,那么谁赢。这个游戏显然是谁先取谁输!具体一点,假设是在(0,1)这个区间来玩这个游戏。第一个人取的是0.9另一个只要取0.91就可以

    2025年6月8日
    4

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号