平均数、中位数和众数及它们之间的关系

平均数、中位数和众数及它们之间的关系迁移到:http://www.bdata-cap.com/newsinfo/1741421.html本文内容平均数中位数众数参考资料演示最近大BOSS“迷上”了一个网络游戏(什么游戏就

大家好,又见面了,我是你们的朋友全栈君。

迁移到:http://www.bdata-cap.com/newsinfo/1741421.html

本文内容

  • 平均数
  • 中位数
  • 众数
  • 参考资料
  • 演示

最近大 BOSS“迷上”了一个网络游戏(什么游戏就不多说啦~),让我写个程序帮他算一下(现在他让另一个同事写了,我要改 bug 没时间,所以,我主要是没事时“凑热闹”提点想法)。期间,发现这个游戏一定是基于某个数学模型,于是在网上找了一个 VaR 模型,虽然现在觉得正态分布更合适。 VaR 模型最初是 J.P Morgan 用来预测金融风险的数学模型,现在有很多改进型。我对里边使用的一些统计名词有些模糊,就找资料回忆了一下,毕竟我不是学统计学的,虽然知道点,但认识得不深、不系统。

本文主要说明平均数、中位数和众数,以及它们之间的关系,这三种的目的类似,都是为了反应一组数据的一般情况(代表性),只是适用的场景不同。我们对平均数很熟悉,但它并不是“万能的”,若数据中出现极大或极小值,则平均数受到的影响很大,而中位数则不会。这也就是为什么,早先一些娱乐节目,台下的评委评分后,主持人会去掉一个最小分数和一个最大分数,再取平均数的原因。或是,上学时,老师对成绩差的学生会特别“愤怒”,常说“你拉下了全班的成绩”、“拖了大家的后退~”。

平均数


平均数(Mean),或均值是统计中的一个重要概念。是集中趋势的最常用测度值,目的是确定一组数据的均衡点。这里的平均数是指算术平均数,即一组数据的和除以这组数据的个数所得的平均值,也叫算术平均值。

计算

平均数的计算公式为:

clip_image002

在统计中,算术平均数常用于表示统计对象的一般水平,描述数据集中程度的一个量。我们既可以用它来反映一组数据的一般情况,也可以用它进行不同组数据的比较,以便看出组与组之间的差别。用平均数可以直观、简明地表示一组数据的情况,所以日常生活中经常用到,如中小学学生的平均身高,由于生活条件的改善,现在孩子的身高肯定比80年代要高;平均成绩,这个一定不陌生,上学时,老师对成绩差的学生会特别“愤怒”,常说“你拉下了全班的成绩”、“拖了大家的后退~”。

统计学上,算术平均数较中位数、众数更少地受到随机因素影响,但缺点是它更容易受到极端值影响。

除了算术平均数,还有几何平均数、调和平均数、平方平均数、移动平均数等。

算术平均数用于数值型数据,不能用于分类数据和顺序数据。

示例

若有包含 7 个数值的数组 clip_image002[4],则算术平均数为 24.7。

若有包含 8 个数值的数组 clip_image002[6],则算术平均数为 25.7。

平均数很简单,但引出它主要是为了跟后面的中位数和众数进行比较。

中位数


中位数(Medians)是一个统计学的专有名词,代表一个样本、种群或概率分布中的一个数值,可以将数值集合划分为相等的两部分,即,若设连续随机变量 X 的分布函数为 F(X),那么满足条件 F(X)=1/2 ,称为 X 或分布 F 的中位数。中位数是用来衡量集中趋势的方法。对于一个有限的、有序的数集,位于中间位置的那个数值就是中位数,用 Me 表示。

“中位数”中的“位”,即“位置”,看后“意义”小节,你会理解这段话的意思。

计算

若集合的项数为奇数,则处于中间位置的数据为中位数;若项数为偶数,则中位数为处于中间位置的两个数值的算术平均数。

实数 clip_image002[8],按大小顺序(降序、升序都可)排列为 clip_image002[10] 。则实数数列 的中位数为 :

clip_image002[12]

示例

若有包含7个数值的数组 clip_image002[14],按升序为 clip_image002[16],则中位数为 23。

若有包含8个数值的数组 clip_image002[18],按升序为 clip_image002[20],则中位数为 (23+25)/2=24。

意义——算术平均数与中位数

中位数趋于数据集合的中间,是所有数据的代表值,它不受分布数列的极大或极小值影响,对极大极小值不敏感,一定程度上提高了中位数对分布数列的代表性。有些离散型变量的单项式数列,当次数分布偏态时,中位数的代表性会受到影响。

中位数的作用与算术平均数相近,也是作为数据的代表值。在一个等差数列或一个正态分布数列中,中位数就等于算术平均数。

在数列中出现了极端值的情况下,用中位数作为代表值比算术平均数更好。如果研究的目的是为了反映中间水平,应该用中位数。在统计数据的处理和分析时,可结合使用中位数。

例如,有序组数 x=(200, 250, 300, 1000,2000),其平均数为 750,中位数为 300,因为一半比 300 多,另一个半比 300 少;若有序数组为 x=(200,250,300,500,1000),其平均数变为 450,但中位数还是 300。

因此,平均数的变化较大。而中位数相对于平均数不太受极大极小值的影响。

众数


众数(Statistical Mode)是数据中出现频率最多的数。用众数代表一组数据,适合于数据量较多时使用,且众数不受极端数据的影响,并且求法简便。在一组数据中,如果个别数据有很大的变动,选择中位数表示这组数据的“集中趋势”就比较适合。

当数值或被观察者没有明显次序(常发生于非数值性资料)时特别有用,由于可能无法良好定义算术平均数和中位数。例子:(苹果, 苹果, 香蕉, 橙, 橙, 橙, 桃) 的众数是“橙”。

一组数据可能没有众数或有多个众数。在高斯分布(正态分布)中,众数位于峰值。

众数主要用于分类数据,也可用于顺序数据和数值型数据。

示例

若有数组  (2, 2, 3, 3, 4),则其众数为 (2, 3);若数组为 (1, 2, 3, 4) ,则其没有众数。

算术平均数、中位数和众数之间的关系


平均数、中位数和众数三者之间,一个有趣的经验关系是:

clip_image002[22]

参考资料


 

演示


下载 Demo

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/155588.html原文链接:https://javaforall.net

(0)
上一篇 2022年7月2日 下午11:46
下一篇 2022年7月2日 下午11:46


相关推荐

  • 深入解析LinkedHashMap

    深入解析LinkedHashMapLinkedHashMa 是 HashMap 的一个子类 保存了记录的插入顺序 在用 Iterator 遍历 LinkedHashMa 时 先得到的记录肯定是先插入的 也可以在构造时带参数 按照访问次序排序 publicvoidte Map String String map newLinkedHas lt gt map put a String String

    2026年3月17日
    2
  • USB3.0接口定义浅析

    USB3.0接口定义浅析https://www.bilibili.com/read/cv372294数码4-11357阅读14点赞3评论USB谁都见过、用过,作为世界上最常见的接口之一,USB早就走进了我们的生活。那么USB的接口定义是怎样的呢?让我来简单分析一下。因为USB3.0包括USB2.0的引脚,USB3.1和3.0引脚相同,所以本文以USB3.0(即USB3.1Gen1)为例来讲解。USB3.1一…

    2022年5月9日
    52
  • VS2015产品密钥

    VS2015产品密钥企业版 HM6NR QXX7C DFW2Y 8B82K WTYJV 一般我们都是安装的企业版 专业版 HMGNV WCYXV X7G9W YCX63 B98R2 版权声明 本文为 CSDN 博主 jigetage 的原创文章 遵循 CC4 0by sa 版权协议 转载请附上原文出处链接及本声明 原文链接 https blog csdn net jigeta

    2026年3月16日
    2
  • IDEA炫酷主题推荐!非常好看![通俗易懂]

    IDEA炫酷主题推荐!非常好看![通俗易懂]IntelliJIDEA介绍IDEA,全称IntelliJIDEA,是Java语言的集成开发环境,IDEA在业界被公认为是最好的java开发工具之一,尤其在智能代码助手、代码自动提示、重构、J2EE支持、Ant、JUnit、CVS整合、代码审查、创新的GUI设计等方面的功能可以说是超常的。*IDEA的官网下载地址:IDEA下载地址平时开发中由…

    2022年5月31日
    93
  • WineQQ_wine官网

    WineQQ_wine官网https://phpcj.org/wineqq/(转发备注:实测可用,安装完后把windows下的字体拷贝到/home/xxx/.wine/drive_c/windows/Fonts即可无乱码,作者持续更新,可关注上面的原链接)最后更新日期:2018年5月5日[20180505]1、QQ升级为小俊的9.0.3_23719。[20180420]1、QQ升级为小俊的9.0.2_23475。[2018…

    2025年9月22日
    8
  • 记录一次mysql 主从不同步的问题操作(hashlinux)

    记录一次mysql 主从不同步的问题操作(hashlinux)

    2021年9月16日
    50

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号