偏度和峰度的计算

偏度和峰度的计算偏度(skewness)和峰度(kurtosis):偏度能够反应分布的对称情况,右偏(也叫正偏),在图像上表现为数据右边脱了一个长长的尾巴,这时大多数值分布在左侧,有一小部分值分布在右侧。峰度反应

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

偏度(skewness)和峰度(kurtosis):

  偏度能够反应分布的对称情况,右偏(也叫正偏),在图像上表现为数据右边脱了一个长长的尾巴,这时大多数值分布在左侧,有一小部分值分布在右侧。

  峰度反应的是图像的尖锐程度:峰度越大,表现在图像上面是中心点越尖锐。在相同方差的情况下,中间一大部分的值方差都很小,为了达到和正太分布方差相同的目的,必须有一些值离中心点越远,所以这就是所说的“厚尾”,反应的是异常点增多这一现象。

 

偏度的定义:

image

样本X的偏度为样本的三阶标准矩

其中$\mu$是均值,$\delta$为标准差,E是均值操作。$\mu_3$是三阶中心距,$\kappa_t $是$t^{th}$累积量

 

偏度可以由三阶原点矩来进行表示:

image

 

样本偏度的计算方法:

一个容量为n的数据,一个典型的偏度计算方法如下:

image

其中$\bar x$为样本的均值(和$\mu$的区别是,$\mu$是整体的均值,$\bar x$为样本的均值)。s是样本的标准差,$m_3$是样本的3阶中心距。

另外一种定义如下:

image

$k_3$是三阶累积量$\kappa_3$的唯一对称无偏估计(unique symmetric unbiased estimator)($k_3$ 和 $\kappa_3$写法不一样)。$k_2=s^2$是二阶累积量的对称无偏估计。

大多数软件当中使用$G_1$来计算skew,如Excel,Minitab,SAS和SPSS。

 

峰度的定义:

image

  峰度定义为四阶标准矩,可以看出来和上面偏度的定义非常的像,只不过前者是三阶的。

 

样本的峰度计算方法:

image

 

样本的峰度还可以这样计算:

 

image

其中$k_4$是四阶累积量的唯一对称无偏估计,$k_2$是二阶累积量的无偏估计(等同于样本方差),$m_4$是样本四阶平均距,$m_2$是样本二阶平均距。

同样,大多数程序都是采用$G_2$来计算峰度。

 

python使用pandas来计算偏度和峰度

import pandas as pd
x = [53, 61, 49, 66, 78, 47]
s = pd.Series(x)
print(s.skew())
print(s.kurt())

它是用上面的$G_1$来计算偏度  $G_2$来计算峰度,结果如下:

0.7826325504212567
-0.2631655441038463

 

参考:

    偏度和峰度如何影响您的分布

    Skewness 维基百科给出了偏差的计算公式

   Kurtosis  维基百科给出峰度的计算公式

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/167123.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 近日学习笔记:df -h和du -sh命令,查看linux版本,vbm管理工具,su命令,ssh服务升级技巧,source命令

    近日学习笔记:df -h和du -sh命令,查看linux版本,vbm管理工具,su命令,ssh服务升级技巧,source命令文章目录df -h和du -sh区别df -h查看整个系统中文件系统的使用情况du -sh *查看当前目录下各个文件及目录占用空间大小查看Linux系统版本的命令:VirtualBox管理工具Vboxmanagesu与 su -的区别echo $?ssh服务升级BBS-GO的安装 linux + 宝塔面板【进了解】宝塔界面+数据库+NGINX的安装source命令~目录和/目录的区别df -h和du -sh区别(du, disk usage,-s仅显示总计,-h自适应单位 )df -h查看整个系统中文

    2022年8月11日
    4
  • Eureka集群原理

    Eureka集群原理问题:微服务RPC远程服务调用最核心的是什么?高可用,试想你的注册中心只有一个onlyone,它出故障了那就呵呵o( ̄︶ ̄)o了,会导致整个微服务环境不可用。解决办法:搭建Eureka注册中心集群,实现负载均衡+故障容错Eureka集群的原理:互相注册,相互守望。一个Eureka集群包含7001和7002等许多服务,在这个集群中,7001指向其他所有服务…

    2022年5月28日
    38
  • MySQL基础篇(DDL,DML,DQL,DCL详细讲解)

    一、常用开发工具1.NavicateNavicat是一套快速、可靠并价格相宜的数据库管理工具,专为简化数据库的管理及降低系统管理成本而设。它的设计符合数据库管理员、开发人员及中小企业的需要。Navicat是以直觉化的图形用户界面而建的,让你可以以安全并且简单的方式创建、组织、访问并共用信息。http://www.navicat.com.cn/破解方式:https://www.jb51.net/database/710931.html再手动激活[外链图片转存失败,源站可能有防盗链.

    2022年4月7日
    132
  • 计算机等级考试–二级Java的知识点大全

    计算机等级考试–二级Java的知识点大全第一章数据结构与算法【考点1】算法的基本概念1、算法:是指一组有穷的指令集,是解题方案的准确而完整的描述。算法不等于程序,也不等于计算方法。2、算法的基本特征:1)确定性,算法中每一步骤都必须有明确定义,不允许有多义性;2)有穷性,算法必须能在有限的时间内做完,即能在执行有限个步骤后终止;3)可行性,算法原则上能够精确地执行;4)拥有足够的情报。3、算法的组成…

    2022年5月2日
    39
  • centos7 yum安装MongoDB[通俗易懂]

    centos7 yum安装MongoDB[通俗易懂]原文博客地址http://xgs888.top/post/view?id=64centos7yum安装mongodb;1:创建仓库vi/etc/yum.repos.d/mongodb-org-3.4.repo2:把下面的内容复制到文件中保存退出[mongodb-org-3.4]name=MongoDBRepositorybaseurl

    2022年5月24日
    32
  • 新手学robotium-robotium初探

    新手学robotium-robotium初探这个月正式开始robotium的学习,生命不止,学习不止。作为一个初学者的我,尝试完了monkey跟monkeyrunner之后,严重意识到移动端也有更加高深的测试艺术。借用其他文章的话来说,这不仅是

    2022年7月1日
    20

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号