样本峰度(kurtosis)与随机变量的峰度及四阶统计量之间的关系和计算估计

全栈程序员-站长 • 2026年3月17日上午9:52 • 未分类 • 阅读 2

一、峰度kurtosis

1. 随机变量的峰度定义（Pearson’s moment coefficient of kurtosis）

随机变量 ${X}$ 的峰度kurtosis为四阶标准矩，标准定义为：

$Kurt[X]=\displaystyle E \Big[(\frac{X-\mu}{\sigma})^4\Big]=\frac{\mu_4}{\sigma^4}=\frac{E\Big[(X-\mu)^4\Big]}{\Big(E\Big[(X-\mu)^2\Big]\Big)^2},$

其中， $\mu_4$ 为随机变量 ${X}$ 的四阶中心距， $\sigma$ 为随机变量 ${X}$ 的标准差， $E$ 是求期望。

2. 样本峰度的定义

具有n( $n\geq 3$ )个样本的峰度定义为：

$\displaystyle g_2=\frac{m_4}{m_2^2} – 3=\frac{\frac{1}{n}\Sigma_{i=1}^{n}(x_i-{\bar x})^4}{\Big[\frac{1}{n}\Sigma_{i=1}^{n}(x_i-{\bar x})^2\Big]^2} – 3$

其中， $\bar x$ 为样本的均值， $m_2$ 为关于均值二阶样本矩（即二阶样本中心矩，或样本方差）， $m_4$ 为关于均值的四阶样本矩（即四阶样本中心矩）。

3. 总体峰度的估计

实际上，在许多文献中，尤其对于总体的样本子集来说，样本峰度是关于总体峰度的一个无偏估计量；一个常用的总体峰度的估计量计算公式为：

${\begin{aligned}G_{2}&={\frac {k_4}{k_2^{2}}} \\[18pt]&={\frac {n^{2}\,[(n+1)\,m_{4}-3\,(n-1)\,m_{2}^{2}]}{(n-1)\,(n-2)\,(n-3)}}\;{\frac {(n-1)^{2}}{n^{2}\,m_{2}^{2}}} \\[18pt]&={\frac {n-1}{(n-2)\,(n-3)}}\left[(n+1)\,{\frac {m_{4}}{m_{2}^{2}}}-3\,(n-1)\right] \\[18pt]&={\frac {n-1}{(n-2)\,(n-3)}}\left[(n+1)\,g_{2}+6\right]//样本峰度的无偏估计量 \\[18pt]&={\frac {(n+1)\,n\,(n-1)}{(n-2)\,(n-3)}}\;{\frac {\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{4}}{\left[\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}\right]^{2}}}-3\,{\frac {(n-1)^{2}}{(n-2)\,(n-3)}} \\[18pt]&={\frac {(n+1)\,n}{(n-1)\,(n-2)\,(n-3)}}\;{\frac {\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{4}}{k_{2}^{2}}}-3\,{\frac {(n-1)^{2}}{(n-2)(n-3)}}\end{aligned}}$

其中， $\kappa_4$ 为四阶累积量的唯一对称无偏估计量， $\kappa_2$ 为二阶累积量的对称无偏估计量（即样本方差的无偏估计量）， $m_4$ 为四阶样本中心矩， $m_2$ 为二阶样本中心矩， $\bar x$ 为样本均值。

通常来说，峰度 $G_2$ 都是有偏估计量，只有正态分布是无偏的。

大多数软件实现的峰度计算公式包括Python的Pandas库都是采用 $G_2$ 的计算公式实现的。

Pandas 源码片段

def nankurt(values, axis=None, skipna=True, mask=None): """ Compute the sample excess kurtosis The statistic computed here is the adjusted Fisher-Pearson standardized moment coefficient G2, computed directly from the second and fourth central moment. """ ...... mean = values.sum(axis, dtype=np.float64) / count if axis is not None: mean = np.expand_dims(mean, axis) adjusted = values - mean if skipna: np.putmask(adjusted, mask, 0) adjusted2 = adjusted  2 adjusted4 = adjusted2  2 m2 = adjusted2.sum(axis, dtype=np.float64) m4 = adjusted4.sum(axis, dtype=np.float64) with np.errstate(invalid='ignore', divide='ignore'): adj = 3 * (count - 1)  2 / ((count - 2) * (count - 3)) numer = count * (count + 1) * (count - 1) * m4 denom = (count - 2) * (count - 3) * m2  2 with np.errstate(invalid='ignore', divide='ignore'): result = numer / denom - adj ...... return result

参考资料

Skewness – WikiPedia

Joanes D N, Gill C A. Comparing measures of sample skewness and kurtosis[J]. Journal of the Royal Statistical Society: Series D (The Statistician), 1998, 47(1): 183-189.

binti Yusoff S, Wah Y B. Comparison of conventional measures of skewness and kurtosis for small sample size[C]//2012 International Conference on Statistics in Science, Business and Engineering (ICSSBE). IEEE, 2012: 1-6.

Pebay P P. Formulas for robust, one-pass parallel computation of covariances and arbitrary-order statistical moments[R]. Sandia National Laboratories, 2008.

Online skewness kurtosis computing

Online linear regression computing

Pandas

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/225201.html原文链接：https://javaforall.net

样本峰度(kurtosis)与随机变量的峰度及四阶统计量之间的关系和计算估计

一、峰度kurtosis

1. 随机变量的峰度定义（Pearson’s moment coefficient of kurtosis）

2. 样本峰度的定义

3. 总体峰度的估计

Pandas 源码片段

参考资料

关于作者

全栈程序员-站长

发表回复

样本峰度(kurtosis)与随机变量的峰度及四阶统计量之间的关系和计算估计

一、峰度kurtosis

1. 随机变量的峰度定义（Pearson’s moment coefficient of kurtosis）

2. 样本峰度的定义

3. 总体峰度的估计

Pandas 源码片段

参考资料

关于作者

全栈程序员-站长

相关推荐

树莓派 1602A显示屏[通俗易懂]

TIFF文件结构详解

数据库基础（常用SQL语句）[通俗易懂]

c++ fstream流seekg()重定位问题

java字符串去重_java字符串去重方法详解,字符串如何去重?

python如何安装numpy

发表回复