Chebyshev:切比雪夫不等式的理解与应用

Chebyshev:切比雪夫不等式的理解与应用公式 P X amp amp amp lt 1 2 2P X mu amp amp amp lt varepsilon geq1 frac sigma 2 varepsilon 2 P X amp amp lt 1 2 2 注 随机变量 XXX 必须具有数学期望 E X E X muE X 方差 D X 2D X sigma 2D X 2 vareps

公式

P { ∣ X − μ ∣ < ε } ≥ 1 − σ 2 ε 2 P\{|X-\mu|<\varepsilon\} \geq 1-\frac{\sigma^2}{\varepsilon^2} P{
X
μ<ε}1ε2σ2

注:随机变量 X X X必须具有数学期望 E ( X ) = μ E(X)=\mu E(X)=μ,方差 D ( X ) = σ 2 D(X)=\sigma^2 D(X)=σ2 ε \varepsilon ε为任意正数。

理解

在任意一个数据集中,位于其平均数 m m m个标准差范围内的比例总是至少为 1 - 1 m 2 1-\frac{1}{m^2} 1m21
标准差为 σ \sigma σ
ε = 2 σ \varepsilon=2\sigma ε=2σ时:所有数据中,至少有3/4(或75%)的数据位于平均数2个标准差范围内。
ε = 3 σ \varepsilon=3\sigma ε=3σ时:所有数据中,至少有8/9(或88.9%)的数据位于平均数3个标准差范围内。
ε = 5 σ \varepsilon=5\sigma ε=5σ时:所有数据中,至少有24/25(或96%)的数据位于平均数5个标准差范围内。



3 σ 3\sigma 3σ准则(拉依达准则)

它是指先假设一组检测数据只含有随机误差,对其进行计算处理得到标准偏差,按一定概率确定一个区间,认为凡超过这个区间的误差,就不属于随机误差而是粗大误差,含有该误差的数据应予以剔除。这种判别处理原理及方法仅局限于对正态或近似正态分布的样本数据处理,它是以测量次数充分大为前提的,当测量次数少的情形用准则剔除粗大误差是不够可靠的。

所以如果把切比雪夫不等式用于高斯分布的数据集,会得到一个非常保守、粗糙的上下界。

切比雪夫不等式的意义在于,它虽然是一个粗糙的估计,但是适用于任意分布的数据集和任意的正数 ε \varepsilon ε

应用

在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/212989.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月18日 下午6:48
下一篇 2026年3月18日 下午6:48


相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号