总体方差和样本方差

总体方差和样本方差讨论了总体方差和样本方差的区别


那么,如果总体量很大,不能做到全部采样,那么就需要用样本来估计总体,假设从总体为 N N N的总数中抽取 n n n个样本,其中 ( N > > n ) (N>>n) (N>>n),采样值为 x 1 , x 2 , . . . , x n x_1,x_2,…,x_n x1,x2,...,xn
样本均值为:
x ˉ = ∑ i = 1 n x i n \bar{x}=\frac{\sum_{i=1}^{n}{x_i}}{n} xˉ=ni=1nxi
样本的方差为:
S 2 = ∑ i = 1 n ( x i − x ˉ ) 2 n S^2=\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n} S2=ni=1n(xixˉ)2
但是样本的方差和总体的方差是有差别的,计算样本方差的期望值,来估计样本方差和实际方差 σ 2 \sigma^2 σ2之间差了多少:
E [ S 2 ] = E [ ∑ i = 1 n ( x i − x ˉ ) 2 n ] E[S^2]=E[\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n}] E[S2]=E[ni=1n(xixˉ)2]
= E [ 1 n ∑ i = 1 n ( ( x i − μ ) − ( x ˉ − μ ) ) 2 ] =E[\frac{1}{n}\sum_{i=1}^{n}{((x_i-\mu)-(\bar{x}-\mu))^2}] =E[n1i=1n((xiμ)(xˉμ))2]
= E [ 1 n ∑ i = 1 n ( ( x i − μ ) 2 − 2 ( x i − μ ) ( x ˉ − μ ) + ( x ˉ − μ ) 2 ) ] =E[\frac{1}{n}\sum_{i=1}^{n}{((x_i-\mu)^2-2(x_i-\mu)(\bar{x}-\mu)+(\bar{x}-\mu)^2)}] =E[n1i=1n((xiμ)22(xiμ)(xˉμ)+(xˉμ)2)]
= E [ 1 n ∑ i = 1 n ( x i − μ ) 2 − 2 n ( x ˉ − μ ) ∑ i = 1 n ( x i − μ ) + ( x ˉ − μ ) 2 ] =E[\frac{1}{n}\sum_{i=1}^{n}{(x_i-\mu)^2}-\frac{2}{n}(\bar{x}-\mu)\sum_{i=1}^{n}{(x_i-\mu)}+(\bar{x}-\mu)^2] =E[n1i=1n(xiμ)2n2(xˉμ)i=1n(xiμ)+(xˉμ)2]
其中
∑ i = 1 n ( x i − μ ) \sum_{i=1}^{n}{(x_i-\mu)} i=1n(xiμ)
= ∑ i = 1 n x i − ∑ i = 1 n μ =\sum_{i=1}^{n}{x_i}-\sum_{i=1}^{n}{\mu} =i=1nxii=1nμ
= n ( x ˉ − μ ) =n(\bar{x}-\mu) =n(xˉμ)
所以
= E [ 1 n ∑ i = 1 n ( x i − μ ) 2 − 2 n ( x ˉ − μ ) ∑ i = 1 n ( x i − μ ) + ( x ˉ − μ ) 2 ] =E[\frac{1}{n}\sum_{i=1}^{n}{(x_i-\mu)^2}-\frac{2}{n}(\bar{x}-\mu)\sum_{i=1}^{n}{(x_i-\mu)}+(\bar{x}-\mu)^2] =E[n1i=1n(xiμ)2n2(xˉμ)i=1n(xiμ)+(xˉμ)2]
= E [ 1 n ∑ i = 1 n ( x i − μ ) 2 − 2 ( x ˉ − μ ) 2 + ( x ˉ − μ ) 2 ] =E[\frac{1}{n}\sum_{i=1}^{n}{(x_i-\mu)^2}-2(\bar{x}-\mu)^2+(\bar{x}-\mu)^2] =E[n1i=1n(xiμ)22(xˉμ)2+(xˉμ)2]
= σ 2 − E [ ( x ˉ − μ ) 2 ] =\sigma^2-E[(\bar{x}-\mu)^2] =σ2E[(xˉμ)2]
(这里 σ 2 \sigma^2 σ2是因为样本方差的期望值是总体方差)
E [ ( x ˉ − μ ) 2 ] E[(\bar{x}-\mu)^2] E[(xˉμ)2]
= E ( x ˉ − E [ x ˉ ] ) 2 =E(\bar{x}-E[\bar{x}])^2 =E(xˉE[xˉ])2
= v a r ( x ˉ ) =var(\bar{x}) =var(xˉ)
= 1 n 2 v a r ( ∑ i = 1 n x i ) =\frac{1}{n^2}var(\sum_{i=1}^{n}{x_i}) =n21var(i=1nxi)
= 1 n 2 ∑ i = 1 n v a r ( x i ) =\frac{1}{n^2}\sum_{i=1}^{n}{var(x_i)} =n21i=1nvar(xi)
= n σ 2 n 2 =\frac{n\sigma^2}{n^2} =n2nσ2
= σ 2 n =\frac{\sigma^2}{n} =nσ2
根据上面推导的式子,有以下计算:
σ 2 − E [ ( x ˉ − μ ) 2 ] \sigma^2-E[(\bar{x}-\mu)^2] σ2E[(xˉμ)2]
= σ 2 − σ 2 n =\sigma^2-\frac{\sigma^2}{n} =σ2nσ2
= n − 1 n σ 2 =\frac{n-1}{n}\sigma^2 =nn1σ2
也就是说,样本估计的方差是总体方差的 n − 1 n \frac{n-1}{n} nn1倍,即所谓的有偏估计。要转换成无偏估计,只需要乘以倍数就可以了
n n − 1 S 2 = n n − 1 ∑ i = 1 n ( x i − x ˉ ) n = ∑ i = 1 n ( x i − x ˉ ) n − 1 \frac{n}{n-1}S^2=\frac{n}{n-1}\frac{\sum_{i=1}^{n}(x_i-\bar{x})}{n}=\frac{\sum_{i=1}^{n}(x_i-\bar{x})}{n-1} n1nS2=n1nni=1n(xixˉ)=n1i=1n(xixˉ)
这即是所谓的无偏估计
































版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/217699.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月18日 上午8:58
下一篇 2026年3月18日 上午8:58


相关推荐

  • 各大OJ刷题平台汇总

    前言想成为一名高级工程师,算法还是要有的,至少在入门编程和进入公司之前都是必备的。刷题也可以很好的锻炼动手能力和逻辑思维,今天就给大家介绍一些知名的在线刷题平台,都是干货哦!力扣(leetcode)江湖人尽皆知的站点,全球知名的编程平台!总部在美国旧金山的硅谷,创办与2011年,2018年进入中国,并推出付费服务,19年推出力扣App。力扣为全球程序员提供了专业的IT技术职业化提升平台,有效帮助程序员实现快速进步和长期成长(度说)。特点:支持c++,c,java,python,Rust,kot

    2022年4月4日
    1.0K
  • SQL数据库查询练习题及答案

    SQL数据库查询练习题及答案题目:设有一数据库,包括四个表:学生表(Student)、课程表(Course)、成绩表(Score)以及教师信息表(Teacher)。四个表的结构分别如表1-1的表(一)~表(四)所示,数据如表1-2的表(一)~表(四)所示。用SQL语句创建四个表并完成相关题目。查询问题:1、查询Student表中的所有记录的Sname、Ssex和Class列。2、查…

    2022年4月30日
    105
  • 智谱大模型,“上新”又开源

    智谱大模型,“上新”又开源

    2026年3月12日
    2
  • 数据结构–(ElemType *&T)代表的意义「建议收藏」

    数据结构–(ElemType *&T)代表的意义「建议收藏」1、前言ElemType表示抽象数据类型。首先看个例子:函数1:voidswap1(intx,inty){inttemp;temp=x;x=y;y=temp;}函数2:voidswap2(int&x,int&y){inttemp;temp=x;x=y;…

    2022年5月19日
    57
  • 利用NFS client provisioner动态提供Kubernetes后端存储卷–安装指南与实践[通俗易懂]

    利用NFS client provisioner动态提供Kubernetes后端存储卷–安装指南与实践[通俗易懂]利用NFS client provisioner动态提供Kubernetes后端存储卷–安装指南与实践

    2022年4月21日
    153
  • 字符串中查找子串_cstring查找子字符串

    字符串中查找子串_cstring查找子字符串子串查询首先,我们来定义两个概念,主串和模式串。我们在字符串A中查找字符串B,则A就是主串,B就是模式串。我们把主串的长度记为n,模式串长度记为m。由于是在主串中查找模式串,因此,主串的长度肯定比模式串长,n>m。因此,字符串匹配算法的时间复杂度就是n和m的函数。假设要从主串s=“goodgoogle”中找到t=“google”子串。根据我们的思考逻辑,则有:首先,我们从主串s第1位开始,判断s的第1个字符是否与t的第1个字.

    2022年8月21日
    5

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号