总体方差和样本方差

全栈程序员-站长 • 2026年3月18日上午8:58 • 未分类 • 阅读 1

总体方差和样本方差讨论了总体方差和样本方差的区别

那么，如果总体量很大，不能做到全部采样，那么就需要用样本来估计总体，假设从总体为 $N$ 的总数中抽取 $n$ 个样本，其中 $(N > > n)$ ，采样值为 $x_1,x_2,…,x_n$
样本均值为：
$\bar{x}=\frac{\sum_{i=1}^{n}{x_i}}{n}$
样本的方差为：
$S^2=\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n}$
但是样本的方差和总体的方差是有差别的，计算样本方差的期望值，来估计样本方差和实际方差 $\sigma^2$ 之间差了多少：
$E[S^2]=E[\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n}]$
$=E[\frac{1}{n}\sum_{i=1}^{n}{((x_i-\mu)-(\bar{x}-\mu))^2}]$
$=E[\frac{1}{n}\sum_{i=1}^{n}{((x_i-\mu)^2-2(x_i-\mu)(\bar{x}-\mu)+(\bar{x}-\mu)^2)}]$
$=E[\frac{1}{n}\sum_{i=1}^{n}{(x_i-\mu)^2}-\frac{2}{n}(\bar{x}-\mu)\sum_{i=1}^{n}{(x_i-\mu)}+(\bar{x}-\mu)^2]$
其中
$\sum_{i=1}^{n}{(x_i-\mu)}$
$=\sum_{i=1}^{n}{x_i}-\sum_{i=1}^{n}{\mu}$
$=n(\bar{x}-\mu)$
所以
$=E[\frac{1}{n}\sum_{i=1}^{n}{(x_i-\mu)^2}-\frac{2}{n}(\bar{x}-\mu)\sum_{i=1}^{n}{(x_i-\mu)}+(\bar{x}-\mu)^2]$
$=E[\frac{1}{n}\sum_{i=1}^{n}{(x_i-\mu)^2}-2(\bar{x}-\mu)^2+(\bar{x}-\mu)^2]$
$=\sigma^2-E[(\bar{x}-\mu)^2]$
（这里 $\sigma^2$ 是因为样本方差的期望值是总体方差）
$E[(\bar{x}-\mu)^2]$
$=E(\bar{x}-E[\bar{x}])^2$
$=var(\bar{x})$
$=\frac{1}{n^2}var(\sum_{i=1}^{n}{x_i})$
$=\frac{1}{n^2}\sum_{i=1}^{n}{var(x_i)}$
$=\frac{n\sigma^2}{n^2}$
$=\frac{\sigma^2}{n}$
根据上面推导的式子，有以下计算：
$\sigma^2-E[(\bar{x}-\mu)^2]$
$=\sigma^2-\frac{\sigma^2}{n}$
$=\frac{n-1}{n}\sigma^2$
也就是说，样本估计的方差是总体方差的 $\frac{n-1}{n}$ 倍，即所谓的有偏估计。要转换成无偏估计，只需要乘以倍数就可以了
$\frac{n}{n-1}S^2=\frac{n}{n-1}\frac{\sum_{i=1}^{n}(x_i-\bar{x})}{n}=\frac{\sum_{i=1}^{n}(x_i-\bar{x})}{n-1}$
这即是所谓的无偏估计

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们举报，一经查实，本站将立刻删除。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/217699.html原文链接：https://javaforall.net

赞 (0)

0 0

关于作者

全栈程序员-站长

133.5K 文章

3 粉丝

本网站汇聚当前互联网主流语音，持续更新，欢迎关注公众号“全栈程序员社区”

js变速运动特效

上一篇 2026年3月18日上午8:58

使用微信云开发的存储功能

下一篇 2026年3月18日上午8:58

各大OJ刷题平台汇总

前言想成为一名高级工程师，算法还是要有的，至少在入门编程和进入公司之前都是必备的。刷题也可以很好的锻炼动手能力和逻辑思维，今天就给大家介绍一些知名的在线刷题平台,都是干货哦！力扣(leetcode)江湖人尽皆知的站点，全球知名的编程平台！总部在美国旧金山的硅谷，创办与2011年，2018年进入中国，并推出付费服务，19年推出力扣App。力扣为全球程序员提供了专业的IT技术职业化提升平台，有效帮助程序员实现快速进步和长期成长(度说)。特点：支持c++,c,java,python,Rust,kot

全栈程序员-站长
2022年4月4日
1.0K
SQL数据库查询练习题及答案

SQL数据库查询练习题及答案题目：设有一数据库，包括四个表：学生表（Student）、课程表（Course）、成绩表（Score）以及教师信息表（Teacher）。四个表的结构分别如表1-1的表（一）~表（四）所示，数据如表1-2的表（一）~表（四）所示。用SQL语句创建四个表并完成相关题目。查询问题：1、查询Student表中的所有记录的Sname、Ssex和Class列。2、查…

全栈程序员-站长
2022年4月30日
105
智谱

智谱大模型，“上新”又开源

智谱大模型，“上新”又开源

Ai探索者
2026年3月12日
2
数据结构–(ElemType *&T)代表的意义「建议收藏」

数据结构–(ElemType *&T)代表的意义「建议收藏」1、前言ElemType表示抽象数据类型。首先看个例子：函数1：voidswap1(intx,inty){inttemp;temp=x;x=y;y=temp;}函数2：voidswap2(int&x,int&y){inttemp;temp=x;x=y;…

全栈程序员-站长
2022年5月19日
57
利用NFS client provisioner动态提供Kubernetes后端存储卷–安装指南与实践[通俗易懂]

利用NFS client provisioner动态提供Kubernetes后端存储卷–安装指南与实践[通俗易懂]利用NFS client provisioner动态提供Kubernetes后端存储卷–安装指南与实践

全栈程序员-站长
2022年4月21日
153
字符串中查找子串_cstring查找子字符串

字符串中查找子串_cstring查找子字符串子串查询首先，我们来定义两个概念，主串和模式串。我们在字符串A中查找字符串B，则A就是主串，B就是模式串。我们把主串的长度记为n，模式串长度记为m。由于是在主串中查找模式串，因此，主串的长度肯定比模式串长，n>m。因此，字符串匹配算法的时间复杂度就是n和m的函数。假设要从主串s=“goodgoogle”中找到t=“google”子串。根据我们的思考逻辑，则有：首先，我们从主串s第1位开始，判断s的第1个字符是否与t的第1个字.

全栈程序员-站长
2022年8月21日
5

发表回复

关注全栈程序员社区公众号