如何理解95%置信区间_95的置信区间和90的置信区间

如何理解95%置信区间_95的置信区间和90的置信区间1.点估计与区间估计首先我们看看点估计的含义:是用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示,所以称为点估计。点估计虽然给出了未知参数的估计值,但是未给出估计值的可靠程度,即估计值偏离未知参数真实值的程度。接下来看下区间估计:给定置信水平,根据估计值确定真实值可能出现的区间范围,该区间通常以估计值为中心,该区间则为置信区间。2.中心…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

项目github地址:bitcarmanlee easy-algorithm-interview-and-practice
经常有同学私信或留言询问相关问题,V号bitcarmanlee。github上star的同学,在我能力与时间允许范围内,尽可能帮大家解答相关问题,一起进步。

1.点估计与区间估计

首先我们看看点估计的含义:
是用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示,所以称为点估计。点估计虽然给出了未知参数的估计值,但是未给出估计值的可靠程度,即估计值偏离未知参数真实值的程度。
接下来看下区间估计:
给定置信水平,根据估计值确定真实值可能出现的区间范围,该区间通常以估计值为中心,该区间则为置信区间。

2.中心极限定理与大数定理

中心极限定理:
在适当的条件下,大量相互独立随机变量的均值经适当标准化后依分布收敛于正态分布。例如我们要计算全中国人的平均身高。如果每次取10000个身高作为样本,对应有一个样本均值。如果再从总体中重复抽取n多次10000个样本,就对应有n个样本均值。随着n增大,把所有样本均值画出来,得到的就是一个接近正太分布的曲线。
大数定理:
取样数趋近无穷时,样品平均值按概率收敛于期望值。抛硬币的次数越多,越接近正反各一半。

3.置信区间与置信水平

一般我们用中括号[a,b]表示样本估计总体平均值误差范围的区间。a、b的具体数值取决于你对于”该区间包含总体均值”这一结果的可信程度,因此[a,b]被称为置信区间。
一般来说,选定某一个置信区间,我们的目的是为了让”ab之间包含总体平均值”的结果有一特定的概率,这个概率就是所谓的置信水平。
例如我们最常用的95%置信水平,就是说做100次抽样,有95次的置信区间包含了总体均值。

4.标准差(standard deviation)与标准误差(standard error)

标准差是描述观察值(个体值)之间的变异程度(例如一个人打十次靶子的成绩,这时有一个平均数8,有一个反映他成绩稳定与否的标准差);
标准误是描述样本均数的抽样误差(例如十次抽样,每次他成绩平均数(7,8,6,9,5,6,7,7,8,9)的标准差,也就是抽样分布的标准差);
样本的标准误差为:
S E = s ( 样 本 标 准 差 ) n SE = \frac{s(样本标准差)} {\sqrt{n}} SE=n
s()

5.如何理解95%的置信区间

以上面的统计身高为例,假设全国人民的身高服从正态分布:
X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) XN(μ,σ2)

不断进行采样,假设样本的大小为n,则样本的均值为:
M = X 1 + X 2 + ⋯ + X n n M = \frac{X_1 + X_2 + \cdots + X_n}{n} M=nX1+X2++Xn

由大数定理与中心极限定理:
M ∼ N ( μ , σ 1 2 ) M \sim N(\mu, \sigma_1^2) MN(μ,σ12)
注意 σ 1 \sigma_1 σ1的计算方法为第4部分提到的标准误差!

为什么常用95%的置信水平:

这里写图片描述

对照上图,用一句简单的话概括就是:
有95%的样本均值会落在2个(比较精确的值是1.96)标准误差范围内。

用数学公式描述就是:
P ( μ − 1.96 σ n < M < μ + 1.96 σ n ) = 0.95 P(\mu – 1.96 \frac{\sigma}{\sqrt{n}} < M < \mu + 1.96 \frac{\sigma}{\sqrt{n}} ) = 0.95 P(μ1.96n
σ
<
M<μ+1.96n
σ
)=
0.95

6.计算置信区间的套路

从上面的例子来看,计算置信区间的套路如下:
1.首先明确要求解的问题。比如我们的例子,就是想通过样本来估计全国人民身高的平均值。
2.求抽样样本的平均值与标准误差(standard error)。注意标准误差与标准差(standard deviation)不一样。
3.确定需要的置信水平。比如常用的95%的置信水平,这样可以保证样本的均值会落在总体平均值2个标准差得范围内。
4.查z表,求z值。
5.计算置信区间
a = 样本均值 – z标准误差
b = 样本均值 + z
标准误差

用公式表示置信区间:
x ‾ ± z s n \overline x \pm z \frac{s}{\sqrt n} x±zn
s

其中, x ‾ \overline x x表示样本的均值, z z z值表示有多少标准差, s s s为样本的方差。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/190171.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • ant安装配置使用介绍及eclipse中使用

    ant安装配置使用介绍及eclipse中使用一、安装ant到官方主页http://ant.apache.org下载新版(目前为Ant1.8.1)的ant,得到的是一个apache-ant-1.8.1-bin.zip的压缩包。将其解压到你的硬盘上,例如:C:\apache-ant-1.8.1。ant是java编写的,具有跨平台特点。.需要安装JDK,二、配置环境变量window中设置ant环境变量:配置环境变量

    2022年7月18日
    19
  • header(‘Content-type:text/html;charset = utf-8’);出现中文乱码

    header(‘Content-type:text/html;charset = utf-8’);出现中文乱码header(‘Content-type:text/html;charset=utf-8’);”=”两旁不能留空格,必须紧密连写,否则出现乱码;如果不行,再用Editplus重新保存为UTF8编码,本身Editplus就有一个设置编码的,不过我这是英文版本的,点击菜单栏的第五项,有一个Document的选项,然后单击它,在下拉菜单里,有一项FileEncoding,再进

    2022年7月16日
    17
  • JetBrick 入门详解

    JetBrick 入门详解JetBrick的简单使用方法,仅作为简单的入门,不做内部详细的探讨。

    2022年6月17日
    35
  • 简述django请求生命周期_django更新数据库记录

    简述django请求生命周期_django更新数据库记录Django请求生命周期分析1.客户端发送请求在浏览器输入url地址,例如www.baidu.com,浏览器会自动补全协议(http),变为http://www.baidu.com,现在部分网站都

    2022年7月31日
    5
  • Excel中的sumifs_理解和懂得的区别

    Excel中的sumifs_理解和懂得的区别SUMIF函数和SUMIFS函数都是EXCEL常用函数之一,同时这二个函数都是条件求和,只不过SUMIF函数是单条件求和,SUMIFS函数是多条件求和,其语法结构也是不同的。希望通过本经验能够使大家对

    2022年8月5日
    5
  • linux关闭防火墙命令_防火墙配置策略

    linux关闭防火墙命令_防火墙配置策略在外部访问CentOS中部署应用时,需要关闭防火墙。关闭防火墙命令:systemctlstopfirewalld.service开启防火墙:systemctlstartfirewalld.service关闭开机自启动:systemctldisablefirewalld.service开启开机启动:systemctlenablefirewalld.service…

    2025年9月21日
    9

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号