如何理解95%置信区间_95的置信区间和90的置信区间

如何理解95%置信区间_95的置信区间和90的置信区间1.点估计与区间估计首先我们看看点估计的含义:是用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示,所以称为点估计。点估计虽然给出了未知参数的估计值,但是未给出估计值的可靠程度,即估计值偏离未知参数真实值的程度。接下来看下区间估计:给定置信水平,根据估计值确定真实值可能出现的区间范围,该区间通常以估计值为中心,该区间则为置信区间。2.中心…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

项目github地址:bitcarmanlee easy-algorithm-interview-and-practice
经常有同学私信或留言询问相关问题,V号bitcarmanlee。github上star的同学,在我能力与时间允许范围内,尽可能帮大家解答相关问题,一起进步。

1.点估计与区间估计

首先我们看看点估计的含义:
是用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示,所以称为点估计。点估计虽然给出了未知参数的估计值,但是未给出估计值的可靠程度,即估计值偏离未知参数真实值的程度。
接下来看下区间估计:
给定置信水平,根据估计值确定真实值可能出现的区间范围,该区间通常以估计值为中心,该区间则为置信区间。

2.中心极限定理与大数定理

中心极限定理:
在适当的条件下,大量相互独立随机变量的均值经适当标准化后依分布收敛于正态分布。例如我们要计算全中国人的平均身高。如果每次取10000个身高作为样本,对应有一个样本均值。如果再从总体中重复抽取n多次10000个样本,就对应有n个样本均值。随着n增大,把所有样本均值画出来,得到的就是一个接近正太分布的曲线。
大数定理:
取样数趋近无穷时,样品平均值按概率收敛于期望值。抛硬币的次数越多,越接近正反各一半。

3.置信区间与置信水平

一般我们用中括号[a,b]表示样本估计总体平均值误差范围的区间。a、b的具体数值取决于你对于”该区间包含总体均值”这一结果的可信程度,因此[a,b]被称为置信区间。
一般来说,选定某一个置信区间,我们的目的是为了让”ab之间包含总体平均值”的结果有一特定的概率,这个概率就是所谓的置信水平。
例如我们最常用的95%置信水平,就是说做100次抽样,有95次的置信区间包含了总体均值。

4.标准差(standard deviation)与标准误差(standard error)

标准差是描述观察值(个体值)之间的变异程度(例如一个人打十次靶子的成绩,这时有一个平均数8,有一个反映他成绩稳定与否的标准差);
标准误是描述样本均数的抽样误差(例如十次抽样,每次他成绩平均数(7,8,6,9,5,6,7,7,8,9)的标准差,也就是抽样分布的标准差);
样本的标准误差为:
S E = s ( 样 本 标 准 差 ) n SE = \frac{s(样本标准差)} {\sqrt{n}} SE=n
s()

5.如何理解95%的置信区间

以上面的统计身高为例,假设全国人民的身高服从正态分布:
X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) XN(μ,σ2)

不断进行采样,假设样本的大小为n,则样本的均值为:
M = X 1 + X 2 + ⋯ + X n n M = \frac{X_1 + X_2 + \cdots + X_n}{n} M=nX1+X2++Xn

由大数定理与中心极限定理:
M ∼ N ( μ , σ 1 2 ) M \sim N(\mu, \sigma_1^2) MN(μ,σ12)
注意 σ 1 \sigma_1 σ1的计算方法为第4部分提到的标准误差!

为什么常用95%的置信水平:

这里写图片描述

对照上图,用一句简单的话概括就是:
有95%的样本均值会落在2个(比较精确的值是1.96)标准误差范围内。

用数学公式描述就是:
P ( μ − 1.96 σ n < M < μ + 1.96 σ n ) = 0.95 P(\mu – 1.96 \frac{\sigma}{\sqrt{n}} < M < \mu + 1.96 \frac{\sigma}{\sqrt{n}} ) = 0.95 P(μ1.96n
σ
<
M<μ+1.96n
σ
)=
0.95

6.计算置信区间的套路

从上面的例子来看,计算置信区间的套路如下:
1.首先明确要求解的问题。比如我们的例子,就是想通过样本来估计全国人民身高的平均值。
2.求抽样样本的平均值与标准误差(standard error)。注意标准误差与标准差(standard deviation)不一样。
3.确定需要的置信水平。比如常用的95%的置信水平,这样可以保证样本的均值会落在总体平均值2个标准差得范围内。
4.查z表,求z值。
5.计算置信区间
a = 样本均值 – z标准误差
b = 样本均值 + z
标准误差

用公式表示置信区间:
x ‾ ± z s n \overline x \pm z \frac{s}{\sqrt n} x±zn
s

其中, x ‾ \overline x x表示样本的均值, z z z值表示有多少标准差, s s s为样本的方差。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/190171.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • virtualbox增强功能-VBoxGuestAdditions安装

    virtualbox增强功能-VBoxGuestAdditions安装小白的艰辛历程,记录点点滴滴,聚少成多。1、准备virtualbox增强功能VBoxGuestAdditions.iso默认安装virtualbox时就没有增强功能的iso自行下载VBoxGuestAdditions.iso备用如还是没有可以去官网另外下载http://download.virtualbox.org/virtualbox/5.0.2/VBoxGuestAdditions_5.0.2.iso还可以在VBox工具中添加扩展功能,此处仅使用外部添加。2、在virtualb..

    2022年6月24日
    90
  • 域名系统DNS用来解析_网页域名解析错误怎么办

    域名系统DNS用来解析_网页域名解析错误怎么办1、DNSDNS(DomainNameSystem)是域名系统的英文缩写,是一种组织成域层次结构的计算机和网络服务命名系统,用于TCP/IP网络。2、域名系统DNS的作用通常我们有两种方式识别主机:通过主机名或者IP地址。人们喜欢便于记忆的主机名表示,而路由器则喜欢定长的、有着层次结构的IP地址。为了满足这些不同的偏好,我们就需要一种能够进行主机名到IP地址转换的目录服务,域名系统作为将域名和IP地址相互映射的一个分布式数据库,能够使人更方便地访问互联网。因此,即使不使用域名

    2022年10月15日
    4
  • 联想服务器raid卡驱动_联想服务器官网

    联想服务器raid卡驱动_联想服务器官网联想服务器ThinkSeverRAID卡设置教程:一、启动联想服务器到下图中界面:联想服务器启动到此界面后按键盘组合键Ctrl+H进入RAID卡选择页面(WebBIOS),按“确定”进入设置页面。二、点击【设置向导(ConfigurationWizard)】开始RAID卡配置。三、在下图中选择【自定义配置(ManualConfiguration)】-【下一步】。四、在下图中在…

    2025年7月23日
    2
  • IDEA热部署设置「建议收藏」

    IDEA热部署设置「建议收藏」转载位置:https://blog.csdn.net/nihao12323432/article/details/82664601

    2022年6月13日
    36
  • JAVA+Selenium2—淘宝秒杀购物车脚本

    JAVA+Selenium2—淘宝秒杀购物车脚本JAVA+Selenium—淘宝清空购物车脚本前言准备代码注前言对于自己近期学习的归纳与应用,只是个简单的线性脚本。之前学习了selenium,发现csdn上大都是python+selenium,故参考后改成java+selenium,另外把读取本地时间改成了读取网站时间,更为精确。准备JAVA环境,Selenium-2.46.0jar包,火狐浏览器固定版本(自用的可能是32.0)j…

    2022年5月8日
    126
  • Android开源项目分享

    Android开源项目分享

    2022年1月8日
    49

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号