U 检验

U 检验假设检验 思维导图 https img blog csdnimg cn 42098 jpeg x oss process image watermark type ZmFuZ3poZW5n shadow 10 text aHR0cHM6Ly9i size 16 color FFFFFF t 70 pic center 文章思维导图 U 检验单总体应用条件 TechnicalNot


U 检验也叫 Z 检验,指检验统计量服从方差已知的正态分布的假设检验。


思维导图内容

单样本 U 检验

U 检验也叫 Z 检验,定义为:检验的检验统计量 Z 由:
Z = n ( X ˉ − μ 0 ) σ Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma} Z=σn
(Xˉμ0)

求出,其中 n n n 为样本容量, μ 0 \mu_0 μ0 是通过假设知晓的常数, σ \sigma σ 为总体的标准差。

中心极限定理

多个样本和的标准化,在
n → ∞ n\to\infin n 的情况下服从正态分布。一般的,当
n > 30 n>30 n>30 时,可以视为正态分布,采用 U 检验

有精确估计:

很多情况下
σ \sigma σ 本质上都是测量而来,是一种精确的估计。因此,若
σ \sigma σ 未知,若能够保证精确度,也可以用估计值,样本标准差
S S S 代替。一般需要
n > 50 n>50 n>50

返回目录

应用条件

根据定义

前提    :       样 本 i . i . d , 且 分 布 等 于 总 体 分 布 1.    Z 服 从 正 态 分 布 , 且 分 布 的 σ 已 知 或    : 2.    样 本 容 量 n > 30 , 且 分 布 σ 已 知 或    : 3.    样 本 容 量 n > 50 \begin{aligned} && &\textbf{前提}~~:\\ && &~~~~~ 样本 i.i.d, 且分布等于总体分布\\ \\ && &1.~~ Z服从正态分布,且分布的 \sigma已知 \\ && &\textbf{或}~~:\\ && &2.~~ 样本容量 n>30,且分布\sigma已知 \\ && &\textbf{或}~~:\\ && &3.~~ 样本容量 n>50 \\ \end{aligned} 前提  :     i.i.d1.  Zσ  :2.  n>30σ  :3.  n>50



返回目录

应用过程

设总体 X 服从正态分布 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2) μ \mu μ 未知, σ \sigma σ 已知。现从总体中抽出 n n n i . i . d i.i.d i.i.d 的样品 X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,,Xn,共同的分布为总体分布。

对于第一种假设,原假设取值为一个点,备选假设取值为两边,这类假设对应的检验,也叫双边检验。根据定义,检验统计量为:
Z = n ( X ˉ − μ 0 ) σ Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma} Z=σn
(Xˉμ0)

根据样本的性质,可知 X ˉ ∼ N ( μ , σ 2 n ) \bar{X}\sim N(\mu,\frac{\sigma^2}{n}) XˉN(μ,nσ2) ,于是 Z ∼ N ( n ( μ − μ 0 ) σ , 1 ) Z\sim N(\frac{\sqrt{n}(\mu-\mu_0)}{\sigma},1) ZN(σn
(μμ0)
,1)


根据假设检验的一般步骤
给 定 显 著 水 平 α , ∵ ∣ Z ∣ ↑ , H 0 越 难 成 立 , ⇓ 令 : P { ∣ Z = n ( X ˉ − μ 0 ) σ ∣ > C ∣ H 0 } ≤ α 在 原 假 设 和 成 立 时 , X ˉ ∼ N ( μ 0 , σ 2 / n ) , Z ∼ N ( 0 , 1 ) ⇓ C = u α / 2 , u 1 − α / 2 ⇓ 求 得 拒 绝 域 为 Z ∈ ( − ∞ , u α / 2 ) ∪ ( u 1 − α / 2 , + ∞ ) 给定显著水平 \alpha,\because |Z|\uarr ,H_0 越难成立,\\ \Darr \\ 令:P\{\vert Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma}\vert>C|H_0\}\leq \alpha \\ \\ 在原假设和成立时,\bar{X}\sim N(\mu_0,\sigma^2/n),Z\sim N(0,1)\\ \Darr\\ C=u_{\alpha/2},u_{1-\alpha/2}\\ \Darr\\ 求得拒绝域为 Z\in(-\infin,u_{\alpha/2})\cup(u_{1-\alpha/2},+\infin) αZ,H0P{
Z=
σn
(Xˉμ0)
>
CH0}αXˉN(μ0,σ2/n)ZN(0,1)C=uα/2,u1α/2Z(,uα/2)(u1α/2,+)

故只要求出检验统计量的观察值,根据拒绝域做出判断即可。

注意,检验是否属于双边,不是由拒绝域是否双边决定的,而是由假设决定,下文读者将会体会到其中的差异。

返回目录

返回目录

返回目录

实验设计

在进行采样时,通常需要事前确定 n n n

为例,给定显著水平 α \alpha α ∵ Z ↑ , H 0 \because Z\uarr,H_0 Z,H0 越难成立, ∴ \therefore 设定检验标准(拒绝)为: Z > C Z>C Z>C

定义势函数为:
p ( μ ) = P { Z > C ∣ μ ∈ ( − ∞ , ∞ ) } = P { n ( X ˉ − μ ) σ ≥ C + n ( μ 0 − μ ) σ ∣ μ ∈ ( − ∞ , ∞ ) } ∵    n ( X ˉ − μ ) σ ∼ N ( 0 , 1 ) = 1 − Φ ( C + n ( μ 0 − μ ) σ ) \begin{aligned} p(\mu)&=P\{ Z > C| \mu\in(-\infin,\infin)\} \\ &= P\{ \frac{\sqrt{n}(\bar{X}-\mu)}{\sigma} \geq C+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}| \mu\in(-\infin,\infin)\} \\ \because ~~&\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma} \sim N(0,1)\\ &=1-\Phi(C+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}) \end{aligned} p(μ)  =P{
Z>Cμ(,)}
=P{
σn
(Xˉμ)
C+σn
(μ0μ)
μ(,)}
σn
(Xˉμ)
N(0,1)
=1Φ(C+σn
(μ0μ)
)

α \alpha α,则根据检验标准的临界值求取法则,有:
s u p μ { 1 − Φ ( C + n ( μ 0 − μ ) σ ) ∣ μ ∈ ( − ∞ , μ 0 ) } < = α \underset{\mu}{sup} \{1-\Phi(C+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma})|\mu\in(-\infin,\mu_0)\} <= \alpha μsup{
1
Φ(C+σn
(μ0μ)
)μ
(,μ0)}<=α

最后得到检验标准的临界值 C = u 1 − α C=u_{1-\alpha} C=u1α



  1. 势函数是 n ( μ 0 − μ ) σ \frac{\sqrt{n}(\mu_0-\mu)}{\sigma} σn
    (μ0μ)
    的函数,且是连续的、非减的。
  2. l i m μ → μ 0 Φ ( u 1 − α + n ( μ 0 − μ ) σ ) = α l i m μ → + ∞ Φ ( u 1 − α + n ( μ 0 − μ ) σ ) = 1 \underset{\mu\to\mu_0}{lim} \Phi(u_{1-\alpha}+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma})=\alpha\\ \underset{\mu\to+\infin}{lim} \Phi(u_{1-\alpha}+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma})=1 μμ0limΦ(u1α+σn
    (μ0μ)
    )=
    αμ+limΦ(u1α+σn
    (μ0μ)
    )=
    1

设无差别区域为 μ ∈ ( μ 0 , Δ ) \mu\in(\mu_0,\Delta) μ(μ0,Δ),则对于 [ Δ , + ∞ ] [\Delta,+\infin] [Δ,+],给定一个 β \beta β,使得 p ( μ ) ≥ 1 − β p(\mu)\geq1-\beta p(μ)1β。由于势函数是非减的,故问题转换为临界问题:
p ( μ ) = 1 − Φ ( u 1 − α + n ( μ 0 − μ ) σ ) = 1 − β Φ ( u 1 − α + n ( μ 0 − μ ) σ ) = β \begin{aligned} p(\mu) = 1- \Phi(u_{1-\alpha}+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}) = 1-\beta \\ \Phi(u_{1-\alpha}+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}) = \beta \end{aligned} p(μ)=1Φ(u1α+σn
(μ0μ)
)=1β
Φ(u1α+σn
(μ0μ)
)=β

从而得出适当的 n , σ n, \sigma n,σ ,前者对应采样容量,后者是在测量问题上,可考虑提高测量精度。

其中, β \beta β 是当备选假设成立时,原假设被错误地接受的概率的临界值。

通过 β , α , Δ \beta,\alpha, \Delta β,α,Δ,即可知道我们进行试验设计,得出适当的 n n n

返回目录

双样本 U 检验

单样本 U 检验,其应用条件亦需要 Z 服从正态分布,且分布的方差已知。当然,在大样本情况下,亦可以将 Z 视为正态分布,并用样本方差估计 σ \sigma σ

返回目录

应用条件

应用条件

应用过程

设总体 X 1 , X 2 X_1,X_2 X1,X2 服从正态分布 N ( μ 1 , σ 1 2 ) , N ( μ 2 , σ 2 2 ) N(\mu_1,\sigma_1^2),N(\mu_2,\sigma_2^2) N(μ1,σ12),N(μ2,σ22) μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2 未知, σ 1 , σ 2 \sigma_1,\sigma_2 σ1,σ2 已知。现从总体中抽出 n n n 个独立同分布的样品 X 1 ( 1 ) , X 2 ( 1 ) , ⋯   , X n ( 1 ) ; X 1 ( 2 ) , X 2 ( 2 ) , ⋯   , X n ( 2 ) X_1^{(1)},X_2^{(1)},\cdots,X_n^{(1)};X_1^{(2)},X_2^{(2)},\cdots,X_n^{(2)} X1(1),X2(1),,Xn(1)X1(2),X2(2),,Xn(2)

验证假设
1 ∘ : H 0 : μ 1 − μ 2 = d      H 1 : μ 1 − μ 2 ≠ d 1^{\circ}:H_0:\mu_1-\mu_2=d~~~~H_1:\mu_1-\mu_2\neq d 1:H0:μ1μ2=d    H1:μ1μ2=d
2 ∘ : H 0 : μ 1 − μ 2 ≤ d      H 1 : μ 1 − μ 2 > d 2^{\circ}:H_0:\mu_1-\mu_2\leq d~~~~H_1:\mu_1-\mu_2>d 2:H0:μ1μ2d    H1:μ1μ2>d
3 ∘ : H 0 : μ 1 − μ 2 ≥ d      H 1 : μ 1 − μ 2 < d 3^{\circ}:H_0:\mu_1-\mu_2\geq d~~~~H_1:\mu_1-\mu_2
3:H0:μ1μ2d    H1:μ1μ2<d



对比单边检验,可以看到临界值 C C C 是相同的,以 d 0 = 0 d_0=0 d0=0 为例:

双边检验

返回目录

给 定 显 著 水 平 α , ∵ Z ↑ , H 0 越 难 成 立 , ⇓ 令 : P { Z > C ∣ H 0 } ≤ α   P { X 1 ˉ − X 2 ˉ − d 0 σ 1 2 n 1 + σ 2 2 n 2 > C ∣ d ≤ d 0 } ≤ α ⇓ P { X 1 ˉ − X 2 ˉ − d σ 1 2 n 1 + σ 2 2 n 2 > C + d 0 − d σ 1 2 n 1 + σ 2 2 n 2 ∣ d ≤ d 0 } ⇓ ∵ d 0 − d σ 1 2 n 1 + σ 2 2 n 2 随 着 d ↑ 单 调 递 增   ∴ d = d 0 时 , P { X 1 ˉ − X 2 ˉ − d σ 1 2 n 1 + σ 2 2 n 2 > C + d 0 − d σ 1 2 n 1 + σ 2 2 n 2 ∣ d ≤ d 0 } 最 大 ⇓ 此 时 X 1 ˉ − X 2 ˉ − d σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) ⇓ C = u 1 − α ⇓ 求 得 拒 绝 域 为 Z ∈ ( u 1 − α , + ∞ ) 给定显著水平 \alpha,\because Z\uarr,H_0 越难成立,\\ \Darr \\ 令:P\{ Z>C|H_0\}\leq \alpha \\ ~\\ P\{\frac{\bar{X_1}-\bar{X_2}-d_0} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}>C|d\leq d_0\}\leq \alpha \\ \Darr \\ P\{\frac{\bar{X_1}-\bar{X_2}-d} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}>C+\frac{d_0-d}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}|d\leq d_0\}\\ \Darr\\ \because \frac{d_0-d}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}随着d\uarr 单调递增\\ ~\\ \therefore d=d_0时, P\{\frac{\bar{X_1}-\bar{X_2}-d} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}>C+\frac{d_0-d}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}|d\leq d_0\}最大\\ \Darr\\ 此时\frac{\bar{X_1}-\bar{X_2}-d} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} \sim N(0,1)\\ \Darr\\ C=u_{1-\alpha}\\ \Darr\\ 求得拒绝域为 Z\in(u_{1-\alpha},+\infin) αZ,H0P{
Z>
CH0}α P{
n1σ12+n2σ22
X1ˉX2ˉd0
>
Cdd0}αP{
n1σ12+n2σ22
X1ˉX2ˉd
>
C+n1σ12+n2σ22
d0d
d
d0}n1σ12+n2σ22
d0d
d
 d=d0P{
n1σ12+n2σ22
X1ˉX2ˉd
>
C+n1σ12+n2σ22
d0d
d
d0}n1σ12+n2σ22
X1ˉX2ˉd
N(0,1)C=u1αZ(u1α,+)

U 检验

返回目录

同 2°,可以得出拒绝域为: Z ∈ ( − ∞ , u α ) Z\in(-\infin, u_\alpha) Z(,uα)

在这里插入图片描述
返回目录

附录

中心极限定理

Lindeberg–Lévy 极限定理:


X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,,Xn 是一组独立同分布的随机变量序列,其中
E ( X i ) = μ , V a r ( X i ) = σ 2 E(X_i)=\mu,Var(X_i)=\sigma^2 E(Xi)=μ,Var(Xi)=σ2,则统计量
n ( X i ˉ − μ ) \sqrt{n}(\bar{X_i}-\mu) n
(Xiˉ
μ)

n → ∞ n\to \infin n 时,收敛于正态分布,记为:

n ( X i ˉ − μ ) → p N ( 0 , σ 2 ) \sqrt{n}(\bar{X_i}-\mu) \xrightarrow{p} N(0,\sigma^2) n
(Xiˉ
μ)p
N(0,σ2)


σ > 0 \sigma>0 σ>0 ,则:

lim ⁡ n → ∞ P r [ n ( X ˉ n − μ ) ≤ z ] = lim ⁡ n → ∞ P r [ n ( X ˉ n − μ ) σ ≤ z σ ] = Φ ( z σ ) \lim _{n \rightarrow \infty} \mathcal{P} r\left[\sqrt{n}\left(\bar{X}_{n}-\mu\right) \leq z\right]=\lim _{n \rightarrow \infty} \mathcal{P} r\left[\frac{\sqrt{n}\left(\bar{X}_{n}-\mu\right)}{\sigma} \leq \frac{z}{\sigma}\right]=\Phi\left(\frac{z}{\sigma}\right) nlimPr[n
(Xˉnμ)z]
=
nlimPr[σn
(Xˉnμ)
σz]
=
Φ(σz)

其中 Φ ( z σ ) \Phi(\frac{z}{\sigma}) Φ(σz) 是标准正态分布,在取值为 z / σ z/\sigma z/σ 的概率。

上式告诉我们,在样本容量达到一定数目时,U 检验的检验统计量 Z 是可以视为服从正态分布的。

不仅如此,实际上,样本均值的标准化,都收敛于正态分布。当标准差大于 0 时,可以用正态分布来估计。

返回目录

假设检验一般步骤

  1. 制定原假设、备选假设
  2. 制定检验统计量
  3. 取显著水平 α \alpha α,得出接受域、拒绝域
  4. [取 β \beta β,根据势函数得出 n n n]
  5. 判断检验统计量的观察值,所处的域,决定是否接受原假设

  1. [取 α , β \alpha, \beta α,β,根据势函数得出 n n n]
  2. 根据检验统计量的观察值,求出其 p-值,并据此做出决策

势函数

势函数是包含了所有检验下,犯第一类错误的概率,和识别备选假设的能力。

详见博文:假设检验

返回目录

Technical Note

概念 含义
Z Z-test 的检验统计量
势函数 包含了所有检验下,犯第一类错误的概率,和识别备选假设的能力
位置参数 决定分布位置的参数,如正态分布的均值
i . i . d i.i.d i.i.d 独立同分布

推荐资源

  • 上海市教育委员会,叶慈南,曹伟丽《应用数理统计》,机械工业出版社,2007年1月第一版,第二次印刷(P112~114)
  • 陈希孺 《概率论与数理统计》,中国科学技术大学出版社,2015年8月第一版,第7次印刷(P200~204)
  • 统计王国网站
  • 维基百科——Z检验
  • 统计方案网站

返回目录



版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/202064.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月20日 上午7:58
下一篇 2026年3月20日 上午7:58


相关推荐

  • pycharmjieba库怎么安装_怎么下载jieba库

    pycharmjieba库怎么安装_怎么下载jieba库这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好!这是你第一次使用Markdown编辑器所展示的欢迎页。如果你想学习如何使用Mar

    2022年8月28日
    9
  • 浅谈Spring之@Nullable、@NonNull注解

    浅谈Spring之@Nullable、@NonNull注解NonNull 可以标注在方法 字段 参数之上 表示对应的值不可以为空 Nullable 注解可以标注在方法 字段 参数之上 表示对应的值可以为空以上两个注解在程序运行的过程中不会起任何作用 只会在 IDE 编译器 FindBugs 检查 生成文档的时候有做提示 我使用的 IDE 是 STS 不会做自动的检查 只有安装了 FindBugs 插件并运行后会做对应的提示

    2026年3月17日
    1
  • 转:用C++实现的一种插件体系结构—–概述

    转:用C++实现的一种插件体系结构—–概述

    2021年9月5日
    57
  • C#FindWindowEx参数详解

    C#FindWindowEx参数详解FindWindowEx参数详解本函数的其他内容在网络上都比较多,这里主要说一下它的参数设置和搜索结果的区别。函数功能:在窗口列表中寻找与指定条件相符的第一个子窗口。该函数获得一个窗口的句柄,该窗口的类名和窗口名与给定的字符串相匹配。这个函数查找子窗口,从排在给定的子窗口后面的下一个子窗口开始。在查找时不区分大小写。函数原型:HWNDFindWindowEx(HWNDh

    2022年6月1日
    55
  • SPSS步骤|卡方检验详细操作和结果分析「建议收藏」

    SPSS步骤|卡方检验详细操作和结果分析「建议收藏」​卡方检验是很常用的一种分析方法,什么情况下使用卡方检验?如果你手上的数据是一种定类数据,比如性别(男、女)是否患病(是、否)。你还想要分析定类数据和定类数据之间的差异关系。例如想要分析性别和是否抽烟之间的关系。这一句话里面包含两个词语,分别是:性别,是否抽烟。性别为X,是否抽烟为Y。性别为定类数据,是否抽烟也是定类数据,此时就可以使用卡方检验。这篇文章分享分别使用两种常见统计分析工具SPSS和SPSSAU完成卡方检验。SPSS是目前常用的统计软件,SPSSAU是更简单的在线数据科学分析工具

    2022年5月17日
    124
  • 【随机过程】马氏链的理论与仿真

    【随机过程】马氏链的理论与仿真

    2021年9月3日
    76

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号