U 检验

U 检验假设检验 思维导图 https img blog csdnimg cn 42098 jpeg x oss process image watermark type ZmFuZ3poZW5n shadow 10 text aHR0cHM6Ly9i size 16 color FFFFFF t 70 pic center 文章思维导图 U 检验单总体应用条件 TechnicalNot


U 检验也叫 Z 检验,指检验统计量服从方差已知的正态分布的假设检验。


思维导图内容

单样本 U 检验

U 检验也叫 Z 检验,定义为:检验的检验统计量 Z 由:
Z = n ( X ˉ − μ 0 ) σ Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma} Z=σn
(Xˉμ0)

求出,其中 n n n 为样本容量, μ 0 \mu_0 μ0 是通过假设知晓的常数, σ \sigma σ 为总体的标准差。

中心极限定理

多个样本和的标准化,在
n → ∞ n\to\infin n 的情况下服从正态分布。一般的,当
n > 30 n>30 n>30 时,可以视为正态分布,采用 U 检验

有精确估计:

很多情况下
σ \sigma σ 本质上都是测量而来,是一种精确的估计。因此,若
σ \sigma σ 未知,若能够保证精确度,也可以用估计值,样本标准差
S S S 代替。一般需要
n > 50 n>50 n>50

返回目录

应用条件

根据定义

前提    :       样 本 i . i . d , 且 分 布 等 于 总 体 分 布 1.    Z 服 从 正 态 分 布 , 且 分 布 的 σ 已 知 或    : 2.    样 本 容 量 n > 30 , 且 分 布 σ 已 知 或    : 3.    样 本 容 量 n > 50 \begin{aligned} && &\textbf{前提}~~:\\ && &~~~~~ 样本 i.i.d, 且分布等于总体分布\\ \\ && &1.~~ Z服从正态分布,且分布的 \sigma已知 \\ && &\textbf{或}~~:\\ && &2.~~ 样本容量 n>30,且分布\sigma已知 \\ && &\textbf{或}~~:\\ && &3.~~ 样本容量 n>50 \\ \end{aligned} 前提  :     i.i.d1.  Zσ  :2.  n>30σ  :3.  n>50



返回目录

应用过程

设总体 X 服从正态分布 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2) μ \mu μ 未知, σ \sigma σ 已知。现从总体中抽出 n n n i . i . d i.i.d i.i.d 的样品 X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,,Xn,共同的分布为总体分布。

对于第一种假设,原假设取值为一个点,备选假设取值为两边,这类假设对应的检验,也叫双边检验。根据定义,检验统计量为:
Z = n ( X ˉ − μ 0 ) σ Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma} Z=σn
(Xˉμ0)

根据样本的性质,可知 X ˉ ∼ N ( μ , σ 2 n ) \bar{X}\sim N(\mu,\frac{\sigma^2}{n}) XˉN(μ,nσ2) ,于是 Z ∼ N ( n ( μ − μ 0 ) σ , 1 ) Z\sim N(\frac{\sqrt{n}(\mu-\mu_0)}{\sigma},1) ZN(σn
(μμ0)
,1)


根据假设检验的一般步骤
给 定 显 著 水 平 α , ∵ ∣ Z ∣ ↑ , H 0 越 难 成 立 , ⇓ 令 : P { ∣ Z = n ( X ˉ − μ 0 ) σ ∣ > C ∣ H 0 } ≤ α 在 原 假 设 和 成 立 时 , X ˉ ∼ N ( μ 0 , σ 2 / n ) , Z ∼ N ( 0 , 1 ) ⇓ C = u α / 2 , u 1 − α / 2 ⇓ 求 得 拒 绝 域 为 Z ∈ ( − ∞ , u α / 2 ) ∪ ( u 1 − α / 2 , + ∞ ) 给定显著水平 \alpha,\because |Z|\uarr ,H_0 越难成立,\\ \Darr \\ 令:P\{\vert Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma}\vert>C|H_0\}\leq \alpha \\ \\ 在原假设和成立时,\bar{X}\sim N(\mu_0,\sigma^2/n),Z\sim N(0,1)\\ \Darr\\ C=u_{\alpha/2},u_{1-\alpha/2}\\ \Darr\\ 求得拒绝域为 Z\in(-\infin,u_{\alpha/2})\cup(u_{1-\alpha/2},+\infin) αZ,H0P{
Z=
σn
(Xˉμ0)
>
CH0}αXˉN(μ0,σ2/n)ZN(0,1)C=uα/2,u1α/2Z(,uα/2)(u1α/2,+)

故只要求出检验统计量的观察值,根据拒绝域做出判断即可。

注意,检验是否属于双边,不是由拒绝域是否双边决定的,而是由假设决定,下文读者将会体会到其中的差异。

返回目录

返回目录

返回目录

实验设计

在进行采样时,通常需要事前确定 n n n

为例,给定显著水平 α \alpha α ∵ Z ↑ , H 0 \because Z\uarr,H_0 Z,H0 越难成立, ∴ \therefore 设定检验标准(拒绝)为: Z > C Z>C Z>C

定义势函数为:
p ( μ ) = P { Z > C ∣ μ ∈ ( − ∞ , ∞ ) } = P { n ( X ˉ − μ ) σ ≥ C + n ( μ 0 − μ ) σ ∣ μ ∈ ( − ∞ , ∞ ) } ∵    n ( X ˉ − μ ) σ ∼ N ( 0 , 1 ) = 1 − Φ ( C + n ( μ 0 − μ ) σ ) \begin{aligned} p(\mu)&=P\{ Z > C| \mu\in(-\infin,\infin)\} \\ &= P\{ \frac{\sqrt{n}(\bar{X}-\mu)}{\sigma} \geq C+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}| \mu\in(-\infin,\infin)\} \\ \because ~~&\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma} \sim N(0,1)\\ &=1-\Phi(C+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}) \end{aligned} p(μ)  =P{
Z>Cμ(,)}
=P{
σn
(Xˉμ)
C+σn
(μ0μ)
μ(,)}
σn
(Xˉμ)
N(0,1)
=1Φ(C+σn
(μ0μ)
)

α \alpha α,则根据检验标准的临界值求取法则,有:
s u p μ { 1 − Φ ( C + n ( μ 0 − μ ) σ ) ∣ μ ∈ ( − ∞ , μ 0 ) } < = α \underset{\mu}{sup} \{1-\Phi(C+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma})|\mu\in(-\infin,\mu_0)\} <= \alpha μsup{
1
Φ(C+σn
(μ0μ)
)μ
(,μ0)}<=α

最后得到检验标准的临界值 C = u 1 − α C=u_{1-\alpha} C=u1α



  1. 势函数是 n ( μ 0 − μ ) σ \frac{\sqrt{n}(\mu_0-\mu)}{\sigma} σn
    (μ0μ)
    的函数,且是连续的、非减的。
  2. l i m μ → μ 0 Φ ( u 1 − α + n ( μ 0 − μ ) σ ) = α l i m μ → + ∞ Φ ( u 1 − α + n ( μ 0 − μ ) σ ) = 1 \underset{\mu\to\mu_0}{lim} \Phi(u_{1-\alpha}+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma})=\alpha\\ \underset{\mu\to+\infin}{lim} \Phi(u_{1-\alpha}+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma})=1 μμ0limΦ(u1α+σn
    (μ0μ)
    )=
    αμ+limΦ(u1α+σn
    (μ0μ)
    )=
    1

设无差别区域为 μ ∈ ( μ 0 , Δ ) \mu\in(\mu_0,\Delta) μ(μ0,Δ),则对于 [ Δ , + ∞ ] [\Delta,+\infin] [Δ,+],给定一个 β \beta β,使得 p ( μ ) ≥ 1 − β p(\mu)\geq1-\beta p(μ)1β。由于势函数是非减的,故问题转换为临界问题:
p ( μ ) = 1 − Φ ( u 1 − α + n ( μ 0 − μ ) σ ) = 1 − β Φ ( u 1 − α + n ( μ 0 − μ ) σ ) = β \begin{aligned} p(\mu) = 1- \Phi(u_{1-\alpha}+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}) = 1-\beta \\ \Phi(u_{1-\alpha}+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}) = \beta \end{aligned} p(μ)=1Φ(u1α+σn
(μ0μ)
)=1β
Φ(u1α+σn
(μ0μ)
)=β

从而得出适当的 n , σ n, \sigma n,σ ,前者对应采样容量,后者是在测量问题上,可考虑提高测量精度。

其中, β \beta β 是当备选假设成立时,原假设被错误地接受的概率的临界值。

通过 β , α , Δ \beta,\alpha, \Delta β,α,Δ,即可知道我们进行试验设计,得出适当的 n n n

返回目录

双样本 U 检验

单样本 U 检验,其应用条件亦需要 Z 服从正态分布,且分布的方差已知。当然,在大样本情况下,亦可以将 Z 视为正态分布,并用样本方差估计 σ \sigma σ

返回目录

应用条件

应用条件

应用过程

设总体 X 1 , X 2 X_1,X_2 X1,X2 服从正态分布 N ( μ 1 , σ 1 2 ) , N ( μ 2 , σ 2 2 ) N(\mu_1,\sigma_1^2),N(\mu_2,\sigma_2^2) N(μ1,σ12),N(μ2,σ22) μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2 未知, σ 1 , σ 2 \sigma_1,\sigma_2 σ1,σ2 已知。现从总体中抽出 n n n 个独立同分布的样品 X 1 ( 1 ) , X 2 ( 1 ) , ⋯   , X n ( 1 ) ; X 1 ( 2 ) , X 2 ( 2 ) , ⋯   , X n ( 2 ) X_1^{(1)},X_2^{(1)},\cdots,X_n^{(1)};X_1^{(2)},X_2^{(2)},\cdots,X_n^{(2)} X1(1),X2(1),,Xn(1)X1(2),X2(2),,Xn(2)

验证假设
1 ∘ : H 0 : μ 1 − μ 2 = d      H 1 : μ 1 − μ 2 ≠ d 1^{\circ}:H_0:\mu_1-\mu_2=d~~~~H_1:\mu_1-\mu_2\neq d 1:H0:μ1μ2=d    H1:μ1μ2=d
2 ∘ : H 0 : μ 1 − μ 2 ≤ d      H 1 : μ 1 − μ 2 > d 2^{\circ}:H_0:\mu_1-\mu_2\leq d~~~~H_1:\mu_1-\mu_2>d 2:H0:μ1μ2d    H1:μ1μ2>d
3 ∘ : H 0 : μ 1 − μ 2 ≥ d      H 1 : μ 1 − μ 2 < d 3^{\circ}:H_0:\mu_1-\mu_2\geq d~~~~H_1:\mu_1-\mu_2
3:H0:μ1μ2d    H1:μ1μ2<d



对比单边检验,可以看到临界值 C C C 是相同的,以 d 0 = 0 d_0=0 d0=0 为例:

双边检验

返回目录

给 定 显 著 水 平 α , ∵ Z ↑ , H 0 越 难 成 立 , ⇓ 令 : P { Z > C ∣ H 0 } ≤ α   P { X 1 ˉ − X 2 ˉ − d 0 σ 1 2 n 1 + σ 2 2 n 2 > C ∣ d ≤ d 0 } ≤ α ⇓ P { X 1 ˉ − X 2 ˉ − d σ 1 2 n 1 + σ 2 2 n 2 > C + d 0 − d σ 1 2 n 1 + σ 2 2 n 2 ∣ d ≤ d 0 } ⇓ ∵ d 0 − d σ 1 2 n 1 + σ 2 2 n 2 随 着 d ↑ 单 调 递 增   ∴ d = d 0 时 , P { X 1 ˉ − X 2 ˉ − d σ 1 2 n 1 + σ 2 2 n 2 > C + d 0 − d σ 1 2 n 1 + σ 2 2 n 2 ∣ d ≤ d 0 } 最 大 ⇓ 此 时 X 1 ˉ − X 2 ˉ − d σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) ⇓ C = u 1 − α ⇓ 求 得 拒 绝 域 为 Z ∈ ( u 1 − α , + ∞ ) 给定显著水平 \alpha,\because Z\uarr,H_0 越难成立,\\ \Darr \\ 令:P\{ Z>C|H_0\}\leq \alpha \\ ~\\ P\{\frac{\bar{X_1}-\bar{X_2}-d_0} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}>C|d\leq d_0\}\leq \alpha \\ \Darr \\ P\{\frac{\bar{X_1}-\bar{X_2}-d} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}>C+\frac{d_0-d}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}|d\leq d_0\}\\ \Darr\\ \because \frac{d_0-d}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}随着d\uarr 单调递增\\ ~\\ \therefore d=d_0时, P\{\frac{\bar{X_1}-\bar{X_2}-d} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}>C+\frac{d_0-d}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}|d\leq d_0\}最大\\ \Darr\\ 此时\frac{\bar{X_1}-\bar{X_2}-d} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} \sim N(0,1)\\ \Darr\\ C=u_{1-\alpha}\\ \Darr\\ 求得拒绝域为 Z\in(u_{1-\alpha},+\infin) αZ,H0P{
Z>
CH0}α P{
n1σ12+n2σ22
X1ˉX2ˉd0
>
Cdd0}αP{
n1σ12+n2σ22
X1ˉX2ˉd
>
C+n1σ12+n2σ22
d0d
d
d0}n1σ12+n2σ22
d0d
d
 d=d0P{
n1σ12+n2σ22
X1ˉX2ˉd
>
C+n1σ12+n2σ22
d0d
d
d0}n1σ12+n2σ22
X1ˉX2ˉd
N(0,1)C=u1αZ(u1α,+)

U 检验

返回目录

同 2°,可以得出拒绝域为: Z ∈ ( − ∞ , u α ) Z\in(-\infin, u_\alpha) Z(,uα)

在这里插入图片描述
返回目录

附录

中心极限定理

Lindeberg–Lévy 极限定理:


X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,,Xn 是一组独立同分布的随机变量序列,其中
E ( X i ) = μ , V a r ( X i ) = σ 2 E(X_i)=\mu,Var(X_i)=\sigma^2 E(Xi)=μ,Var(Xi)=σ2,则统计量
n ( X i ˉ − μ ) \sqrt{n}(\bar{X_i}-\mu) n
(Xiˉ
μ)

n → ∞ n\to \infin n 时,收敛于正态分布,记为:

n ( X i ˉ − μ ) → p N ( 0 , σ 2 ) \sqrt{n}(\bar{X_i}-\mu) \xrightarrow{p} N(0,\sigma^2) n
(Xiˉ
μ)p
N(0,σ2)


σ > 0 \sigma>0 σ>0 ,则:

lim ⁡ n → ∞ P r [ n ( X ˉ n − μ ) ≤ z ] = lim ⁡ n → ∞ P r [ n ( X ˉ n − μ ) σ ≤ z σ ] = Φ ( z σ ) \lim _{n \rightarrow \infty} \mathcal{P} r\left[\sqrt{n}\left(\bar{X}_{n}-\mu\right) \leq z\right]=\lim _{n \rightarrow \infty} \mathcal{P} r\left[\frac{\sqrt{n}\left(\bar{X}_{n}-\mu\right)}{\sigma} \leq \frac{z}{\sigma}\right]=\Phi\left(\frac{z}{\sigma}\right) nlimPr[n
(Xˉnμ)z]
=
nlimPr[σn
(Xˉnμ)
σz]
=
Φ(σz)

其中 Φ ( z σ ) \Phi(\frac{z}{\sigma}) Φ(σz) 是标准正态分布,在取值为 z / σ z/\sigma z/σ 的概率。

上式告诉我们,在样本容量达到一定数目时,U 检验的检验统计量 Z 是可以视为服从正态分布的。

不仅如此,实际上,样本均值的标准化,都收敛于正态分布。当标准差大于 0 时,可以用正态分布来估计。

返回目录

假设检验一般步骤

  1. 制定原假设、备选假设
  2. 制定检验统计量
  3. 取显著水平 α \alpha α,得出接受域、拒绝域
  4. [取 β \beta β,根据势函数得出 n n n]
  5. 判断检验统计量的观察值,所处的域,决定是否接受原假设

  1. [取 α , β \alpha, \beta α,β,根据势函数得出 n n n]
  2. 根据检验统计量的观察值,求出其 p-值,并据此做出决策

势函数

势函数是包含了所有检验下,犯第一类错误的概率,和识别备选假设的能力。

详见博文:假设检验

返回目录

Technical Note

概念 含义
Z Z-test 的检验统计量
势函数 包含了所有检验下,犯第一类错误的概率,和识别备选假设的能力
位置参数 决定分布位置的参数,如正态分布的均值
i . i . d i.i.d i.i.d 独立同分布

推荐资源

  • 上海市教育委员会,叶慈南,曹伟丽《应用数理统计》,机械工业出版社,2007年1月第一版,第二次印刷(P112~114)
  • 陈希孺 《概率论与数理统计》,中国科学技术大学出版社,2015年8月第一版,第7次印刷(P200~204)
  • 统计王国网站
  • 维基百科——Z检验
  • 统计方案网站

返回目录



版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/202064.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月20日 上午7:58
下一篇 2026年3月20日 上午7:58


相关推荐

  • 三次样条插值(Cubic Spline Interpolation)及代码实现(C语言)

    三次样条插值(Cubic Spline Interpolation)及代码实现(C语言)样条插值是一种工业设计中常用的 得到平滑曲线的一种插值方法 三次样条又是其中用的较为广泛的一种 本篇介绍力求用容易理解的方式 介绍一下三次样条插值的原理 并附 C 语言的实现代码 1 三次样条曲线原理假设有以下节点 1 1 定义样条曲线是一个分段定义的公式 给定 n 1 个数据点 共有 n 个区间 三次样条方程满足以下条件 a 在每个分段区间 i 0 1

    2026年3月19日
    2
  • java程序员表情包,跳槽大厂必看!

    java程序员表情包,跳槽大厂必看!今年互联网形式依旧严峻 再次爆发几次大规模裁员潮 我决定把这篇文章分享出来帮助那些对前途感到迷茫的朋友 在猎头的眼里 我已不是根正苗红的程序员 何为根正苗红 计算机专业毕业 从毕业起就从事特定方向的开发工作 这才是猎头眼中的香饽饽 毕业之后的那段岁月 可以用悲惨形容 每当和人提起 我总会有点自嘲的说 睡过凌晨一点的办公室 吃过凌晨三点的便利店 做过凌晨五点的首班车 但是回头想想 我却要感谢那不堪的经历 让我找到了适合自己的方向 作为技术人员 我一直有个疑问 什么是你引以为傲的资本 面对已经来临

    2026年3月18日
    4
  • windows live writer 安装配置以及发布文章

    windows live writer 安装配置以及发布文章1 mac 系统下需要安装 vmware windows7 2 下载 windowslivew 3 安装 windowslivew 点击 accept 过几分钟会出现如下页面 点击 install 安装完成后点击 close 4 配置 windowslivew 首先我们进入欢迎界面 因为我们不用 windows

    2026年3月26日
    2
  • 一文读懂如何使用FPGA驱动PHY芯片

    一文读懂如何使用FPGA驱动PHY芯片这里写自定义目录标题如何使用 FPGA 驱动 PHY 芯片前言必要的硬件知识如何确定 PHY 芯片的物理地址和工作模式 如何确定 PHY 芯片的工作模式 如何驱动 PHY 芯片 MDIO 的通讯协议是什么 合理的创建标题 有助于目录的生成如何改变文本的样式插入链接与图片如何使用 FPGA 驱动 PHY 芯片前言笔者因为工作的原因接触到使用 FPGA 驱动 PHY 芯片进行通信 期间接触到了德州仪器的 dp83849 博通公司的 B50610 裕太车通的 YT8512 等芯片 下面以裕太车通的芯片 YT8512 为例来讲解如何使用和驱动 PHY 芯片 必

    2026年3月16日
    2
  • Idea激活码最新教程2023.3.3版本,永久有效激活码,亲测可用,记得收藏

    Idea激活码最新教程2023.3.3版本,永久有效激活码,亲测可用,记得收藏Idea 激活码教程永久有效 2023 3 3 激活码教程 Windows 版永久激活 持续更新 Idea 激活码 2023 3 3 成功激活

    2025年5月27日
    3
  • Jtag引脚定义

    Jtag引脚定义JTAG 主要用于芯片内部测试 现在多数的高级器件都支持 JTAG 协议 如 DSP FPGA 器件等 标准的 JTAG 接口是 4 线 TMS TCK TDI TDO 分别为模式选择 时钟 数据输入和数据输出线 具有 JTAG 口的芯片都有如下 JTAG 引脚定义 TCK 测试时钟输入 TDI 测试数据输入 数据通过 TDI 输入 JTAG 口 TDO 测试数据输出 数据通过 TDO 从 JTAG 口

    2026年3月8日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号