U 检验

U 检验也叫 Z 检验，指检验统计量服从方差已知的正态分布的假设检验。

U检验/Z检验

单样本 U 检验
双样本 U 检验
附录
Technical Note
推荐资源

思维导图内容

单样本 U 检验

U 检验也叫 Z 检验，定义为：检验的检验统计量 Z 由：
$Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma}$
求出，其中 $n$ 为样本容量， $\mu_0$ 是通过假设知晓的常数， $\sigma$ 为总体的标准差。

中心极限定理：

多个样本和的标准化，在

n\to\infin

的情况下服从正态分布。一般的，当

n > 30

时，可以视为正态分布，采用 U 检验

有精确估计：

很多情况下

\sigma

本质上都是测量而来，是一种精确的估计。因此，若

\sigma

未知，若能够保证精确度，也可以用估计值，样本标准差

S

代替。一般需要

n > 50

。

返回目录

应用条件

根据定义：

$\begin{aligned} && &\textbf{前提}~~:\\ && &~~~~~ 样本 i.i.d，且分布等于总体分布\\ \\ && &1.~~ Z服从正态分布，且分布的 \sigma已知 \\ && &\textbf{或}~~:\\ && &2.~~ 样本容量 n>30，且分布\sigma已知 \\ && &\textbf{或}~~:\\ && &3.~~ 样本容量 n>50 \\ \end{aligned}$

返回目录

应用过程

设总体 X 服从正态分布 $N(\mu,\sigma^2)$ ， $\mu$ 未知， $\sigma$ 已知。现从总体中抽出 $n$ 个 $i . i . d$ 的样品 $X_1,X_2,\cdots,X_n$ ，共同的分布为总体分布。

1°

对于第一种假设，原假设取值为一个点，备选假设取值为两边，这类假设对应的检验，也叫双边检验。根据定义，检验统计量为：
$Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma}$
根据样本的性质，可知 $\bar{X}\sim N(\mu,\frac{\sigma^2}{n})$ ，于是 $Z\sim N(\frac{\sqrt{n}(\mu-\mu_0)}{\sigma},1)$ 。

根据假设检验的一般步骤：
$\alpha，\because |Z|\uarr ,H_0 越难成立，\\ \Darr \\ 令：P\{\vert Z=\frac{\sqrt{n}(\bar{X}-\mu_0)}{\sigma}\vert>C|H_0\}\leq \alpha \\ \\ 在原假设和成立时，\bar{X}\sim N(\mu_0,\sigma^2/n)，Z\sim N(0,1)\\ \Darr\\ C=u_{\alpha/2},u_{1-\alpha/2}\\ \Darr\\ 求得拒绝域为 Z\in(-\infin,u_{\alpha/2})\cup(u_{1-\alpha/2},+\infin)$
故只要求出检验统计量的观察值，根据拒绝域做出判断即可。

注意，检验是否属于双边，不是由拒绝域是否双边决定的，而是由假设决定，下文读者将会体会到其中的差异。

返回目录

2°

返回目录

3°

返回目录

实验设计

在进行采样时，通常需要事前确定 $n$ 。

以 2° 为例，给定显著水平 $\alpha$ ， $\because Z\uarr,H_0$ 越难成立， $\therefore$ 设定检验标准（拒绝）为： $Z > C$ 。

定义势函数为：
$\begin{aligned} p(\mu)&=P\{ Z > C| \mu\in(-\infin,\infin)\} \\ &= P\{ \frac{\sqrt{n}(\bar{X}-\mu)}{\sigma} \geq C+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}| \mu\in(-\infin,\infin)\} \\ \because ~~&\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma} \sim N(0,1)\\ &=1-\Phi(C+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}) \end{aligned}$
取 $\alpha$ ，则根据检验标准的临界值求取法则，有：
$\underset{\mu}{sup} \{1-\Phi(C+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma})|\mu\in(-\infin,\mu_0)\} <= \alpha$
最后得到检验标准的临界值 $C=u_{1-\alpha}$

势函数是 $\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}$ 的函数，且是连续的、非减的。
$\underset{\mu\to\mu_0}{lim} \Phi(u_{1-\alpha}+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma})=\alpha\\ \underset{\mu\to+\infin}{lim} \Phi(u_{1-\alpha}+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma})=1$

设无差别区域为 $\mu\in(\mu_0,\Delta)$ ，则对于 $[\Delta,+\infin]$ ，给定一个 $\beta$ ，使得 $p(\mu)\geq1-\beta$ 。由于势函数是非减的，故问题转换为临界问题：
$\begin{aligned} p(\mu) = 1- \Phi(u_{1-\alpha}+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}) = 1-\beta \\ \Phi(u_{1-\alpha}+\frac{\sqrt{n}(\mu_0-\mu)}{\sigma}) = \beta \end{aligned}$
从而得出适当的 $\sigma$ ，前者对应采样容量，后者是在测量问题上，可考虑提高测量精度。

其中， $\beta$ 是当备选假设成立时，原假设被错误地接受的概率的临界值。

通过 $\beta,\alpha, \Delta$ ，即可知道我们进行试验设计，得出适当的 $n$ 。

返回目录

双样本 U 检验

同单样本 U 检验，其应用条件亦需要 Z 服从正态分布，且分布的方差已知。当然，在大样本情况下，亦可以将 Z 视为正态分布，并用样本方差估计 $\sigma$ 。

返回目录

应用条件

应用过程

设总体 $X_1,X_2$ 服从正态分布 $N(\mu_1,\sigma_1^2),N(\mu_2,\sigma_2^2)$ ， $\mu_1,\mu_2$ 未知， $\sigma_1,\sigma_2$ 已知。现从总体中抽出 $n$ 个独立同分布的样品 $X_1^{(1)},X_2^{(1)},\cdots,X_n^{(1)}；X_1^{(2)},X_2^{(2)},\cdots,X_n^{(2)}$ 。

验证假设：
$1^{\circ}:H_0:\mu_1-\mu_2=d~~~~H_1:\mu_1-\mu_2\neq d$
$2^{\circ}:H_0:\mu_1-\mu_2\leq d~~~~H_1:\mu_1-\mu_2>d$
$3^{\circ}:H_0:\mu_1-\mu_2\geq d~~~~H_1:\mu_1-\mu_2 3∘:H0:μ1−μ2≥d H1:μ1−μ2<d$

1°

对比单边检验，可以看到临界值 $C$ 是相同的，以 $d_0=0$ 为例：

双边检验

返回目录

2°

$\alpha，\because Z\uarr,H_0 越难成立，\\ \Darr \\ 令：P\{ Z>C|H_0\}\leq \alpha \\ ~\\ P\{\frac{\bar{X_1}-\bar{X_2}-d_0} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}>C|d\leq d_0\}\leq \alpha \\ \Darr \\ P\{\frac{\bar{X_1}-\bar{X_2}-d} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}>C+\frac{d_0-d}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}|d\leq d_0\}\\ \Darr\\ \because \frac{d_0-d}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}随着d\uarr 单调递增\\ ~\\ \therefore d=d_0时， P\{\frac{\bar{X_1}-\bar{X_2}-d} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}>C+\frac{d_0-d}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}|d\leq d_0\}最大\\ \Darr\\ 此时\frac{\bar{X_1}-\bar{X_2}-d} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} \sim N(0,1)\\ \Darr\\ C=u_{1-\alpha}\\ \Darr\\ 求得拒绝域为 Z\in(u_{1-\alpha},+\infin)$
U 检验

返回目录

3°

同 2°，可以得出拒绝域为： $Z\in(-\infin, u_\alpha)$

在这里插入图片描述
返回目录

附录

中心极限定理

Lindeberg–Lévy 极限定理：

设

X_1,X_2,\cdots,X_n

是一组独立同分布的随机变量序列，其中

E(X_i)=\mu,Var(X_i)=\sigma^2

，则统计量

\sqrt{n}(\bar{X_i}-\mu)

在

n\to \infin

时，收敛于正态分布，记为：

\sqrt{n}(\bar{X_i}-\mu) \xrightarrow{p} N(0,\sigma^2)

若

\sigma>0

，则：

\lim _{n \rightarrow \infty} \mathcal{P} r\left[\sqrt{n}\left(\bar{X}_{n}-\mu\right) \leq z\right]=\lim _{n \rightarrow \infty} \mathcal{P} r\left[\frac{\sqrt{n}\left(\bar{X}_{n}-\mu\right)}{\sigma} \leq \frac{z}{\sigma}\right]=\Phi\left(\frac{z}{\sigma}\right)

其中

\Phi(\frac{z}{\sigma})

是标准正态分布，在取值为

z/\sigma

的概率。

上式告诉我们，在样本容量达到一定数目时，U 检验的检验统计量 Z 是可以视为服从正态分布的。

不仅如此，实际上，样本均值的标准化，都收敛于正态分布。当标准差大于 0 时，可以用正态分布来估计。

返回目录

假设检验一般步骤

制定原假设、备选假设
制定检验统计量
取显著水平 $\alpha$ ，得出接受域、拒绝域
[取 $\beta$ ，根据势函数得出 $n$ ]
判断检验统计量的观察值，所处的域，决定是否接受原假设

[取 $\alpha, \beta$ ，根据势函数得出 $n$ ]
根据检验统计量的观察值，求出其 p-值，并据此做出决策

势函数

势函数是包含了所有检验下，犯第一类错误的概率，和识别备选假设的能力。

详见博文：假设检验

返回目录

Technical Note

概念	含义
Z	Z-test 的检验统计量
势函数	包含了所有检验下，犯第一类错误的概率，和识别备选假设的能力
位置参数	决定分布位置的参数，如正态分布的均值
$i . i . d$	独立同分布

U检验/Z检验

单样本 U 检验

应用条件

应用过程

1°

2°

3°

实验设计

双样本 U 检验

应用条件

应用过程

1°

2°

3°

附录

中心极限定理

假设检验一般步骤

势函数

Technical Note

推荐资源

关于作者

全栈程序员-站长

发表回复

U 检验

U检验/Z检验

单样本 U 检验

应用条件

应用过程

1°

实验设计

双样本 U 检验

应用条件

应用过程

1°

3°

附录

中心极限定理

假设检验一般步骤

势函数

Technical Note

推荐资源

关于作者

相关推荐

发表回复