《多元统计分析》学习笔记之多元正态分布

《多元统计分析》学习笔记之多元正态分布鄙人笔记 记一些知识点 多元正态分布 1 1 多元分布的基本概念随机变量假定所讨论的是多个变量的总体 所研究的数据是同时观测 p 个指标 即变量 进行了 n 次观测得到的 我们把这 p 个指标表示为 X1 X2 Xp 常用向量 X X1 X2 Xp 表示对同一个体观测的 p 个变量 若观测了 n 个个体 称每一个个体的 p 个变量为一个样品 而全体 n 个样品形成一个样本 分布函数

鄙人笔记,记一些知识点。



多元正态分布

1.1多元分布的基本概念

  • 随机变量

假定所讨论的是多个变量的总体,所研究的数据是同时观测p 个指标(即变量),进行了n 次观测得到的,我们把这p 个指标表示为X1,X2,…,Xp,常用向量X =(X1,X2,…,Xp)′表示对同一个体观测的p 个变量。若观测了n 个个体,称每一个个体的p 个变量为一个样品,而全体n 个样品形成一个样本

  • 分布函数

描述随机变量的最基本工具是分布函数。类似地,描述随机向量的最基本工具还是分布函数。

  • 多元变量的独立性

类似地,若联合分布等于各自分布的乘积,称 p个随机向量 X1,X2,…,Xp相互独立。由X1,X2,…,Xp相互独立可以推知任何 Xi与 Xj( i ≠ j)独立,但是,若已知任何 Xi与 Xj( i ≠ j)独立,并不能推出 X1,X2,…,Xp相互独立。

  • 随机向量的数字特征

1.随机向量x的均值

2.随机向量X的协方差阵

称 ∣ cov( X, X) ∣为 X的广义方差,它是协方差阵的行列式之值。


E(X’AX) = tr(A∑) + μ’Aμ

对于任何随机向量 X=(X1,X2,…,Xp)′来说,其协方差阵 ∑都是对称阵,同时总是非负定(也称半正定)的。大多数情形下是正定的。

  • 随机向量X的相关阵

在数据处理时,为了克服由于指标的量纲不同对统计分析结果带来的影响,往往在使用某种统计分析方法之前,将每个指标“标准化”。标准化数据的协方差阵正好是原指标的相关阵

1.2统计距离

  • 欧氏距离

大部分多元方法是建立在简单的距离概念基础上的,即平时人们熟悉的欧氏距离,或称直线距离。一般,若点P 的坐标P =(x1,x2,…,xp),则它到原点O =(0,0,…,0)的欧氏距离,依勾股定理有:
《多元统计分析》学习笔记之多元正态分布
任意两个点P=(x1,x2,…,xp)与Q=(y1,y2,…,yp)之间的欧氏距离为:
《多元统计分析》学习笔记之多元正态分布


但就大部分统计问题而言,欧氏距离是不能令人满意的。这是因为每个坐标对欧氏距离的贡献是同等的。当坐标轴表示测量值时,它们往往带有大小不等的随机波动,在这种情况下,合理的办法是对坐标加权,使变化较大的坐标比变化小的坐标有较小的权系数,这就产生了各种距离。欧氏距离还有一个缺点,那就是当各个分量为不同性质的量时,“距离”的大小竟然与指标的单位有关。

  • 统计距离

《多元统计分析》学习笔记之多元正态分布

  • 马氏距离
    最常用的一种统计距离是印度统计学家马哈拉诺比斯( Mahalanobis)于 1936年引入的距离,称为“马氏距离”。
    设X,Y是从均值向量为μ,协方差阵为∑的总体G中抽取的两个样品,定义X,Y两点之间的马氏距离为:
    《多元统计分析》学习笔记之多元正态分布
    定义X与总体G的马氏距离为:



《多元统计分析》学习笔记之多元正态分布

  • 基本公理

1.3多元正态分布

  • 多元正态分布是一元正态分布的推广

多元正态分布是一元正态分布的推广。迄今为止,多元分析的主要理论都是建立在多元正态总体基础上的,多元正态分布是多元分析的基础。另一方面,许多实际问题的分布常是多元正态分布或近似正态分布,或虽本身不是正态分布,但它的样本均值近似于多元正态分布。

  • 多元正态分布概率密度函数

若 p元随机向量 X=(x1,x2,…,xp)′的概率密度函数为:
《多元统计分析》学习笔记之多元正态分布

则称 X=( x1,x2,…,xp)′遵从 p元正态分布,也称 X为 p元正态变量,记为:


X~ N
p( μ, ∑)

∣ ∑ ∣为协方差阵 ∑的行列式。

  • 多元正态分布的性质
  • 正态分布的条件分布

设X~Np(μ,∑),p≥2,将X,μ和∑剖分如下:
《多元统计分析》学习笔记之多元正态分布

设 X~ Np( μ, ∑), ∑> 0,则:


(X
(1) ∣ X
(2) )~ N
q( μ
1· 2 , ∑
11· 2

1.5常用分布及抽样分布

  • 统计量
  • Wishart分布

设 X(α) =( X α1, X α2,…, X αp)′( α= 1, 2,…, n)相互独立,且 X(α)~ Np( μ α, ∑),记 X=( X(1), X(2),…, X(n)),则随机矩阵:
《多元统计分析》学习笔记之多元正态分布

所遵从的分布称为自由度为 n的 p维非中心 Wishart分布,记为 W~ Wp( n, ∑, Z)。其中, n ≥ p, ∑> 0
《多元统计分析》学习笔记之多元正态分布

μ αi称为非中心参数,当 μ α= 0时称为中心 Wishart分布,记为 Wp( n, ∑)

  • T2分布

设 W~ Wp( n, ∑), X~ Np( 0, c ∑), c> 0, n ≥ p, ∑> 0, W与 X相互独立,则称随机变量
《多元统计分析》学习笔记之多元正态分布

所遵从的分布称为第一自由度为 p、第二自由度为 n的中心 T2分布,记为 T2~ T2( p, n)

  • 中心 T2分布可化为中心 F分布

中心 T2分布可化为中心 F分布,其关系可表示为:
《多元统计分析》学习笔记之多元正态分布
显然,当 p= 1时,有 T2( 1, n)= F( 1, n)。

  • Wilks分布

F分布能否推广到多元呢?由于 F分布由两个方差比构成,而多元总体 Np( μ, ∑)的变异由协方差阵确定,它不是一个数字,这就产生了如何用与协方差阵 ∑有关的一个量来描述总体 Np( μ, ∑)的变异的问题,它是将 F分布推广到多元情形的关键。

描述 Np( μ, ∑)的变异度的统计参数称为广义方差。围绕这一问题产生了许多方法,有的用行列式,有的用迹,主要的方法有以下几种:
《多元统计分析》学习笔记之多元正态分布
设 W1~ Wp( n1, ∑), W2~ Wp( n2, ∑), ∑> 0, n1> p,且 W1与 W2相互独立,则:
《多元统计分析》学习笔记之多元正态分布
所遵从的分布称为维数为p,第一自由度为n1,第二自由度为n2的Wilks分布,记为ʌ~ʌ(p,n1,n2)。



版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/222833.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月17日 下午2:54
下一篇 2026年3月17日 下午2:55


相关推荐

  • PHPmyadmin安装教程+遇到问题「建议收藏」

    PHPmyadmin安装教程+遇到问题「建议收藏」安装PHPMyAdmin遇到些问题,我的PHP版本是5.6的。开始安装了5.0的phpMyAdmin,报错了。,之后将phpMyAdmin减低到4.4.12版本,成功安装。安装过程遇到个问题【注意】localhost/phpmyadmin,这个访问的时候,localhost后面要加:端口号,不然无法访问一、下载PHPmyadmin打开PHP中文网中的PHPmyadmi…

    2022年5月18日
    43
  • 计算机网络-常见洪水攻击「建议收藏」

    计算机网络-常见洪水攻击「建议收藏」什么是洪水攻击洪水攻击(FLOODATTACK)是指利用计算机网络技术向目标主机发送大量无用的数据报文,使得目标主机忙于处理无用的数据报文而无法提供正常服务的网络行为。主要原理:利用了网络协议中安

    2022年8月6日
    10
  • deepfakes怎么用_如何使用 Deepfakes 换脸(示例代码)

    deepfakes怎么用_如何使用 Deepfakes 换脸(示例代码)如何使用Deepfakes换脸1.获取deepfakes工具包gitclonehttps://github.com/deepfakes/faceswap.git2.补齐依赖包:pipinstalltqdmpipinstallcv2pipinstallopencv-contrib-pythonpipinstalldlibpipinstallkeraspipinstall…

    2022年5月26日
    86
  • 智慧职教云Java题库_云课堂智慧职教java职业证书题库答案

    智慧职教云Java题库_云课堂智慧职教java职业证书题库答案云课堂智慧职教java职业证书题库答案更多相关问题老子说“我有一颗愚人之心”,“若婴儿未孩”。下面哪一个选项最近此义:“大多数人都认为X是真的,所以X是真的。”属于()的论证方式。“大学语文”课程的前身是“大一国文”课程。()权益法下核算的长期股权投资,会导致投资企业投资收益发生增减变动的是( )“大众创业,万众创新”号召是在哪一年提出的?“大弦嘈嘈如急雨,小弦切切如私语。嘈嘈切切错杂弹,大珠小…

    2022年6月12日
    24
  • 爱奇艺vip会员账号共享怎么用_爱奇艺的vip都和谁有合作

    爱奇艺vip会员账号共享怎么用_爱奇艺的vip都和谁有合作之前没事的时候,使用nmap检测到路由器存在弱口令admin今天没事登录路由器看看哪台机器流量比较多,刷新了几次流量统计,发现10.0.0.81的机器一直排的首位,流量蛮大,于是想看看这台机器在干什么打开我的kali系统,启动arpspoof,准备命令arpspoof-ietho-cown-t10.0.0.8110.0.0.1启动Wireshark,设置过滤条件i

    2026年4月17日
    8
  • C语言面试54题

    C语言面试54题C 语言面试 54 题 大家好 这期呢 我们谈一下 c 语言的面试题 第 1 题 c 语言有哪些核心的特征 可移植性很强 模块化能力很强 灵活性很高 加载速度和执行速度都很好 可扩展性很强 第 2 题 c 语言中有哪些基本的数据类型 Int 整型 Float 浮点型 Double 双浮点型 Char 单个字符 void 特殊类型 不包含任何值 第 3 题 解释一下语义错误 在写程序的时候会有很多语义错误 比如说 拼错了命令 一个函数的参数个数错了 数据类型不匹配 等等 第 4 题 C 语言中如何使用增加和减少

    2026年3月18日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号