偏最小二乘法

偏最小二乘法偏最小二乘回归是一种新型的多元统计数据分析方法,它与1983年由伍德和阿巴诺等人首次提出。近十年来,它在理论、方法和应用方面都得到了迅速的发展。密西根大学的弗耐尔教授称偏最小二乘回归为第二代回归分析方法。偏最小二乘回归方法在统计应用中的重要性主要的有以下几个方面:(1)偏最小二乘回归是一种多因变量对多自变量的回归建模方法。(2)偏最小二乘回归可以较好地解决许多以往用普通多元回归无法解决

大家好,又见面了,我是你们的朋友全栈君。

                                                       

      偏最小二乘回归是一种新型的多元统计数据分析方法,它与1983年由伍德和阿巴诺等人首次提出。近十年来,它在理论、方法和应用方面都得到了迅速的发展。密西根大学的弗耐尔教授称偏最小二乘回归为第二代回归分析方法。

偏最小二乘回归方法在统计应用中的重要性主要的有以下几个方面:

(1)偏最小二乘回归是一种多因变量对多自变量的回归建模方法。

(2)偏最小二乘回归可以较好地解决许多以往用普通多元回归无法解决的问题。在普通多元线形回归的应用中,我们常受到许多限制。最典型的问题就是自变量之间的多重相关性。如果采用普通的最小二乘方法,这种变量多重相关性就会严重危害参数估计,扩大模型误差,并破坏模型的稳定性。变量多重相关问题十分复杂,长期以来在理论和方法上都未给出满意的答案,这一直困扰着从事实际系统分析的工作人员。在偏最小二乘回归中开辟了一种有效的技术途径,它利用对系统中的数据信息进行分解和筛选的方式,提取对因变量的解释性最强的综合变量,辨识系统中的信息与噪声,从而更好地克服变量多重相关性在系统建模中的不良作用。

(3)偏最小二乘回归之所以被称为第二代回归方法,还由于它可以实现多种数据分析方法的综合应用。

 

偏最小二乘回归=多元线性回归分析+典型相关分析+主成分分析

 

由于偏最小二乘回归在建模的同时实现了数据结构的简化,因此,可以在二维平面图上对多维数据的特性进行观察,这使得偏最小二乘回归分析的图形功能十分强大。在一次偏最小二乘回归分析计算后,不但可以得到多因变量对多自变量的回归模型,而且可以在平面图上直接观察两组变量之间的相关关系,以及观察样本点间的相似性结构。这种高维数据多个层面的可视见性,可以使数据系统的分析内容更加丰富,同时又可以对所建立的回归模型给予许多更详细深入的实际解释。

一、 偏最小二乘回归的建模策略\原理\方法

1.1建模原理

设有 q个因变量{}和p自变量{}。为了研究因变量和自变量的统计关系,我们观测了n个样本点,由此构成了自变量与因变量的数据表X={}和.Y={}。偏最小二乘回归分别在X与Y中提取出成分 和 (也就是说, 是 的线形组合, 是 的线形组合).在提取这两个成分时,为了回归分析的需要,有下列两个要求:

(1)和应尽可能大地携带他们各自数据表中的变异信息;

(2)与 的相关程度能够达到最大。

这两个要求表明,和 应尽可能好的代表数据表X和Y,同时自变量的成分  对因变量的成分 又有最强的解释能力。

在第一个成分和 被提取后,偏最小二乘回归分别实施X 对 的回归以及 Y对 的回归。如果回归方程已经达到满意的精度,则算法终止;否则,将利用 X被解释后的残余信息以及Y 被 解释后的残余信息进行第二轮的成分提取。如此往复,直到能达到一个较满意的精度为止。若最终对 X共提取了 m个成分,…,,偏最小二乘回归将通过实施 对,…,, 的回归,然后再表达成关于原变量,…,, 的回归方程,k=1,2,…,q 。

 

1.2计算方法推导

为了数学推导方便起见,首先将数据做标准化处理。X 经标准化处理后的数据矩阵记为=(,…,),经标准化处理后的数据矩阵记为=(,…,)。

第一步  记t1是E0的第一个成分,t2是E1的第一个轴,它是一个单位向量,既||w1||=1。

记u1是F0的第一个成分,u1=F0C1。C1 是F0的第一个轴,并且||C1||=1。

如果要,能分别很好的代表XY中的数据变异信息,根据主成分分析原理,应该有

Var()-max

Var()-max

另一方面,由于回归建模的需要,又要求对有很大的解释能力,有典型相关分析的思路,与的相关度应达到最大值,既

r(t1,u1)max

因此,综合起来,在偏最小二乘回归中,我们要求与的协方差达到最大,既

                                                                                                                                 偏最小二乘法

正规的数学表述应该是求解下列优化问题,既 

偏最小二乘法

因此,将在||||=1和||||=1的约束条件下,去求()的最大值。

偏最小二乘法

                                         偏最小二乘法

偏最小二乘法 

可见,是矩阵的特征向量,对应的特征值为.是目标函数值,它要求取最大值,所以, 是对应于矩阵最大特征值的单位特征向量.而另一方面, 是对应于矩阵最大特征值的单位特征向量.

求得轴和后,即可得到成分

              偏最小二乘法          

                       

                   偏最小二乘法

   偏最小二乘法

偏最小二乘法

1.3交叉有效性

可以百度PRESS预测误差平方和,这个用的比较多

偏最小二乘法

来源网络整理


版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/145726.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • VUE中clearTimeout失效问题

    VUE中clearTimeout失效问题研究了很久以为是自己代码的问题结果是 VUE 封装了 setTimeout 在 VUE 中 setTimeout 返回一个对象 对象含有 id 属性 将 id 作为参数执行 clearTimeout 即可生效 格式类似 clearTimeout this timer id

    2025年11月25日
    4
  • 纯css3艺术文字样式效果代码

    效果:http://hovertree.com/texiao/css3/1/本效果主要使用text-shadow实现.参考:http://hovertree.com/h/bjaf/css3_text_

    2021年12月21日
    42
  • realsense深度图像保存方法[通俗易懂]

    realsense深度图像保存方法[通俗易懂]一般使用realsense时会保存视频序列,当保存深度图像时,需要注意保存的图像矩阵的格式,不然可能造成深度值的丢失。在众多图像库中,一般会使用opencv中的imwrite()函数进行深度图像的保存。一般深度图像中深度值的单位是mm,因此一般使用np.uint16作为最终数据格式保存。例子:importnumpyasnpimportcv2deffun1(…

    2022年4月25日
    34
  • 机器学习 F1-Score, recall, precision

    机器学习 F1-Score, recall, precision在机器学习,模式识别中,我们做分类的时候,会用到一些指标来评判算法的优劣,最常用的就是识别率,简单来说,就是acc=Npre/Ntotalacc=N_{pre}/N_{total}这里的NpreN_{pre}表示预测对的样本数,NtotalN_{total}表示测试集总的样本数。识别率有的时候过于简单,不能全面反应算法的性能,除了识别率,还有一些常用的指标,就是我们要介绍的

    2022年10月11日
    5
  • android之R cannot be resolved to a variable

    刚才又遇到了R cannot be resolved to a variable的问题,就翻了翻网上的资料,调理的整理了一下1. 检查Android 的SDK是否丢失需要重新下载,检查build path,把需要导入的JAR包确认都导入成功2. 确保class没有import Android.R,注意是不能有Android.R,可以有其他R文件,比如你自己的包;3. 错误cla

    2022年3月9日
    64
  • 推荐系统在直播场景的应用(花椒直播)

    推荐系统在直播场景的应用(花椒直播)推荐系统 帮助用户发现内容 克服信息过载通过分析用户行为 对用户兴趣建模 预测用户的兴趣早期 基于热度推荐 热度高的一般质量有保证 但是集中在头部 难以千人千面现代化推荐系统全样本 生成粗排序 百万 再生成精致排序 几百个 在推荐给用户 10 量级 召回与排序 召回基于邻域的协同过滤 1 计算用户与物品的相似度矩阵 2 计算出用户对缺失物品的得分早期使用 基于主播的协同过滤由于是 n

    2026年1月22日
    1

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号