logistic回归分析优点_二元Logistic回归

logistic回归分析优点_二元Logistic回归点击上方蓝字关注我们在社会科学的研究中 经常会遇到二元变量的情况 例如死亡或未死亡 购买或未购买等 对于二元变量 无法直接采用一般的多元线性模型无法进行回归分析 因为残差不满足正态性 无偏性 共方差性等假设 同时解释变量的取值范围不再是 如果希望根据一系列预测变量的值来预测某种特征或结果是否存在 且因变量为二元变量 通常采用二元 Logistic 回归 1 二元逻辑回归分析的原理与

f6e918aaa3ca09397455f597850de151.png

点击上方蓝字关注我们

在社会科学的研究中,经常会遇到二元变量的情况,例如死亡或未死亡、购买或未购买等,对于二元变量,无法直接采用一般的多元线性模型无法进行回归分析,因为残差不满足正态性、无偏性、共方差性等假设,同时解释变量的取值范围不再是-∞~+∞。如果希望根据一系列预测变量的值来预测某种特征或结果是否存在,且因变量为二元变量,通常采用二元Logistic回归。

1 二元逻辑回归分析的原理 与线性回归模型一样,二元逻辑回归模型也需要对模型进行检验和评价,同样分为对回归方程整体的显著性检验、回归系数的显著性检验和模型拟合优度评价。 1.回归方程整体显著性检验 与一般的线性模型一样,二元逻辑回归方程的显著性检验用于检验In 16b9cee2e2d0c7d19b7746173c4258ea.png 与所有变量之间的线性关系是否显著,检验的原假设是各回归系数同时为零,备选假设为各回归系数不同时为零。 常用的检验方法有对数似然比检验和Hosmer-Lemeshow检验。 2.回归系数的显著性检验 与一般线性回归模型一样,还需要对每个回归系数的显著性进行检验。但是,在二元逻辑回归模型中,回归系数显著性检验不是通过T检验,而是构造Wald统计量来进行,Wald 统计量和似然统计量都是极大似然估计方法中常用的检验统计量。 3.模型拟合优度评价 二元逻辑回归模型拟合优度评价的常用统计量包括Cox-Snell R方 统计量和Nagelkerke  R方 统计量。 2 二元Logistic回归的SPSS实现 “data 09.sav”数据文件是一些肿瘤患者的基本资料。现要求利用通过年龄、肿瘤大小和扩散等级来拟合癌变部位的淋巴结是否含有癌细胞的二元Logistic回归方程。 1.打开 “data 09.sav” 数据文件,选择“分析”—“回归”—“二元Logistic”,弹出如下图所示“Logistic回归”对话框,在左侧的变量列表中选中“癌变部位的淋巴结是否含有癌细胞”,将其选入“因变量列表”,将“年龄”、“肿瘤大小(厘米)”、“扩散等级”变量选入右边的“协变量列表”,“方法”选择系统默认的“输入”。

3c49e327e2956a09cbdc678299a39bb7.png

2.单击【分类】按钮,弹出如下图所示的“Logistic回归: 定义分类变量”对话框,将“扩散等级”变量选入分类协变量列表,对比方法选择系统默认的指示灯。 单击【继续】按钮返回主对话框。

bc33e9467a014f499d37c302eee65af6.png

3.单击“保存”按钮,弹出如下图所示的“Logistic回归: 保存”按钮。 在“预测值”栏中勾选“概率”和“组成员”复选框,在“影响”栏中勾选“杠杆值”复选框,在“残差”栏中勾选“标准化”复选框,并勾选“包含协方差矩阵”复选框。 单击【继续】按钮返回主对话框。

25131bdc6aa8ad783923a8c7843a2b9f.png

4.单击【选项】按钮,弹出如下图所示的“Logistic回归: 选项”对话框。 在“统计和图”栏中勾选“分类图”、“Hosmer-Lemeshow拟合度”、“exp(B)的CI”,其他为系统默认。 单击【继续】按钮返回主对话框。

5efb0559ccb7d5cdd31f6dacb5b9d893.png

5.完成所有设置后,单击【确定】按钮执行命令。 3 二元Logistic回归的结果分析 1.从表1中可以看出参与分析的个案为978,无缺失值。

5333502ad23860b65ccde39c9a1d2760.png

2.表2为因变量变量的编码。 表3为自变量中的分类变量根据指示变量编码方案所生成的新变量。 新变量的变量名称为扩散等级(1)何扩散等级(2)。

6aa38dea83c38ec62b30412c6326c7ba.png

3.表4是拟合开始前模型外变量的卡方检验,所有变量的显著性均小于0.05,整体的显著性也小于0.05,整体的显著性也小于0.05,所以,所有变量进入模型都是有意义的。

cfb32e94d2e699b7077ec956ab63ae95.png

4.表5是3种常用的卡方统计量,因拟合方法选择的是输入,所以一步就完成了模型的拟合,所以,步长、块和模型的卡方值都相同,显著性小于0.05,说明解释变量的全体与Logit P之间的线性关系显著,采用此模型是合理的。

9661bc3d5e1ab39cca61fbf7406c4784.png

5.表6是模型拟合优度统计量,表中的-2对数似然值为838.913,值较大,说明模型拟合效果不是很好,Cox&snell R平方和Nagelkerke R 平方值分别为0.087和0.142,值较小,说明模型方程能解释的回归变异很小,模型拟合不理想。

8a866a2c1169ea982ef057db3fafe91f.png

6.表7给出了Hosmer和Lemeshow检验的统计量,显著性小于0.05,所以拒绝零假设,表示方程拟合效果不理想。

245269e5446d9af966592b84082acaea.png

7.表8是Hosmer和Lemeshow检验的列联表,根据预测概率,将数据分为10组,第2行和第3行是“癌变部位的淋巴结是否含有癌细胞=无”的观测值和期望值,第4行和第5行是“癌变部位的淋巴结是否含有癌细胞=有”的观测值和期望值,可见各行的观测值和期望值存在一定的差异,说明模型拟合效果不理想。

38c8d033e0f75a49ab75de4b1da37c95.png

8.表9是观测值和预测值的分类表,从表中可以看出798名癌变部位的淋巴结没有癌细胞的患者被准确预测,正确率只有97.9.0%,但是只有16名癌变部位的淋巴结含有癌变细胞的患者被准确预测,正确率只有9.0%,总的正确率为81.7%,说明预测效果不理想。

60bd36947b2e3334af9a4c933714d973.png

9.表10给出了各变量的系数(B),可以写出方程: Z=1.116*肿瘤大小(厘米)+2.953*肿瘤扩散等级(1)+2.026*肿瘤扩散等级(2)-5.714 得出估计淋巴结中是否含有癌细胞的概率为:

90243928b93bf780f28ff81fc93d2fb8.png

 后台回复【二元Logistic回归】获取案例中的数据。

86093060e82a44a34ef0ab6b71a84808.png

参考资料:

李昕,张明明.SPSS 22.0统计分析[M].北京:电子工业出版社,2015.

12ed731d060bc7e6bade28a5d5c46ca4.png图文:郭鑫排版:郭鑫

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/214277.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月18日 下午4:38
下一篇 2026年3月18日 下午4:38


相关推荐

  • 独家!字节即梦海外版APP“Dreamina AI”

    独家!字节即梦海外版APP“Dreamina AI”

    2026年3月12日
    3
  • system函数,WIFEXITED和WEXITSTATUS

    system函数,WIFEXITED和WEXITSTATUS1,在程序中,用exit来设置进程的退出值时,虽然该函数的参数类型为int型,但再父进程中只能取到其值的低8位.所以用exit返回值时,高于255的值是没有意义的.2,对于system函数,返回值是由两部分组成的,低8位值表示所执行的脚本在执行过程中所接收到的信号值,其余的位表示的脚本exit退出时所设置的值,即脚本内exit退出是的值的低8位,在system返回值的低9-1

    2025年6月21日
    7
  • Qt Quick中的信号与槽

    在QML中,在QtQuick中,要想妥善地处理各种事件,肯定离不开信号与槽,本博的主要内容就是整理Qt中的信号与槽的内容。1.链接QML类型的已知信号QML中已有类型定义的信号分为两类:一类

    2021年12月29日
    47
  • 自定义手机壁纸_ios怎么自定义动态壁纸

    自定义手机壁纸_ios怎么自定义动态壁纸拥有Android智能手机的主要好处之一就是自定义。有了足够的专业知识,您可以对它的几乎所有方面进行自定义9。值得扎根的Android惊人的定制9值得扎根的Android惊人的定制让您的设备扎根了吗?看完所有这些很棒的仅根定制之后,您可能会改变主意。阅读更多内容,但首先应该开始,是否打算建立根目录。什么是自定义ROM?了解AndroidLingo根源是什么?什么是自定义ROM?学习Android…

    2025年8月20日
    7
  • echarts饼图不显示数据为0的数据

    echarts饼图不显示数据为0的数据echarts 饼图不显示数据为 0 的数据 测试可用 希望对有相关问题的人有所帮助

    2026年3月18日
    2
  • topic:开发人员眼中的RIA,基于Flash实现

    topic:开发人员眼中的RIA,基于Flash实现本文镜像自作者 Blog http www csksoft net blog post ria on flash html nbsp 前不久因为不少朋友对这个主题感兴趣 就在公司组里做了这个 topic 主要从软件开发人员的角度来介绍 flash 的最新技术以及当今一些新兴的 RIA 应用 整个 topic 主要分为下面几个部分 1 RIA 的介绍 当前状况 2 Flash 的起源 内部运作模式

    2026年3月26日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号