多项logistic回归系数解释_深入解读Logistic回归结果(一):回归系数,OR

多项logistic回归系数解释_深入解读Logistic回归结果(一):回归系数,OR深入解读 Logistic 回归结果 一 回归系数 OR 关键词 Logistic 回归分析 lasso 回归系数解读 回归系数解读 Logistic 回归虽然名字叫 回归 但却是一种分类学习方法 使用场景大概有两个 第一用来预测 第二寻找因变量的影响因素 一从线性回归到 Logistic 回归线性回归和 Logistic 回归都是广义线性模型的特例 假设有一个因变量 y 和一组自变量 x1 x2 x3

深入解读Logistic回归结果(一):回归系数,OR

关键词:Logistic回归分析、lasso回归系数解读、回归系数解读

Logistic回归虽然名字叫”回归” ,但却是一种分类学习方法。使用场景大概有两个:第一用来预测,第二寻找因变量的影响因素。

一 从线性回归到Logistic回归

线性回归和Logistic回归都是广义线性模型的特例。

假设有一个因变量y和一组自变量x1, x2, x3, … , xn,其中y为连续变量,我们可以拟合一个线性方程:

y =β0+β1*x1+β2*x2+β3*x3+…+βn*xn

并通过最小二乘法估计各个β系数的值。

如果y为二分类变量,只能取值0或1,那么线性回归方程就会遇到困难: 方程右侧是一个连续的值,取值为负无穷到正无穷,而左侧只能取值[0,1],无法对应。为了继续使用线性回归的思想,统计学家想到了一个变换方法,就是将方程右边的取值变换为[0,1]。最后选中了Logistic函数:

y = 1 / (1+e-x)

这是一个S型函数,值域为(0,1),能将任何数值映射到(0,1),且具有无限阶可导等优良数学性质。

我们将线性回归方程改写为:

y = 1 / (1+e-z),

其中,z =β0+β1*x1+β2*x2+β3*x3+…+βn*xn

此时方程两边的取值都在0和1之间。

进一步数学变换,可以写为:

Ln(y/(1-y)) =β0+β1*x1+β2*x2+β3*x3+…+βn*xn

Ln(y/(1-y))称为Logit变换。我们再将y视为y取值为1的概率p(y=1),因此,1-y就是y取值为0的概率p(y=0),所以上式改写为:

p(y=1) = ez/(1+ez),

p(y=0) = 1/(1+ez),

其中,z =β0+β1*x1+β2*x2+β3*x3+…+βn*xn.

接下来就可以使用”最大似然法”估计出各个系数β。

二 odds与OR复习

odds: 称为几率、比值、比数,是指某事件发生的可能性(概率)与不发生的可能性(概率)之比。用p表示事件发生的概率,则:odds = p/(1-p)。

OR:比值比,为实验组的事件发生几率(odds1)/对照组的事件发生几率(odds2)。

三 Logistic回归结果的解读

我们用一个例子来说明,这个例子中包含200名学生数据,包括1个自变量和4个自变量:

因变量:  hon,表示学生是否在荣誉班(honors class),1表示是,0表示否;

自变量:

female :性别,分类变量,1=女,0=男

read: 阅读成绩,为连续变量

write: 写作成绩,为连续变量

math:数学成绩,为连续变量

1、不包含任何变量的Logistic回归

首先拟合一个不包含任何变量的Logistic回归,

模型为 ln(p/(1-p) =β0

回归结果如下(结果经过编辑):

hon

系数β

标准误

P

截距

-1.12546

0.164

0.000

这里的系数β就是模型中的β0= -1.12546,

我们用p表示学生在荣誉班的概率,所以有ln(p/(1-p) =β0= -1.12546,

解方程得:p = 0.245。

odds = p/1-p = 0.3245

这里的p是什么意思呢?p就是所有数据中hon=1的概率。

我们来统计一下整个hon的数据:

hon

例数

百分比

0

151

75.5%

1

49

24.5%

hon取值为1的概率p为49/(151+49) = 24.5% = 0.245,我们可以手动计算出ln(p/(1-p) = -1.12546,等于系数β0。可以得出关系:

β0=ln(odds)。

2、包含一个二分类因变量的模型

拟合一个包含二分类因变量female的Logistic回归,

模型为 ln(p/(1-p)  =β0+β1*female.

回归结果如下(结果经过编辑):

hon

系数β

标准误

P

female

0.593

.

0.083

截距

-1.47

.

0.000

在解读这个结果之前,先看一下hon和female的交叉表:

hon

female

Total

Male

Female

0

74

77

151

1

17

32

49

Total

91

109

根据这个交叉表,对于男性(Male),其处在荣誉班级的概率为17/91,处在非荣誉班级的概率为74/91,所以其处在荣誉班级的几率odds1=(17/91)/(74/91) = 17/74 = 0.23;相应的,女性处于荣誉班级的几率odds2 = (32/109)/(77/109)=32/77 = 0.42。女性对男性的几率之比OR = odds2/odds1 = 0.42/0.23 = 1.809。我们可以说,女性比男性在荣誉班的几率高80.9%。

回到Logistic回归结果。截距的系数-1.47是男性odds的对数(因为男性用female=0表示,是对照组),ln(0.23) = -1.47。变量female的系数为0.593,是女性对男性的OR值的对数,ln(1.809) = 0.593。所以我们可以得出关系: OR = exp(β),或者β= ln(OR)(exp(x)函数为指数函数,代表e的x次方)。

3、包含一个连续变量的模型

拟合一个包含连续变量math的Logistic回归,

模型为 ln(p/(1-p)  =β0+β1*math.

回归结果如下(结果经过编辑):

hon

系数β

标准误

P

math

.

.0

0.000

截距

-9.

1.

0.000

这里截距系数的含义是在荣誉班中math成绩为0的odds的对数。我们计算出odds = exp(-9.) = .00005579,是非常小的。因为在我们的数据中,没有math成绩为0的学生,所以这是一个外推出来的假想值。

怎么解释math的系数呢?根据拟合的模型,有:

ln(p/(1-p)) =  – 9.  + .*math

我们先假设math=54,有:

ln(p/(1-p))(math=54) = – 9. + . *54

然后我们把math提高提高一个单位,令math=55,有:

ln(p/(1-p))(math=55) = – 9. + . *55

两者之差:

ln(p/(1-p))(math=55) – ln(p/1-p))(math = 54) = 0..

正好是变量math的系数。

由此我们可以说,math每提高1个单位,odds(即p/(1-p),也即处于荣誉班的几率)的对数增加0.。

那么odds增加多少呢?根据对数公式:

ln(p/(1-p))(math=55) – ln(p/1-p))(math = 54) = ln((p/(1-p)(math=55)/ (p/(1-p)(math=54))) = ln(odds(math=55)/ odds(math=54)) = 0..

所以:

odds(math=55)/ odds(math=54)  =  exp(0.) = 1.169.

因此我们可以说,math每升高一个单位,odds增加16.9%。且与math的所处的绝对值无关。

聪明的读者肯定发现,odds(math=55)/ odds(math=54)不就是OR嘛!

4、包含多个变量的模型(无交互效应)

拟合一个包含female、math、read的Logistic回归,

模型为 ln(p/(1-p) = β0+β1*math+β2*female+β3*read.

回归结果如下(结果经过编辑):

hon

系数β

标准误

P

math

.

0.000

female

0.

0.020

read

.0

0.026

截距

-11.77025

0.000

该结果说明:

(1) 性别:在math和read成绩都相同的条件下,女性(female=1)进入荣誉班的几率(odds)是男性(female=0)的exp(0.) = 2.66倍,或者说,女性的几率比男性高166%。

(2) math成绩:在female和read都相同的条件下,math成绩每提高1,进入荣誉班的几率提高13%(因为exp(0.) = 1.13)。

(3)read的解读类似math。

5、包含交互相应的模型

拟合一个包含female、math和两者交互相应的Logistic回归,

模型为 ln(p/(1-p)  =β0+β1*female+β2*math+β3*female *math.

所谓交互效应,是指一个变量对结果的影响因另一个变量取值的不同而不同。

回归结果如下(结果经过编辑):

hon

系数β

标准误

P

female

-2.

0.349

math

.

0.000

female*math

.0

0.210

截距

-8.

0.000

注意:female*math项的P为0.21,可以认为没有交互相应。但这里我们为了讲解交互效应,暂时忽略P值,姑且认为他们是存在交互效应的。

由于交互效应的存在,我们就不能说在保持math和female*math不变的情况下,female的影响如何如何,因为math和female*math是不可能保持不变的!

对于这种简单的情况,我们可以分别拟合两个方程,

对于男性(female=0):

log(p/(1-p))= β0 + β2*math.

对于女性(female=1):

log(p/(1-p))= (β0 + β1) + (β2 + β3 )*math.

然后分别解释。

注:本文大量参考这篇文章:http://www.ats.ucla.edu/stat/mult_pkg/faq/general/odds_ratio.htm

喜欢 (11)or分享 (0)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/206065.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月19日 下午4:33
下一篇 2026年3月19日 下午4:34


相关推荐

  • js将字符串时间转换为date对象_js转换日期格式

    js将字符串时间转换为date对象_js转换日期格式vars=’2018-10-0910:23:12′;s=s.replace(/-/g,"/");vardate=newDate(s);

    2022年10月3日
    6
  • 世界地图行政区划图_世界行政区划图册

    世界地图行政区划图_世界行政区划图册序号 国家 省 城市 4007 法国 上法兰西大区   4008 法国 上法兰西大区 万格勒 4009 法国 上法兰西大区 乌普利讷 4010 法国 上法兰西大区 于吕什 4011 法国 上法兰西大区 代兰库尔 4012 法国 上法兰西大区 代夫勒 4013 法国 上法兰西大区 伊夫里莱唐普尔 4014 法国 上法兰西大区

    2026年4月16日
    6
  • 字符串如何比较大小

    字符串如何比较大小字符比较 charactercom 是指按照字典次序对单个字符或字符串进行比较大小的操作 一般都是以 ASCII 码值的大小作为字符比较的标准 比较方式 可以使用 String 类的 compareTo 方法来实现 该方法用于判断一个字符串是大于 等于还是小于另一个字符串 返回 int 类型的差值 判断字符串大小的依据是它们在字典中的顺序 实现 Comparable 接口实现 Comparator 接口 Strings1 abc Strings2 efg System o

    2026年3月20日
    2
  • 安卓支持aac编码吗_aac音频格式

    安卓支持aac编码吗_aac音频格式android音频AAC硬编码,完整事例,可用播放器播放收听…

    2022年8月30日
    7
  • shopee东南亚电商ERP系统[通俗易懂]

    shopee东南亚电商ERP系统[通俗易懂]【上马ERP】专注东南亚本地电商市场,对接shopeeLazadatokopediaJD.idBilbilAkulaku等电商平台一套根据东南亚本地电商需求深度订制的ERP/WMS仓储系统!上马特色功能:【自动处理pickupGo-jek,Gosend,Grad订单】【自动打印快递面单】:美观、高效、准确、效率【自动更新平台订单】:结合仓库现有库存,自动更新平台库存,100%防止超卖;【智能化仓库管理】:智能生成拣货清单,高效准确管理仓库;【实时校验订…

    2026年1月30日
    4
  • 背包九讲Java版本

    背包九讲Java版本packagedp;importjava.util.ArrayList;importjava.util.Arrays;importjava.util.List;/***背包九讲**@ProjectName:algorithm*@Package:dp*@Description:TODO*@Author:bipa*@Date:2022/1/88:00*/publicclassPack{/***01背包(

    2022年6月28日
    25

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号