逻辑回归原理_逻辑回归分析

逻辑回归原理_逻辑回归分析逻辑回归原理

大家好,又见面了,我是你们的朋友全栈君。

来自:刘建平

 

逻辑回归是分类算法,可以处理二元分类和多元分类。

名字里有“回归”二字,但不是回归算法。为什么名字有“回归”这个误导词?因为它的原理有回归模型的影子。

 

1. 从线性回归到逻辑回归

线性回归模型是求Y和X之间的线性关系系数Θ,满足Y= XΘ。此时Y是连续的,所以是回归模型。

想要Y是离散的话,对Y再做一次函数转换,变为g(Y)。如果g(Y)结果类别是两种,就是二元分类模型。

 

2. 二元逻辑回归的模型

对线性回归的结果做函数g的转换,变为逻辑回归。g一般取sigmoid函数:

逻辑回归原理_逻辑回归分析

取sigmoid函数,主要因为两个性质:

  • 当z趋于正无穷时,g(z)趋于1,当z趋于负无穷,g(z)趋于0。
  • (导数性质)逻辑回归原理_逻辑回归分析

令g(z)中的z为:z = ,得到二元逻辑回归模型一般形式:

逻辑回归原理_逻辑回归分析

       其中x为样本输入,hΘ(x)为模型输出,可以是某一分类的概率大小。hΘ(x)和二元分类样本y(假设为0和1)有这样对应关系,如果hΘ(x)>0.5,即xΘ>0,则y为1。如果hΘ(x)<0.5,即xΘ<0,则y为0。y = 0.5是临界情况,此时xΘ=0,无法确定分类。

       hΘ(x)值越小,分类为0的概率越高;值越大,分类为1的概率越高。靠近临界点,分类准确率会下降。

 

模型的矩阵模式

逻辑回归原理_逻辑回归分析

其中hΘ(X)为模型输出,m*1维度。X为样本特征矩阵,为m*n维度。Θ为模型系数,为n*1的向量。

 

3. 二元逻辑回归的损失函数

线性回归是连续的,使用模型误差的平方和来定义损失函数。逻辑回归使用最大似然法定义损失函数。

样本输出是0或1两类,得到:

逻辑回归原理_逻辑回归分析

把两个式子写成一个式子:

逻辑回归原理_逻辑回归分析

其中y的取值是0或者1。

得到y的概率分布函数,就可以用似然函数最大化求解模型系数Θ。为了方便求解,用对数似然函数最大化,对数似然函数取反即为损失函数J(θ)其中,似然函数的代数表达式为:

逻辑回归原理_逻辑回归分析

损失函数表达式:

逻辑回归原理_逻辑回归分析

矩阵形式:

逻辑回归原理_逻辑回归分析

  • 为内积。

 

4. 二元逻辑回归的损失函数的优化方法

损失函数最小化, 最常见的有梯度下降法、坐标轴下降法、等牛顿法。

下面是推到梯度下降法中θ步骤:

逻辑回归原理_逻辑回归分析

 

5. 二元逻辑回归的正则化

逻辑回归也有过拟合问题,需要正则化,常见的L1正则化和L2正则化。

 

L1正则化:

逻辑回归原理_逻辑回归分析

超参数α是惩罚系数,||θ||1为θ的L1范数。

L1正则化损失函数的优化方法常用坐标轴下降法和最小角回归法。

 

L2正则化:

逻辑回归原理_逻辑回归分析

||θ||2为θ的L2范数。

L2正则化损失函数的优化方法和普通的逻辑回归类似(梯度下降法)。

 

6. 二元逻辑回归的推广:多元逻辑回归

 

 

 

 

 

 

 

 

hθ(x)

 

转载于:https://www.cnblogs.com/keye/p/10506641.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/106940.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • spss交叉表分析 + SPSS卡方检验

    spss交叉表分析 + SPSS卡方检验spss中交叉分析主要用来检验两个变量之间是否存在关系,或者说是否独立,其零假设为两个变量之间没有关系。在实际工作中,经常用交叉表来分析比例是否相等。例如分析不同的性别对不同的报纸的选择有什么不同。spss交叉表分析方法与步骤: 1、在spss中打开数据,然后依次打开:analyze–descriptive–crosstabs,打开交叉表对话框 2、将性别放到行列表,将

    2022年5月16日
    202
  • 三种主流芯片架构简单比较[通俗易懂]

    三种主流芯片架构简单比较[通俗易懂]来源:https://blog.csdn.net/weixin_39752599/article/details/78664055可以参照的信息:https://blog.csdn.net/shenghuaDay/article/details/78747561三种主流芯片架构  1. ARM ARM是高级精简指令集的简称(AdvancedRISCMachine),它是一个32位的精简…

    2022年9月6日
    2
  • mui的时间控件 picker

    mui的时间控件 pickerhtml,body,.mui-content{height:0px;margin:0px;background-color:#efeff4;}h5.mui-content-padded{margin-left:3px;margin-top:20px!important;}h5.mui-content-padded:first-child

    2022年5月23日
    29
  • 使用微软官方工具下载安装Windows10系统

    使用微软官方工具下载安装Windows10系统准备安装盘首先准备一个8G以上容量的U盘,并从微软官网下载Windows10下载工具:https://www.microsoft.com/zh-cn/software-download/windows10注意在执行下面操作之前备份好您U盘上的数据,因为下面的操作会清空该U盘上的所有数据。制作过程双击打开下载到的MediaCreationTool1809.exe文件,弹出Wi…

    2022年5月20日
    27
  • java如何运行_如何运行java程序[通俗易懂]

    java如何运行_如何运行java程序[通俗易懂]我们在编写Java程序以后都会在集成开发环境中运行程序,那么该如何的在命令行中运行Java程序呢?下面动力节点java学院小编为大家介绍如何运行java程序?java程序的运行步骤1、首先我们在命令行运行Java程序需要借助jdk的环境依赖,打开jdk包,需要找到javac和java两个文件,如下图所示2、接下来我们需要打开运行窗口,然后在运行窗口中输入cmd命令,如下图所示3、在CMD命令行界面…

    2022年7月8日
    22
  • java数据导出为excel表格_将数据库表中数据导出到文本文件

    java数据导出为excel表格_将数据库表中数据导出到文本文件公司开发新系统,需要创建几百个数据库表,建表的规则已经写好放到Excel中,如果手动创建的话需要占用较长的时间去做,而且字段类型的规则又被放到了另一张表,如果手动去一个一个去匹配就很麻烦,所以我先把两张表都导入数据库中,建表的数据如下:其中字段类型被存放到了另一个表中,根据字段的code从另一表去取字段类型:然后通过java程序的方式,从数据库中取出数据自动生成建表语句,代码如下:(主要是提供思路,对于不同的建表规则不能完全适用,SQL语句为oracle数据库SQL语句)importjava.i

    2022年9月8日
    0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号