逻辑回归原理_逻辑回归分析

逻辑回归原理_逻辑回归分析逻辑回归原理

大家好,又见面了,我是你们的朋友全栈君。

来自:刘建平

 

逻辑回归是分类算法,可以处理二元分类和多元分类。

名字里有“回归”二字,但不是回归算法。为什么名字有“回归”这个误导词?因为它的原理有回归模型的影子。

 

1. 从线性回归到逻辑回归

线性回归模型是求Y和X之间的线性关系系数Θ,满足Y= XΘ。此时Y是连续的,所以是回归模型。

想要Y是离散的话,对Y再做一次函数转换,变为g(Y)。如果g(Y)结果类别是两种,就是二元分类模型。

 

2. 二元逻辑回归的模型

对线性回归的结果做函数g的转换,变为逻辑回归。g一般取sigmoid函数:

逻辑回归原理_逻辑回归分析

取sigmoid函数,主要因为两个性质:

  • 当z趋于正无穷时,g(z)趋于1,当z趋于负无穷,g(z)趋于0。
  • (导数性质)逻辑回归原理_逻辑回归分析

令g(z)中的z为:z = ,得到二元逻辑回归模型一般形式:

逻辑回归原理_逻辑回归分析

       其中x为样本输入,hΘ(x)为模型输出,可以是某一分类的概率大小。hΘ(x)和二元分类样本y(假设为0和1)有这样对应关系,如果hΘ(x)>0.5,即xΘ>0,则y为1。如果hΘ(x)<0.5,即xΘ<0,则y为0。y = 0.5是临界情况,此时xΘ=0,无法确定分类。

       hΘ(x)值越小,分类为0的概率越高;值越大,分类为1的概率越高。靠近临界点,分类准确率会下降。

 

模型的矩阵模式

逻辑回归原理_逻辑回归分析

其中hΘ(X)为模型输出,m*1维度。X为样本特征矩阵,为m*n维度。Θ为模型系数,为n*1的向量。

 

3. 二元逻辑回归的损失函数

线性回归是连续的,使用模型误差的平方和来定义损失函数。逻辑回归使用最大似然法定义损失函数。

样本输出是0或1两类,得到:

逻辑回归原理_逻辑回归分析

把两个式子写成一个式子:

逻辑回归原理_逻辑回归分析

其中y的取值是0或者1。

得到y的概率分布函数,就可以用似然函数最大化求解模型系数Θ。为了方便求解,用对数似然函数最大化,对数似然函数取反即为损失函数J(θ)其中,似然函数的代数表达式为:

逻辑回归原理_逻辑回归分析

损失函数表达式:

逻辑回归原理_逻辑回归分析

矩阵形式:

逻辑回归原理_逻辑回归分析

  • 为内积。

 

4. 二元逻辑回归的损失函数的优化方法

损失函数最小化, 最常见的有梯度下降法、坐标轴下降法、等牛顿法。

下面是推到梯度下降法中θ步骤:

逻辑回归原理_逻辑回归分析

 

5. 二元逻辑回归的正则化

逻辑回归也有过拟合问题,需要正则化,常见的L1正则化和L2正则化。

 

L1正则化:

逻辑回归原理_逻辑回归分析

超参数α是惩罚系数,||θ||1为θ的L1范数。

L1正则化损失函数的优化方法常用坐标轴下降法和最小角回归法。

 

L2正则化:

逻辑回归原理_逻辑回归分析

||θ||2为θ的L2范数。

L2正则化损失函数的优化方法和普通的逻辑回归类似(梯度下降法)。

 

6. 二元逻辑回归的推广:多元逻辑回归

 

 

 

 

 

 

 

 

hθ(x)

 

转载于:https://www.cnblogs.com/keye/p/10506641.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/106940.html原文链接:https://javaforall.net

(0)
上一篇 2022年4月21日 下午7:40
下一篇 2022年4月21日 下午7:40


相关推荐

  • MySQL修改表名注释「建议收藏」

    MySQL修改表名注释「建议收藏」MySQL修改表名注释altertabletest1comment’修改后的表的注释’;

    2022年6月1日
    45
  • c++ CreateThread

    c++ CreateThread1.基本使用方式1.1DWORDWINAPI函数名(LPVOIDlpParam);//标准格式DWORDWINAPI函数名(LPVOIDlpParam){return0;}CreateThread(NULL,0,函数名,0,0,0);1.2使用void函数名()此种线程声明方式时,lpStartAddress需要加入LPTHREAD_START_ROUTINE转换void函数名(){return;}CreateThre

    2022年7月21日
    18
  • linux远程桌面方式,Linux 远程桌面的两种方式

    linux远程桌面方式,Linux 远程桌面的两种方式在绝多数情况下 Linux 不需要使用到 GUI 的桌面环境 但是有时在一些特殊的场景如安装 Oracle 的时候 需要有图形界面进行辅助才可以安装 如果要使用 Linux 的图形界面 一般有两种方式 1 Linux 系统安装 XWindows 图形界面 使用 vnc 远程 2 Linux 系统启用 X 协议 配置 XClent 本地有桌面环境的机器 如 Windows 配置 XServer 获取远程的信息 在本地 Xser

    2026年3月19日
    2
  • plsqldev使用指南

    plsqldev使用指南1,登录后默认自动选中MyObjects 默认情况下,PLSQLDeveloper登录后,Brower里会选择Allobjects,如果你登录的用户是dba,要展开tables目录,正常情况都需要Wait几秒钟,而选择MyObjects后响应速率则是以毫秒计算的。 Tools菜单–&gt;ObjectBrowerFilters,会打开BrowerFolders的定单窗口,…

    2022年5月9日
    45
  • Java中finalize()方法的作用

    Java中finalize()方法的作用finalize 方法是 Object 提供的的实例方法 使用规则如下 当对象不再被任何对象引用时 GC 会调用该对象的 finalize 方法 finalize 是 Object 的方法 子类可以覆盖这个方法来做一些系统资源的释放或者数据的清理可以在 finalize 让这个对象再次被引用 避免被 GC 回收 但是最常用的目的还是做 cleanupJava 不保证这个 finalize 一定被执行 但是

    2026年3月17日
    2
  • 闫学灿acwing_二叉树外部路径内部路径

    闫学灿acwing_二叉树外部路径内部路径Ural 大学有 N 名职员,编号为 1∼N。他们的关系就像一棵以校长为根的树,父节点就是子节点的直接上司。每个职员有一个快乐指数,用整数 Hi 给出,其中 1≤i≤N。现在要召开一场周年庆宴会,不过,没有职员愿意和直接上司一起参会。在满足这个条件的前提下,主办方希望邀请一部分职员参会,使得所有参会职员的快乐指数总和最大,求这个最大值。输入格式第一行一个整数 N。接下来 N 行,第 i 行表示 i 号职员的快乐指数 Hi。接下来 N−1 行,每行输入一对整数 L,K,表示 K 是 L 的直接

    2022年8月9日
    12

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号