逻辑回归算法原理_人工智能回归算法

逻辑回归算法原理_人工智能回归算法http://ihoge.cn/2018/LR.html逻辑回归模型逻辑回归也被称为对数几率回归,算法名虽然叫做逻辑回归,但是该算法是分类算法,个人认为这是因为逻辑回归用了和回归类似的方法来解决了分类问题。逻辑回归模型是一种分类模型,用条件概率分布的形式表示P(Y|X)P(Y|X)P(Y|X),这里随机变量X取值为n维实数向量,例如x=(x(1),x(2),…,x(n))…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

http://ihoge.cn/2018/LR.html

逻辑回归模型

逻辑回归也被称为对数几率回归,算法名虽然叫做逻辑回归,但是该算法是分类算法,个人认为这是因为逻辑回归用了和回归类似的方法来解决了分类问题。

逻辑回归模型是一种分类模型,用条件概率分布的形式表示 P(Y|X) P ( Y | X ) ,这里随机变量 X 取值为 n 维实数向量,例如 x=(x(1),x(2),...,x(n)) x = ( x ( 1 ) , x ( 2 ) , . . . , x ( n ) ) ,Y 取值为 0 或 1。即:

P(Y=1|x)=exp(wx+b)1+exp(wx+b) P ( Y = 1 | x ) = exp ⁡ ( w ⋅ x + b ) 1 + exp ⁡ ( w ⋅ x + b )

P(Y=0|0)=11+exp(wx+b) P ( Y = 0 | 0 ) = 1 1 + exp ⁡ ( w ⋅ x + b )

或:

ϕ(x)=11+ewTxb ϕ ( x ) = 1 1 + e − w T x − b

假设有一个二分类问题,输出为 y{
0,1}
y ∈ { 0 , 1 }
,二线性回归模型 z=wTx+b z = w T x + b 是个实数值,我们希望有一个理想的阶跃函数来帮我什么实现z值到0/1值的转化,于是找到了Sigmoid函数来代替:

g(z)=11+ez g ( z ) = 1 1 + e − z




逻辑回归算法原理_人工智能回归算法

有了 Sigmoid 函数之后,由于其值取值范围在[0,1]。就可以将其视为类 1 的后验概率估计 p(y=1|X) p ( y = 1 | X ) 。说白了,就是如果有了一个测试点 x,那么就可以用Sigmoid函数算出来的结果当作该点 x 属于类别 1 的概率大小。

于是,非常自然地,我们把 Sigmoid 函数计算得到的值大于等于0.5的归为类别1,小于0.5的归为类别0:

逻辑函数的损失函数

接下来要做的就是根据给定的训练集,把参数 w 给求出来了。要找参数 w,首先就得把代价函数(Cost Function)给定义出来,也就是目标函数。

我们第一个想到的自然是模仿线性回归的做法,利用误差平方和来当代价函数:

J(θ)=12mi=0m(ϕ(xi)yi)2 J ( θ ) = 1 2 m ∑ i = 0 m ( ϕ ( x i ) − y i ) 2



这时将预测函数

g(z(i))=11+ex(i) g ( z ( i ) ) = 1 1 + e − x ( i )
代入损失函数的话,会发现这是一个非凸函数,这意味着代价函数有着许多的局部最小值,这不利于我们求解:

逻辑回归算法原理_人工智能回归算法
那么我们不妨来换一个思路解决这个问题。前面,我们提到了 ϕ(z) 可以视为类1的后验估计,所以我们有:
逻辑回归算法原理_人工智能回归算法
其中 p(y=1|x;w) p ( y = 1 | x ; w ) 表示给定 w,那么 x 点 y=1 的概率大小。于是上面两式可以写成一般形式:
逻辑回归算法原理_人工智能回归算法

注:以上的过程说明,最大似然估计与误差平方和等价!这就是为什么逻辑回归的损失函数可以用最大似然函数进行估计的原因。

接下来我们就要用极大似然估计来根据给定的训练集估计出参数 w:
逻辑回归算法原理_人工智能回归算法
为了简化运算,我们对上面这个等式的两边都取一个对数:
逻辑回归算法原理_人工智能回归算法
我们现在要求的是使得 l(w) 最大的 w。没错,我们的代价函数出现了,我们在 l(w) 前面加个负号不就变成就最小了吗?不就变成我们代价函数了吗?
逻辑回归算法原理_人工智能回归算法
为了更好地理解这个代价函数,我们不妨拿一个例子的来看看:
逻辑回归算法原理_人工智能回归算法
也就是说:
逻辑回归算法原理_人工智能回归算法
下面是函数图:
逻辑回归算法原理_人工智能回归算法
从图中不难看出,如果样本的值是1的话,估计值 ϕ(z) 越接近1付出的代价就越小,反之越大;同理,如果样本的值是0的话,估计值 ϕ(z) 越接近0付出的代价就越小,反之越大。

逻辑回归的模型求解

在开始梯度下降之前,要这里插一句,Sigmoid function 有一个很好的性质就是 :

ϕ(z)=ϕ(z)(1ϕ(z)) ϕ ′ ( z ) = ϕ ( z ) ( 1 − ϕ ( z ) )



这个后续会用到。

还有,我们要明确一点,梯度的负方向就是代价函数下降最快的方向:这里来解释下。借助泰勒公式展开,有:
逻辑回归算法原理_人工智能回归算法
其中,f′(x) 和 δ 为向量,那么这两者的内积就等于:
逻辑回归算法原理_人工智能回归算法
当 θ=π 时,也就是 δ 在 f′(x) 的负方向上时,取得最小值,也就是下降的最快的方向了。
于是有:
逻辑回归算法原理_人工智能回归算法
即:
逻辑回归算法原理_人工智能回归算法
其中, wj w j 表示第 j 个特征的权重;η 为学习率,用来控制步长。 重点来了:
逻辑回归算法原理_人工智能回归算法
所以,在使用梯度下降法更新权重时,只要根据下式即可:
逻辑回归算法原理_人工智能回归算法
此式与线性回归时更新权重用的式子极为相似,也许这也是逻辑回归要在后面加上回归两个字的原因吧。当然,在样本量极大的时候,每次更新权重会非常耗费时间,这时可以采用随机梯度下降法,这时每次迭代时需要将样本重新打乱,然后用下式不断更新权重:
逻辑回归算法原理_人工智能回归算法
也就是去掉了求和,而是针对每个样本点都进行更新。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/171772.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 卸载pip包并卸载其依赖包[通俗易懂]

    卸载pip包并卸载其依赖包[通俗易懂]原创工具程序,卸载指定的pip包并递归卸载其依赖包使用方法:将以下代码保存为pip_uninst_rec.py,执行pythonpip_uninst_rec.py<pkg>即可importargparseimportosfromcollectionsimportdequeimportpip._internal.commands.showasshow_cmddefmain():parser=argparse.ArgumentParser(des

    2022年10月16日
    0
  • 机器学习中正则化项L1和L2的直观理解

    机器学习中正则化项L1和L2的直观理解正则化(Regularization)机器学习中几乎都可以看到损失函数后面会添加一个额外项,常用的额外项一般有两种,一般英文称作ℓ1ℓ1\ell_1-norm和ℓ2ℓ2\ell_2-norm,中文称作L1正则化和L2正则化,或者L1范数和L2范数。L1正则化和L2正则化可以看做是损失函数的惩罚项。所谓『惩罚』是指对损失函数中的某些参数做一些限制。对于线性回归模型,使用L1正则化的模型建叫做…

    2022年7月13日
    18
  • 流量矿场[通俗易懂]

    第二个流量魔盒,流量矿场,扫码注册,实名秒通过不刷脸,现在活动:实名通过秒送1台魔盒机,25天产13个币,现在币开盘价格0.11美元,估计后期会涨,不要错过第二个流量魔盒。速度撸起来。线下已经5块回收了!注册链接:http://sina.lt/fyFz苹果APP下载地址:https://9dun.cn/s/zjmalls 安卓APP下载地址:https://9dun.cn/s/zjmallss…

    2022年4月18日
    36
  • 推荐几个JAVA 学习不错的网站

    推荐几个JAVA 学习不错的网站  学习Java呢!不仅经是靠的自身的努力,还要懂得他的规范,所以要多看一些Java技术文档:    我感觉有五个Java自学网站不错推荐一下子;    这些网站可以提供一些最新Java的资料;    有时定期开设讲座等线下活动;    而且里面的一些Java相关的问题以及讨论;    不仅适用于Java小白程序员,而且还适用于一些Java大神;    其实外网有很多比较专业的Java学习网站,但是鉴于为Java小白推荐网站,立足当下!!!  

    2022年7月9日
    17
  • 数据库二级映射是什么_内存映射技术

    数据库二级映射是什么_内存映射技术1.     概述LMDBiscompact(紧凑的),fast,powerful,androbustandimplementsasimplifiedvariantoftheBerkeleyDB(BDB)API.(BDBisalsoverypowerful,andverboselydocumentedinitsownright.)Afterre…

    2022年9月28日
    0
  • 两周搞定计算机专业毕业设计,附源码+论文+答辩

    两周搞定计算机专业毕业设计,附源码+论文+答辩毕设+论文+答辩通关法则,看这一篇,源码都在下面了!写在前面,尽管论文方法和毕设源码都有,但还是要看课+自己敲完完善好。做好充分准备面对答辩。文章目录一、毕设二、论文2.1论文标题2.2确定论文大纲2.3论文内容2.3.1文科找文献:2.3.2论文摘要2.3.3绪论2.3.4论文内容2.4论文查重三、答辩3.1论文答辩前的准备3.2论文答辩现场对弈一、毕设毕设直通车《黑马智慧物业毕业设计》【毕设项目】01网上购物商城(前端+后端+云部署)【毕设项目】02网上购物商城(前端

    2022年7月26日
    8

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号