logistic回归详解一:为什么要使用logistic函数

logistic回归详解一:为什么要使用logistic函数从线性分类器谈起 给定一些数据集合 他们分别属于两个不同的类别 例如对于广告数据来说 是典型的二分类问题 一般将被点击的数据称为正样本 没被点击的数据称为负样本 现在我们要找到一个线性分类器 将这些数据分为两类 当然实际情况中 广告数据特别复杂 不可能用一个线性分类器区分 用 X 表示样本数据 Y 表示样本类别 例如 1 与 1 或者 1 与 0 我们线性分类器的目的 就是找到一个超平面 Hyperplan

从线性分类器谈起

其中 x x x 为样本, x = [ x 1 , x 2 , ⋯   , x n ] x = [x_1,x_2,\cdots,x_n] x=[x1,x2,,xn] 为n维向量,函数g为我们常说的logistic函数。g的更一般公式为:
g ( z ) = 1 1 + e − z g(z) = \frac{1}{1+e^{-z}} g(z)=1+ez1

这个公式,对机器学习稍微有点了解的同学可能都特别熟悉,不光在logistic回归中,在SVM中,在ANN中,都能见到他的身影,应用特别广泛。大部分资料在谈到这个式子时候,都是直接给出来。但是不知道大家有没有想过,既然这个式子用途这么广泛,那我们为什么要用它呢?

是不是已经有好多人愣住了。大家都是这么用的。书上都是这么写的啊。是的,但是当一个东西老在你眼前晃来晃去的时候,你是不是应该想想为什么呢?反正对于我来说,如果一个东西在我眼前都出现了第三次了而我还不知其所以然,我一定会去想方设法弄明白为什么。

为什么要用Logistic函数

感知器的思想,就是对所有特征与权重做点积(内积),然后根据与阈值做大小比较,将样本分为两类。稍微了解一点神经网络的同学,对一下这幅图一定不陌生:

这里写图片描述

这里写图片描述

这两者的本质都是一致的,即通过划定一个阈值,然后比较样本与阈值的大小来分类。

这个模型简单直观,实现起来也比较容易(要不怎么说是最简单的现行分类器呢)。但是问题在于,这个模型不够光滑。第一,假设 t 0 = 10 t_0=10 t0=10,现在有一个样本进来,最后计算出来的值为10.01,你说这个样本分类应该是为1还是0呢?好像都不太靠谱的样子。第二,这个函数在 t 0 t_0 t0 这点有个阶跃,有从0到1的突变,导致这点不连续,在数学上处理起来也不方便。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/201217.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月20日 上午9:49
下一篇 2026年3月20日 上午9:49


相关推荐

  • linux搭建apache_plsql安装教程及配置

    linux搭建apache_plsql安装教程及配置在CentOS上安装ApacheApache在默认的CentOS存储库中可用,并且安装非常简单。为了安装ApacheWebServer,首先通过运行以下命令更新本地软件包在基于RHEL的发行版中,Apache软件包和服务称为httpd。要安装Apache,运行以下命令:[root@localhost]#sudoyumupdate更新完成后,就可以安装Apache了。[root@localhost]#yuminstallhttpd启动ApacheWeb服..

    2026年2月7日
    4
  • INTEGER PRIMARY KEY AUTOINCREMENT 和 INTEGER PRIMARY KEY 区别

    INTEGER PRIMARY KEY AUTOINCREMENT 和 INTEGER PRIMARY KEY 区别转自网络 地址不可考 谢谢原作者 如有冒犯 立即删除 Sqlite 中 INTEGERPRIMA 和 rowid INTEGERPRIMA 的使用 nbsp 在用 sqlite 设计表时 每个表都有一个自己的整形 id 值作为主键 插入后能直接得到该主键 nbsp 因为 sqlite 内部本来就会为每个表加上一个 rowid 这个 rowid 可以当成一个隐含的字段使用 nbsp 但

    2025年9月2日
    7
  • Python open函数打开文件路径「建议收藏」

    Python open函数打开文件路径「建议收藏」要以读文件的模式打开一个文件对象,使用Python内置的open()函数,传入文件名和标示符,标示符’r’表示读。 >>>f=open(‘D:/test.txt’,’r’) 注意了,对初学python的同学而言,open()函数着实存在一个不大不小的坑,而且十分不容易发现。错误演示:   >>>f=open(‘…

    2022年5月9日
    219
  • List数据去重的五种有效方法

    List数据去重的五种有效方法List去重方案方案一方案一/***去除重复数据**@paramlist*/publicList<Map<String,Object>>distinct(List<Map<String,Object>>list){finalbooleansta=…

    2022年5月26日
    44
  • pytest重试_pycharmrun不了

    pytest重试_pycharmrun不了安装:pip3installpytest-rerunfailures重新运行所有失败用例要重新运行所有测试失败的用例,请使用–reruns命令行选项,并指定要运行测试的最大次数:$py

    2022年7月31日
    6
  • IDEA安装插件的两种方式

    IDEA安装插件的两种方式1.IDEA中在线安装,如图所示2.有的插件下载需要VPN,导致下载很慢,我们可以通过官网下载安装包,通过本地安装包进行安装

    2022年6月1日
    86

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号