sklearn 中 Logistics Regression 的 coef_ 和 intercept_ 的具体意义

sklearn 中 Logistics Regression 的 coef_ 和 intercept_ 的具体意义使用sklearn库可以很方便的实现各种基本的机器学习算法,例如今天说的逻辑斯谛回归(LogisticRegression),我在实现完之后,可能陷入代码太久,忘记基本的算法原理了,突然想不到coef_和intercept_具体是代表什么意思了,就是具体到公式中的哪个字母,虽然总体知道代表的是模型参数。好尴尬,折腾了一会,终于弄明白了,记录下来,以说明自己tooyoung。正文我…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

使用sklearn库可以很方便的实现各种基本的机器学习算法,例如今天说的逻辑斯谛回归(Logistic Regression),我在实现完之后,可能陷入代码太久,忘记基本的算法原理了,突然想不到coef_intercept_具体是代表什么意思了,就是具体到公式中的哪个字母,虽然总体知道代表的是模型参数。

好尴尬,折腾了一会,终于弄明白了,记录下来,以说明自己 too young。

正文

我们使用 sklearn 官方的一个例子来作为说明,源码可以从这里下载,下面我截取其中一小段并做了一些修改:

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.linear_model import LogisticRegression
	
# 构造一些数据点
centers = [[-5, 0], [0, 1.5], [5, -1]]
X, y = make_blobs(n_samples=1000, centers=centers, random_state=40)
transformation = [[0.4, 0.2], [-0.4, 1.2]]
X = np.dot(X, transformation)
	
clf = LogisticRegression(solver='sag', max_iter=100, random_state=42, multi_class=multi_class).fit(X, y)

print clf.coef_ 
print clf.intercept_

Jetbrains全家桶1年46,售后保障稳定

输出如图:
sklearn 中 Logistics Regression 的 coef_ 和 intercept_ 的具体意义
可以看到clf.coef_是一个3×2(n_class, n_features)的矩阵,clf.intercept_是一个1×3的矩阵(向量),那么这些到底是什么意思呢?

我们来回顾一下 Logistic 回归的模型:
h θ ( x ) = 1 1 + e ( − θ T x ) h_\theta(x) = \frac{1}{1+e^{(-\theta^Tx)}} hθ(x)=1+e(θTx)1
其中 θ \theta θ 是模型参数,其实 θ T x \theta^Tx θTx 就是一个线性表达式,将这个表达式的结果再一次利用 Logistic 函数映射到 0~1 之间。

知道了这个,也就可以搞清楚那个clf.coef_clf.intercept_了: clf.coef_clf.intercept_就是 θ \theta θ ,下面我们来验证一下:

i = 100
print 1 / (1 + np.exp(-(np.dot(X[i].reshape(1, -1), cc.T) + clf.intercept_)))
# 正确的类别
print y[i]
print clf.predict_proba(X[i].reshape(1, -1))
print clf.predict_log_proba(X[i].reshape(1, -1))

输出结果:
在这里插入图片描述
可以看到结果是吻合的,说明我们的猜想是正确的。

END

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/203996.html原文链接:https://javaforall.net

(0)
上一篇 2025年8月9日 上午9:15
下一篇 2025年8月9日 上午9:43


相关推荐

  • IntelliJ IDEA 2021.1激活教程(亲测激活至 2099 年,长期更新)

    IntelliJ IDEA 2021.1激活破解教程(亲测激活至 2099 年,长期更新)

    2021年4月12日
    91.3K
  • java与php哪个好_java和php哪个是主流

    java与php哪个好_java和php哪个是主流首先介绍一下我自己,一直在从事教育行业,有十几年的IT培训经验,从干这行起一直到现在,总会有人问你:服务器端开发是学php好还是java好,如果你告诉她(他)学习php好,他(她)会反问,听说php只

    2022年8月3日
    7
  • matlab矩阵求逆矩阵非方阵_matlab验证逆矩阵出问题

    matlab矩阵求逆矩阵非方阵_matlab验证逆矩阵出问题matlab矩阵求逆矩阵因为所以该矩阵可逆,根据,其中得到计算矩阵A每个元素的代数余子式:所以可得:matlab计算如下:>>A1=[122;21-2;2-2

    2022年8月3日
    7
  • oracle function详解,Oracle函数用法详解「建议收藏」

    oracle function详解,Oracle函数用法详解「建议收藏」本文概述函数是用于返回单个值的子程序。你必须在调用函数之前声明并定义一个函数。它可以在同一时间声明和定义,也可以在同一块中先声明然后定义。在Oracle中创建函数句法CREATE[ORREPLACE]FUNCTIONfunction_name[(parameter[,parameter])]RETURNreturn_datatypeIS|AS[declaration_sec…

    2025年8月31日
    7
  • fseek函数的用法

    fseek函数的用法对于 c 语言 fseek 函数在大一题库中有这样一道题 fseek fp 100L 2 intfseek FILE stream longoffset intorigin 第一个参数 stream 为文件指针第二个参数 offset 为偏移量 整数表示正向偏移 负数表示负向偏移第三个参数 origin 设定从文件的哪里开始偏移 可能取值为 SEEK CUR SEEK END 或 SEEK SETSEEK SET 文件开头 SEEK CUR 当前位置 SEEK END 文件结尾其中 SEEK

    2026年3月20日
    2
  • C++中类的多继承

    C++中类的多继承在写这一主题的文章之前 在网上找到一篇很非常好的文章 C 之继承与多态 就没有必要做重复造轮子的事件了 那就从这篇文章开始吧 在 c 中一个类可以从多个基类中派生 即可以有多个父类 这就是多继承 多继承的方式主要有两种 1 简单版本类 C 会同时拥有类 A 和类 B 的特性 属性和方法 也就是两个类的所有成员 这种方式很简单这里就不多说 主要讲下面这种方式 2 复杂版本同样的 这个结构中

    2026年3月18日
    1

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号