机器学习之有监督学习,无监督学习,半监督学习

机器学习之有监督学习,无监督学习,半监督学习文章目录前言有监督学习无监督学习半监督学习前言机器学习是数据分析和数据挖掘的一种比较常用,比较好的手段从有无监督的角度,可以分为三类:有监督学习无监督学习半监督学习有监督学习用已知某种或某些特性的样本作为训练集,以建立一个数学模型,再用已建立的模型来预测未知样本,此种方法被称为有监督学习,是最常用的一种机器学习方法。是从标签化训练数据集中推断出模型的机器学习任务问:有监督学习的…

大家好,又见面了,我是你们的朋友全栈君。

前言

机器学习是数据分析和数据挖掘的一种比较常用,比较好的手段从有无监督的角度,可以分为三类:

  1. 有监督学习
  2. 无监督学习
  3. 半监督学习

有监督学习

用已知某种或某些特性的样本作为训练集,以建立一个数学模型,再用已建立的模型来预测未知样本,此种方法被称为有监督学习,是最常用的一种机器学习方法。是从标签化训练数据集中推断出模型的机器学习任务

问:有监督学习的定义最关键的是什么呢?
从标签化的训练数据集中推断出模型机器学习任务
前面都是废话,没有用,最关键的要看的就是:从标签化的训练数据集中推断出模型机器学习任务

问:什么是标签
比如说有一张猫的图片,我们都知道它是只猫,但是计算机不知道它是只猫,怎么办呢?给这张图片打上个标签,然后计算机就知道它是只猫了,后面计算机根据这个标签对所有的猫进行学习就能通过这一只猫认识所有的猫了。

给数据打标签,其实就是告诉计算机,前面这么多特征( x 1 x_1 x1 ~ x n x_n xn)到底描述的是什么。很自然的就是Y,Y可以称之为Label,也可以称之为Target(我们的目标值)

我们接到一个任务或者说模型,首先要定义一个目标,这个目标对应的是谁?我们的目标要对这个任务进行合理的建模和预测,也就是说我们的目标在进行预测的时候有一个对应的y的值的话,
x1第一个特征,xn第n个特征,矩阵一般是有m行n列的这样一个矩阵,所以我们一般去写的时候,这个数据集中一般会有m条观测值以及n列的这样一个特征。

然后最终会有一个目标值的y,如果有y,我们就称之为有监督学习,我们就要使用有监督学习进行模型的构建,实际上我们在日常的业务当中能够多使用有监督学习就多使用有监督学习,比如说在有 x 1 , x 2 , x 3 , ⋯   , x n x_1, x_2, x_3, \cdots, x_n x1,x2,x3,,xn以及y的情况下就老老实实用有监督学习了,就别用无监督学习。

无监督学习

知道了有监督学习的定义了,无监督学习的定义也就出来了。在算法构建的过程中不考虑Y的值,只通过特征信息去归纳出一些新的规律出来,这个方法就称之为无监督学习。

有监督学习和无监督学习的区别就是一个有y,一个没有y。这是最简单的记忆方式。

所以总结起来正式的说法是:无监督学习的训练集中没有人为的标注的结果,在非监督的学习过程中,数据并不被特别标识,学习模型是为了推断出数据的一些内存结构。

推断出数据的一些内在结构这是无监督学习学习的作用

问:为什么不建议使用无监督学习呢
无监督学习需要我们推断一些结构,但是在推断一些结构的时候可能会因为人为的主观臆断而出现一些偏差,这个就不是纯数学能够证明我是对的了,这个时候再进行无监督学习就是在瞎猜。

在没有y值的情况怎么办?是不是只能进行无监督学习了呢?
没有Y值的时候,自己给数据打标签,自己把Y做出来。然后进行有监督学习
很多情况下,在实际的工作业务中很多的工作量都是给数据打标签,你可能花半个半个月的时间,五六个人就坐那儿天天打标签,几万条数据坐那儿打标签打个三四天很正常。

所以就需要注意了,如果说真的是说在没有标签的情况下,你看看有没有合理的方式先把标签获取过来。 如果没有合理的渠道,就看看能不能进行人为地打标签再进行有监督学习的学习,这样做的结果会更好些。

半监督学习

看上面有监督学习和无监督学习的定义,就是一半有一半无呗
意思就是用少量的有标注的样本和大量未标注的样本进行训练和分类,这样是有监督学习和无监督学习的结合。

考虑如何利用少量的瓢样本和大量的未瓢样本进行训练和分类的问题,
是有监督学习和无监督学习的结合。

这就是机器学习大致的一个分类

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/140299.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • pycharm配置github_当前系统配置不能运行此程序

    pycharm配置github_当前系统配置不能运行此程序测试开发之代码管理前言一、Pycharm配置git工具1.GitHub新建一个代码仓2.在Pycharm代码中pull下来二、git提交相关规范1.方式一2.方式二三.不规范导致的问题前言团队协作开发自然离不开代码管理工具,使用得当效率高,反之不少麻烦。在这里沉淀对代码管理的理解和运用基于Python自动化测试(UI或接口)基于Pycharm开发工具基于GitHub代码仓库Windows中安装好git工具一、Pycharm配置git工具1.GitHub新建一个代码仓这里是之前去

    2022年8月27日
    4
  • 04 _ 可扩展架构案例(一):电商平台架构是如何演变的?[通俗易懂]

    04 _ 可扩展架构案例(一):电商平台架构是如何演变的?[通俗易懂]本章,我就针对最近十几年电商平台的架构变化过程,来具体说明下,为了支持业务的快速发展,架构是如何一步步演进的。从2003年淘宝上线开始,国内电商平台经历了高速的发展,在这个过程中,系统遇到了很多的挑战,比如说:如何针对当前的业务现状,选择合适的架构呢?如何在业务发展过程中,升级改造架构,并保证系统的平滑过渡呢?接下来,我会结合自己的工作实践,和你一起探讨架构的演变历程,你可以从中了解到各种架构的优劣点和适用性,然后在实际工作中选择合适的架构。这里,我总结了国内电商平台架构发展的大致过程,你可以结合图片

    2022年6月16日
    29
  • 单片机引脚控制继电器最简单的电路方式

    单片机引脚控制继电器最简单的电路方式首先要明确一点:单片机不能直接控制继电器,不管是3v的继电器还是5v的继电器。原因:比如51单片机和msp430单片机,引脚不能直接接继电器。虽然引脚的电压足够,但是由于电流不够,所以本应该闭合的线圈不会闭合。需要增加一个三极管来放大电流。说是放大电流,其实本质上是把引脚当成一个开关来控制真正3.3v电压的开合。下图是在实践中自己设计的可以正常工作的继电器模块。

    2022年6月24日
    34
  • 谷歌搜索语法大全_Google语法

    谷歌搜索语法大全_Google语法Google是一款十分强大的搜索引擎,黑客们常常借助它搜索网站的一些敏感目录和文件,甚至可以利用它的搜索功能来自动攻击那些有漏洞的网站;而有些人可以通过搜索把某个个人的信息,包括住址、电话号码、出生年月等都可以搜索出来;当然我们在日常的生活中正确的借助Google搜索也可以更加高效的找到我们需要的东西。

    2022年9月11日
    1
  • Sql Prompt 10激活成功教程[通俗易懂]

    Sql Prompt 10激活成功教程[通俗易懂]1.下载安装文件待审核…2.激活成功教程修改hosts文件(如若跳过此步骤,虽然可以激活成功教程成功,但是重启电脑之后,又得重新激活成功教程)首先系统HOSTS文件添加以下屏蔽网络HOSTS路径:C:\Windows\System32\drivers\etc127.0.0.1red-gate.com127.0.0.1www.red-gate.com127.0.0.1licensing.red-gate.com127.0.0.1productlogin.red-ga…

    2022年7月26日
    103
  • mac使用obs进行斗鱼直播无法录制内置声音

    mac使用obs进行斗鱼直播无法录制内置声音/////////////////2016/11/12/////////////////////////////////by xbw//////////////////// 需要soundflower,下载链接安装之后会重启电脑。斗鱼直播间–750240

    2022年5月12日
    49

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号