监督学习型神经网络

监督学习型神经网络兄弟姐妹们,如需转载请标明出处:http://blog.csdn.net/jiangjunshow总目录什么是监督学习?简单的回答是:判断是否是监督学习,就看输入数据是否有标签。输入数据有标签,则为有监督学习,没标签则为无监督学习。对于上面的简单回答,如果你看不懂,是正常的!下面我给出详细回答,如果你还是不明白,那么…….也是正常的。因为有些概念要被接受是需要时间的!坚持不懈地看我

大家好,又见面了,我是你们的朋友全栈君。

朋友们,如需转载请标明出处:http://blog.csdn.net/jiangjunshow

什么是监督学习

简单的回答是:判断是否是监督学习,就看输入数据是否有标签。输入数据有标签,则为有监督学习,没标签则为无监督学习。

对于上面的简单回答,如果你看不懂,是正常的!下面我给出详细回答,如果你还是不明白,那么…也是正常的。因为有些概念要被接受是需要时间的!坚持不懈地看我的文章,不知不觉中你就明白了!

这里写图片描述

要详细解释什么是监督学习,那么先要明白“什么是学习?”。一个成语就可概括:举一反三。此处以高考为例,高考的题目在上考场前我们未必做过,但在高中三年我们做过很多很多题目,由此学会了解题方法,因此考场上面对陌生问题也可以算出答案。机器学习的思路也类似:我们利用一些训练数据(高中的大量题库),使机器能够总结出一些规律(总结出解题方法),然后用这些规律来分析未知数据(用解题方法来解答高考题目)。

分类(classification)这种机器学习算法就是一种监督学习。对于分类,输入的训练数据有特征(feature),有标签(label)。也就是我们前面文章中的输入x和输出y。每一个x样本都对应着一个y(输出)标签。所谓的学习,其本质就是找到特征和标签间的关系(mapping),也就是找规律。这样当有特征而无标签的未知数据输入时,我们就可以通过已有的关系得到未知数据标签,即根据新数据进行预测。在上述的分类过程中,如果所有训练数据都有标签,则为有监督学习(supervised learning)。如果数据没有标签,显然就是无监督学习(unsupervised learning),即聚类(clustering)。

目前分类算法(监督学习)的效果还是不错的,而相对来讲,聚类算法(无监督学习)就有些惨不忍睹了。确实,无监督学习本身的特点使其难以得到如分类一样近乎完美的结果。这也正如我们在高中做题,答案(标签)是非常重要的,假设两个完全相同的人进入高中,一个正常学习,另一人做的所有题目都没有答案,那么想必第一个人高考会发挥很好,第二个人会发…疯。
这里写图片描述

这时各位可能要问,既然监督学习如此之好,非监督学习如此之不靠谱,那为何我们还可以容忍非监督学习的存在?因为在实际应用中,标签的获取常常需要极大的人工工作量,有时甚至非常困难。

但是我觉得非监督学习非常之重要!要想让人工智能更加聪明,就必须使它具有更强的自学能力。我预见的未来将是这样的:先用监督学习教会人工智能体一些基本的常识,然后让它基于这些常识去自学去探索世界。当实现这个架构后,人工智能体将会超越人类。
这里写图片描述

但到目前为止,几乎所有由人工智能创造的经济价值都是通过监督学习型神经网络实现的。例如广告预测,这可能是最有利可图的人工智能应用了,它也许不是最鼓舞人心的,但肯定是非常有利可图的,通过输入一些关于用户的信息x,神经网络就能预测你是否会点击某个广告(给出输出y来指示某个广告),所以当你看到你朋友,或男朋友,或女朋友手机电脑上面都是些黄色广告时,你基本上可以断定TA的“性趣很浓”,也之所以我一般不会给别人用我的手机或电脑。计算机视觉在过去几年也取得了很大的进步,主要是由于深度学习。您可以输入人脸图像,神经网络会给出这个人的姓名。在语音识别方面的进展也非常激动人心,我们可以输入一段音频到神经网络,相应的文字就被输出来了。机器翻译也取得了巨大的进步,你可以输入英文句子,直接输出中文句子。在自动驾驶中,您可以输入车辆前方的图片以及雷达中的一些信息,基于此,神经网络将告诉您其它汽车的位置(这是自动驾驶系统的关键组成部分)。因此,通过神经网络进行的许多价值创造当前都是通过监督学习来实现的——巧妙地构造数据集,选择什么应该是x,什么应该是y,然后让神经网络来学习这个数据集。

另外再补充些知识点。神经网络除了按监督学习和非监督学习来分类外,还按结构来分类。不同结构的神经网络被用于不同的应用程序中。例如,在之前看到的房价预测应用中,我们使用的是标准的神经网络结构,广告预测也是一个相对标准的神经网络。对于图像应用程序,我们经常使用卷积神经网络CNN。对于序列数据应用程序一般使用递归神经网络RNN(例如音频就属于序列数据,是随着时间一段一段表述的,例如英语、汉语都是随着时间一个字一个单词来表述的)。对于更复杂的应用,比如自动驾驶,里面有图像所以需要CNN卷积神经网络,而雷达信息则需要其它类型的神经网络,这就导致了混合的神经网络架构。

这里写图片描述

为了更具体一点,上面分别给出了各种不同神经网络的结构图。依次是,标准神经网络SNN, 卷积神经网络CNN,递归神经网络RNN。稍后我会解释这些图的含义以及如何实现它。卷积网络通常被用于图像数据。递归神经网络被用于序列数据。

你也可能听说过机器学习中将数据分为结构化数据和非结构化数据。结构化数据主要表示数据库数据。例如,在房价预测中,您可能会有一个数据库告诉您卧室的大小和数量。又如预测用户是否点击广告时,您可能会获得有关用户的信息,例如年龄,广告的一些信息。所谓结构化数据,意味着每个特征,如房子的大小,卧室的数量或用户的年龄,是具有非常明确的含义的。相比之下,非结构化数据指的是音频,图像。这里的特征可能是图像中的像素值或文本中的单个单词,没有明确的含义。与结构化数据相比,计算机更难以理解非结构化数据。而人类已经进化得非常善于理解音频和图像这些非结构化数据。但这一两年由于深度学习的兴起,计算机对非结构化的理解能力越来越强了。人们在听到有关神经网络对非结构化数据的成功时,例如当神经网络识别出一只猫时,人们都很兴奋。但事实证明,神经网络正在创造的许多短期经济价值其实是在结构化数据上的,比如广告系统。所以在这个课程中,我将介绍的很多技术都将适用于结构化数据和非结构化数据。为了解释算法,在示例中我将会更多的使用非结构化数据。但是,将来在您自己的团队中应用神经网络时,我希望您应该对结构化和非结构化数据都重视。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/140220.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 图形推理1000题pdf_数字推理题,眼尖的一眼就看出来了「建议收藏」

    图形推理1000题pdf_数字推理题,眼尖的一眼就看出来了「建议收藏」动脑往期回看>>每日推理每日推理|你能找出犯人吗?每日推理|你是哪个班的?每日推理|拿掉2根木棍,使其变成3个正方形每日推理|共同营业日每日推理|千里寻一每日推理|坏掉的8号电话亭每日推理|哪两个才是兄弟?每日推理|白马王子每日推理|神奇海螺脑筋急转弯答案笑死人的脑筋急转弯看了想打人的题目移动火柴游戏复杂的迷宫图形推理5道很难的字谜△点击…

    2022年9月8日
    0
  • phpMyAdmin使用教程

    phpMyAdmin使用教程什么是phpMyAdmin?phpMyAdmin是众多MySQL图形化管理工具中使用最为广泛的一种,是一款使用PHP开发的基于B/S模式的MySQL客户端软件,该工具是基于Web跨平台的管理程序,并且支持简体中文,用户可以在官网上下载最新版本的。phpMyAdmin为Web开发人员提供了类似Access,SQLServer的图形化数据库操作界面,通

    2022年5月31日
    105
  • ringbuffer 无锁队列_wear ring

    ringbuffer 无锁队列_wear ring最近常收到SOD框架的朋友报告的SOD的SQL日志功能报错:文件句柄丢失。经过分析得知,这些朋友使用SOD框架开发了访问量比较大的系统,由于忘记关闭SQL日志功能所以出现了很高频率的日志写入操作,从而偶然引起错误。后来我建议只记录出错的或者执行时间较长的SQL信息,暂时解决了此问题。但是作为一个热心造轮子的人,一定要看看能不能造一个更好的轮子出来。前面说的错误原因已经很直白了,就是频繁的日志写入导…

    2022年9月10日
    0
  • Fleet究竟是什么?为什么最近这么火~

    Fleet究竟是什么?为什么最近这么火~如何看待JetBrains推出的轻量级编辑器Fleet?

    2022年6月1日
    56
  • ubuntu14.04 Markdown编辑器推荐之Remarkable[通俗易懂]

    ubuntu14.04 Markdown编辑器推荐之Remarkable

    2022年1月28日
    105
  • docker结构框架图

    docker结构框架图

    2021年5月29日
    108

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号