感知机(Perceptron)为什么不能表示异或(XOR)

感知机(Perceptron)为什么不能表示异或(XOR)1.感知机不能表示异或在很早之前学PatternRecognition相关课程的时候,老师在课堂上就说过感知机遇到的一个大问题就是无法表示异或问题(XOR)。后来接触深度学习相关的内容,开头部分肯定会提到感知机,提到感知机也必会提到不能表示异或的问题。正好抽出点时间,稍微搞明白一下为什么感知机不能表示异或。2.感知机的数学定义感知机到底是什么呢?首先来看一下他的数学定义:假设输入空间(即样本的

大家好,又见面了,我是你们的朋友全栈君。

项目github地址:bitcarmanlee easy-algorithm-interview-and-practice
欢迎大家star,留言,一起学习进步

1.感知机不能表示异或

在很早之前学Pattern Recognition相关课程的时候,老师在课堂上就说过感知机遇到的一个大问题就是无法表示异或问题(XOR)。后来接触深度学习相关的内容,开头部分肯定会提到感知机,提到感知机也必会提到不能表示异或的问题。正好抽出点时间,稍微搞明白一下为什么感知机不能表示异或。

2.感知机的数学定义

感知机到底是什么呢?首先来看一下他的数学定义:
假设输入空间(即样本的特征空间)为 X ⊆ R n X \subseteq R ^ n XRn,输出空间为 y = { + 1 , − 1 } y = \{+1, -1\} y={
+1,1}
。输入位 x ⊂ X x \subset X xX表示样本的特征向量,对应于输入空间(特征空间)的点;输出 y ⊂ Y y \subset Y yY表示样本类别。由输入空间到输出空间对应的函数关系如下:
f ( x ) = s i g n ( w ⋅ x + b ) f(x) = sign(w\cdot x + b) f(x)=sign(wx+b)

此函数被称为感知机。其中, w w w b b b为感知机的模型参数, w ⊂ R n w \subset R^n wRn为权重(weight)或权值向量(weight vector), b ⊂ R b \subset R bR为偏置(bias), w ⋅ x w \cdot x wx表示 w w w x x x的内积,而 s i g n sign sign是符合函数,即:
KaTeX parse error: No such environment: equation at position 7: \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲}̲ sign(x) = \…
感知机是一种线性分类模型,属于判别模型。

3.异或是线性不可分

异或之所以重要,是因为它相对于其他逻辑关系,例如与(AND), 或(OR)等,异或是线性不可分的。
这里写图片描述

由这幅简单的示意图可以看出来,and(与)、or(或)、not and(与非)等运算很容易用一条直线分开,但是异或运算中,图示的1,2,3条许仙都无法分开,异或运算就是典型的非线性问题!

具体的数学证明过程可以看后面的参考内容

参考文献:

1.https://zh.wikipedia.org/wiki/%E6%84%9F%E7%9F%A5%E5%99%A8
2.https://www.zybuluo.com/ArrowLLL/note/827264 有数学证明过程
3.https://zhuanlan.zhihu.com/p/30155870

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/160193.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • linux(1)Mac上传文件到Linux服务器

    linux(1)Mac上传文件到Linux服务器前言我们使用mac时,想让本地文件上传至服务器,该怎么办呢windows系统,我们可以使用xftp或者rz命令,那么mac呢?mac系统,我们可以使用sftp、scp或者rz命令,本文介绍sft

    2022年7月29日
    2
  • java基本输入语句_java键盘输入语句

    java基本输入语句_java键盘输入语句在Java中进行输入时,最常用的两种输入方式为:1.使用ScannerScanner使用步骤:导入包importjava.util.Scanner;//导包的动作必须出现在类定义的上方创建对象//newScanner(System.in)为固定格式,不可以改变Scannersc=newScanner(System.in); 接收数据inti=sc.nextInt(); //这里使用的为int型,如果改变,则需要改变sc.nextInt();

    2022年9月15日
    0
  • 各种浏览器怎么换ip

    各种浏览器怎么换ip

    2021年10月23日
    112
  • 一级域名和二级域名的区别是什么?作用怎样?

    一级域名和二级域名的区别是什么?作用怎样?

    2021年9月20日
    72
  • 神经网络loss函数意义_lossfunction

    神经网络loss函数意义_lossfunctionL1Loss平均绝对误差(MAE),用于回归模型对于包含NNN个样本的batch数据D(x,y)D(x,y)D(x,y),losslossloss计算如下:loss=1N∑n=1Nlnloss=\frac{1}{N}\sum_{n=1}^{N}l_{n}loss=N1​∑n=1N​ln​其中,ln=∣xn−yn∣l_{n}=\left|x_{n}-y_{n}\right|ln​=∣xn​−yn​∣classL1Loss(_Loss):__constants__=[‘redu

    2022年9月18日
    0
  • Stream和parallelStream

    Stream和parallelStreamStream和parallelStreamParallelStreamstreamparallelstreamstream和parallelStream一.什么是Stream?Stream是在Java8新增的特性,普遍称其为流;它不是数据结构也不存放任何数据,其主要用于集合的逻辑处理。二.和Iterator的区别Iterator做为迭代器,其按照一定的顺序迭代遍历集合中的每一个元素,并且对每个元素进行指定的操作。

    2022年7月19日
    12

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号