机器视觉中的特征提取【0】：什么是特征提取，特征提取有什么作用？

1.什么是特征提取？

特征提取的英文叫做feature extractor，它是将一些原始的输入的数据维度减少或者将原始的特征进行重新组合以便于后续的使用。简单来说有两个作用：减少数据维度，整理已有的数据特征。

这里我给一个例子来解释特征提取的第二个作用。那就是我们很熟悉的奖学金评定，我们知道学生的文化课成绩，道德分数，以及各种其他竞赛的成绩。摆在奖学金评定委员会面前的任务就是如何知道一个学生是否具有获得奖学金的特征呢？最简单的来看，假如我们道德成绩不好，比如考试抄袭，我们对此无法容忍，所以已经发现道德成绩不好就有一票否决权。但是对于其他特征就没那么好办了。

这个时候我们就会遇到总分或者加权分等。而这个过程就是特征提取的过程。简单来说，我们就是要通过学生的很多维特征，然后得到一个新的特征，最后的特征是为了让奖学金评定委员会做决定，该授予哪些学生奖学金名额。

对于第一个作用——减少数据维度，我们可以这么理解：我们知道有的时候原始数据的特征很多，而且有的高度相关，有的却又和最终的目的没有关系。比如说上面这个奖学金评定的例子中，我们不仅有学生的文化课成绩，还有学生的身高，去图书馆的次数，年龄，以及家庭环境等等。那么这些数据是否和我们的奖学金评定相关呢？比如说大学中有国家励志奖学金，这类奖学金对家庭收入偏下的同学有倾斜，这时候我们就无法忽略家庭背景。

此外，我么知道有些数据特别巨大，比如等会要讲的图像，每个图像有很多数据，这时候如果直接拿这些原始数据去计算则会非常缓慢，这对我们实时运行没有好处。

2.特征提取有什么作用？

3.机器视觉中的特征提取？

本篇博客实际上主要为了机器视觉中的特征提取做准备，后续博客将会系统的介绍机器视觉中的特征提取方法，特别是图像和深度学习相关的特征提取方法。

我们知道我们对图像或者视频会做很多的应用，比如分类——判断一个图像属于哪一类，比如给一张包含有猫或者狗的照片，机器要告诉我们这里面是狗还是猫。实际上我们前面的奖学金评定的例子就是一个分类问题，给定学生的相关信息，然后将他们分为授予奖学金的一类和不授予奖学金的一类。但是图像中数据要比奖学金评定中的多得多。

这个时候有人就会问，一个特征怎么表示呢？这也是我这个转专业的人在刚开始比较不懂的问题。实际上特征就是数，如果非要用数学语言表示的话，我们可以理解成两个向量空间。一个向量空间是我们熟悉的有实际意义的空间，比如（数学成绩，英语成绩，发表论文数量，发表论文质量等等），另一个向量空间就是数字，比如（92，100，5，1.0等）
在这里插入图片描述
实际上，我们在计算的时候就是用那些数字去计算某个学生的特征。所以，特征可以理解成数字。而且还可以认为数值越大，特征越强烈（一般我们这么规定）。想象一下在奖学金评定时，你的总分是全校最高的，那么你也就是第一个被选为授予奖学金的人。

但是我们图像领域则没有这么好理解的特征的实际含义。我们很难知道一个图像中猫有怎样的特征，而且特征可能是变化的。因此我们的机器视觉中的任务就是如何去找到一个合适的不变的特征，来衡量我们的目标判断结果。

但是我们机器视觉中的特征提取则有类似的道理，那就是特征就是数字，数值越大，特征越强烈。
简单来看，机器视觉领域是这样的一个过程，如下图：
在这里插入图片描述
一张猫的图片作为输入，然后得到新的特征，然后我们根据这些新的特征计算是否属于猫。至于怎么根据新的特征计算，那就可以和我们之前奖学金评定一样，可以使用加权平均，或者直接使用平均，虽然可能方法不同，但上层的概念就是一样的。

4.博客后续

我们理解到这里，是刚刚开始机器视觉的第一步，这里我要先抛出一些问题供大家思考，当作抛砖引玉：

为何图像的特征很难提取，它存在着哪些问题和哪些挑战？
这些特征需要满足什么条件，也就是说特征的特征是怎样的？
卷积神经网络作为特征提取的基本原理是什么？
卷积神经网络的各个版本在改进的过程中遵循了怎样的基本规律？面对如此多的卷积神经网络，我们该何选择？

另外，这里也说一下自己个人感受，由于鄙人是换了专业的，直接到了机器视觉和深度学习领域，因此对图像的基本知识不是那么了解。但是这里也告知后来者（据说转AI方向的人很多），了解深度学习需要一定的各个专业的基础知识。在机器视觉领域，我们想要了解卷积神经网络，则最好理解图像中的各种滤波原理，如边缘提取提取等。

至于怎么去了解这些专业基础知识，我想就不能简单的回答了。但是作为一个换专业的人，或者半路出家的人，毫无疑问，我们必然要花费比那些专业出身的人花更多的精力去了解。我个人认为，系统性的方法并不一定就是最好的方法，相反，一定的查漏补缺是学习过程中十分必要的方法。

欢迎订阅本博客的后续博客。后续博客将主要着眼于卷积神经网络在特征提取中的发展过程及其基本原理，也就是理论部分。

5.后续论文列表：

1 AlexNet, ZFNet – ImageNet Classiﬁcation with Deep Convolutional Neural Networks – Visualizing and Understanding Convolutional Networks
2 GoogleNet (Inception, Inception v2-v3) – Going Deeper with Convolutions – Rethinking the Inception Architecture for Computer Vision
3 VGGNet Very deep convolutional networks for large-scale image recognition
4 ResNet Deep Residual Learning for Image Recognition
5 Inception v4, Inception-ResNet Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning
6 PolyNet PolyNet: A Pursuit of Structural Diversity in Very Deep Networks
7 ResNeXt Aggregated Residual Transformations for Deep Neural Networks
8 Residual Attention Net Residual Attention Network for Image Classiﬁcation
9 DenseNet Densely Connected Convolutional Networks
10 FractalNet FractalNet: Ultra-deep neural networks without residuals
11 DualPath Net Dual Path Networks
12 SENet Squeeze-and-Excitation Networks
13 FPNet Feature Pyramid Networks for Object Detection
14 NASNet, PNASNet – Learning Transferable Architectures for Scalable Image Recognition – Progressive Neural Architecture Search
15 Dilated Convolutions Dilated Residual Networks
16 Deformable Convolutions Deformable Convolutional Networks
17 DiCENet DiCENet: Dimension-wise Convolutions for Efﬁcient Networks
18 XceptionNet
19 ShuffleNet
20 MobileNets

为何要点赞？

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/223762.html原文链接：https://javaforall.net

机器视觉中的特征提取【0】：什么是特征提取，特征提取有什么作用？

1.什么是特征提取？

2.特征提取有什么作用？

3.机器视觉中的特征提取？

4.博客后续

5.后续论文列表：

为何要点赞？

关于作者

全栈程序员-站长

发表回复

机器视觉中的特征提取【0】：什么是特征提取，特征提取有什么作用？

1.什么是特征提取？

2.特征提取有什么作用？

3.机器视觉中的特征提取？

4.博客后续

5.后续论文列表：

为何要点赞？

关于作者

全栈程序员-站长

相关推荐

Carson带你学Android：最全面的Webview使用详解

⚡ 快速开始

autoconf介绍1

OpenCV进行图像相似度对比的几种办法

与MiniMax斗智斗勇III：PC端用Claude Code接入MiniMax模型

射灯怎么安装图解_牛眼灯安装图解法

发表回复