机器视觉中的特征提取【0】:什么是特征提取,特征提取有什么作用?

机器视觉中的特征提取【0】:什么是特征提取,特征提取有什么作用?1 什么是特征提取 特征提取的英文叫做 featureextra 它是将一些原始的输入的数据维度减少或者将原始的特征进行重新组合以便于后续的使用 简单来说有两个作用 减少数据维度 整理已有的数据特征 这里我给一个例子来解释特征提取的第二个作用 那就是我们很熟悉的奖学金评定 我们知道学生的文化课成绩 道德分数 以及各种其他竞赛的成绩 摆在奖学金评定委员会面前的任务就是如何知道一个学生是否

1.什么是特征提取?

特征提取的英文叫做feature extractor,它是将一些原始的输入的数据维度减少或者将原始的特征进行重新组合以便于后续的使用。简单来说有两个作用:减少数据维度,整理已有的数据特征。

这里我给一个例子来解释特征提取的第二个作用。那就是我们很熟悉的奖学金评定,我们知道学生的文化课成绩,道德分数,以及各种其他竞赛的成绩。摆在奖学金评定委员会面前的任务就是如何知道一个学生是否具有获得奖学金的特征呢?最简单的来看,假如我们道德成绩不好,比如考试抄袭,我们对此无法容忍,所以已经发现道德成绩不好就有一票否决权。但是对于其他特征就没那么好办了。

这个时候我们就会遇到总分或者加权分等。而这个过程就是特征提取的过程。简单来说,我们就是要通过学生的很多维特征,然后得到一个新的特征,最后的特征是为了让奖学金评定委员会做决定,该授予哪些学生奖学金名额。

对于第一个作用——减少数据维度,我们可以这么理解:我们知道有的时候原始数据的特征很多,而且有的高度相关,有的却又和最终的目的没有关系。比如说上面这个奖学金评定的例子中,我们不仅有学生的文化课成绩,还有学生的身高,去图书馆的次数,年龄,以及家庭环境等等。那么这些数据是否和我们的奖学金评定相关呢?比如说大学中有国家励志奖学金,这类奖学金对家庭收入偏下的同学有倾斜,这时候我们就无法忽略家庭背景。

此外,我么知道有些数据特别巨大,比如等会要讲的图像,每个图像有很多数据,这时候如果直接拿这些原始数据去计算则会非常缓慢,这对我们实时运行没有好处。

2.特征提取有什么作用?

3.机器视觉中的特征提取?

本篇博客实际上主要为了机器视觉中的特征提取做准备,后续博客将会系统的介绍机器视觉中的特征提取方法,特别是图像和深度学习相关的特征提取方法

我们知道我们对图像或者视频会做很多的应用,比如分类——判断一个图像属于哪一类,比如给一张包含有猫或者狗的照片,机器要告诉我们这里面是狗还是猫。实际上我们前面的奖学金评定的例子就是一个分类问题,给定学生的相关信息,然后将他们分为授予奖学金的一类和不授予奖学金的一类。但是图像中数据要比奖学金评定中的多得多。

这个时候有人就会问,一个特征怎么表示呢?这也是我这个转专业的人在刚开始比较不懂的问题。实际上特征就是数,如果非要用数学语言表示的话,我们可以理解成两个向量空间。一个向量空间是我们熟悉的有实际意义的空间,比如(数学成绩,英语成绩,发表论文数量,发表论文质量等等),另一个向量空间就是数字,比如(92,100,5,1.0等)
在这里插入图片描述
实际上,我们在计算的时候就是用那些数字去计算某个学生的特征。所以,特征可以理解成数字。而且还可以认为数值越大,特征越强烈(一般我们这么规定)。想象一下在奖学金评定时,你的总分是全校最高的,那么你也就是第一个被选为授予奖学金的人。

但是我们图像领域则没有这么好理解的特征的实际含义。我们很难知道一个图像中猫有怎样的特征,而且特征可能是变化的。因此我们的机器视觉中的任务就是如何去找到一个合适的不变的特征,来衡量我们的目标判断结果。

但是我们机器视觉中的特征提取则有类似的道理,那就是特征就是数字,数值越大,特征越强烈
简单来看,机器视觉领域是这样的一个过程,如下图:
在这里插入图片描述
一张猫的图片作为输入,然后得到新的特征,然后我们根据这些新的特征计算是否属于猫。至于怎么根据新的特征计算,那就可以和我们之前奖学金评定一样,可以使用加权平均,或者直接使用平均,虽然可能方法不同,但上层的概念就是一样的。


4.博客后续

我们理解到这里,是刚刚开始机器视觉的第一步,这里我要先抛出一些问题供大家思考,当作抛砖引玉:

  1. 为何图像的特征很难提取,它存在着哪些问题和哪些挑战?
  2. 这些特征需要满足什么条件,也就是说特征的特征是怎样的?
  3. 卷积神经网络作为特征提取的基本原理是什么?
  4. 卷积神经网络的各个版本在改进的过程中遵循了怎样的基本规律?面对如此多的卷积神经网络,我们该何选择?

另外,这里也说一下自己个人感受,由于鄙人是换了专业的,直接到了机器视觉和深度学习领域,因此对图像的基本知识不是那么了解。但是这里也告知后来者(据说转AI方向的人很多),了解深度学习需要一定的各个专业的基础知识。在机器视觉领域,我们想要了解卷积神经网络,则最好理解图像中的各种滤波原理,如边缘提取提取等。

至于怎么去了解这些专业基础知识,我想就不能简单的回答了。但是作为一个换专业的人,或者半路出家的人,毫无疑问,我们必然要花费比那些专业出身的人花更多的精力去了解。我个人认为,系统性的方法并不一定就是最好的方法,相反,一定的查漏补缺是学习过程中十分必要的方法。

欢迎订阅本博客的后续博客。后续博客将主要着眼于卷积神经网络在特征提取中的发展过程及其基本原理,也就是理论部分。

5.后续论文列表:

1 AlexNet, ZFNet – ImageNet Classification with Deep Convolutional Neural Networks – Visualizing and Understanding Convolutional Networks
2 GoogleNet (Inception, Inception v2-v3) – Going Deeper with Convolutions – Rethinking the Inception Architecture for Computer Vision
3 VGGNet Very deep convolutional networks for large-scale image recognition
4 ResNet Deep Residual Learning for Image Recognition
5 Inception v4, Inception-ResNet Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning
6 PolyNet PolyNet: A Pursuit of Structural Diversity in Very Deep Networks
7 ResNeXt Aggregated Residual Transformations for Deep Neural Networks
8 Residual Attention Net Residual Attention Network for Image Classification
9 DenseNet Densely Connected Convolutional Networks
10 FractalNet FractalNet: Ultra-deep neural networks without residuals
11 DualPath Net Dual Path Networks
12 SENet Squeeze-and-Excitation Networks
13 FPNet Feature Pyramid Networks for Object Detection
14 NASNet, PNASNet – Learning Transferable Architectures for Scalable Image Recognition – Progressive Neural Architecture Search
15 Dilated Convolutions Dilated Residual Networks
16 Deformable Convolutions Deformable Convolutional Networks
17 DiCENet DiCENet: Dimension-wise Convolutions for Efficient Networks
18 XceptionNet
19 ShuffleNet
20 MobileNets


















为何要点赞?

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/223762.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月17日 下午1:27
下一篇 2026年3月17日 下午1:28


相关推荐

  • Carson带你学Android:最全面的Webview使用详解

    Carson带你学Android:最全面的Webview使用详解前言现在很多App里都内置了Web网页(HypridApp),比如说很多电商平台,淘宝、京东、聚划算等等,如下图那么这种该如何实现呢?其实这是Android里一个叫WebView的组件实现的。今天我将全面介绍WebView的常用用法。目录1.简介WebView是一个基于webkit引擎、展现web页面的控件。Android的Webview在低版本和高版本采用了不同的webkit版本内

    2022年6月2日
    43
  • ⚡ 快速开始

    ⚡ 快速开始

    2026年3月13日
    2
  • autoconf介绍1

    autoconf介绍1这里简单整理下这本书的第三章:configureyourprojectwithautoconf书中介绍,循序渐进。第一步:介绍了autoconf和M4宏,并整体运行了一遍,介绍了相关脚本的调用顺序和文件作用。第二步:通过autoconf将Makefile中定义为@VARIABLE@的变量替换,并通过VPATH进行远程构建。第三步:借助autoscan生成configure.ac,并说明文件中的宏含义。

    2022年6月4日
    33
  • OpenCV进行图像相似度对比的几种办法

    OpenCV进行图像相似度对比的几种办法转载请注明出处 http blog csdn net wangyaninglm article details 来自 shiter 编写程序的艺术对计算图像相似度的方法 本文做了如下总结 主要有三种办法 1 PSNR 峰值信噪比 PSNR PeakSignalto 一种全参考的图像质量评价指标 简介 https en wikipedia

    2026年3月20日
    2
  • 与MiniMax斗智斗勇III:PC端用Claude Code接入MiniMax模型

    与MiniMax斗智斗勇III:PC端用Claude Code接入MiniMax模型

    2026年3月12日
    2
  • 射灯怎么安装图解_牛眼灯安装图解法

    射灯怎么安装图解_牛眼灯安装图解法炫派照明多光色晶元芯片LED轨道灯,静音风扇智能散热,风神Ⅱ导轨射灯智能散热导轨射灯风神Ⅱ灯体支架高碳钢材质,连接牢固不易滑落,360度旋转顺畅,全方位调节照射角度,感受无死角的光线触感。与灯体主色彩射灯安装图示融为一体,统一的美感低调的华贵,烤漆漆皮带来舒适光滑的质感,使整个射灯看起来精致完美。雷士照明LED家居客厅轨道射灯,电视背景照明灯,TLN204黑白双色家居黑白轨道射灯雷士照明轨道射灯椭…

    2025年8月14日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号