用Python做图像处理[通俗易懂]

用Python做图像处理[通俗易懂]用Python做图像处理最近在做一件比较evil的事情——验证码识别,以此来学习一些新的技能。因为我是初学,对图像处理方面就不太了解了,欲要利吾事,必先利吾器,既然只是做一下实验,那用Python来作原型开发再好不过了。在Python中,比较常用的图像处理库是PIL(PythonImageLibrary),当前版本是1.1.6,用起来非常方便。大家可以在

大家好,又见面了,我是你们的朋友全栈君。

用Python做图像处理
       最近在做一件比较 evil 的事情——验证码识别,以此来学习一些新的技能。因为我是初学,对图像处理方面就不太了解了,欲要利吾事,必先利吾器,既然只是做一下实验,那用 Python 来作原型开发再好不过了。在 Python 中,比较常用的图像处理库是 PIL(Python Image Library),当前版本是 1.1.6 ,用起来非常方便。大家可以在
http://www.pythonware.com/products/pil/index.htm 下载和学习。
       在这里,我主要是介绍一下做图像识别时可能会用到的一些 PIL 提供的功能,比如图像增强、还有滤波之类的。最后给出使用 Python 做图像处理与识别的优势与劣势。
基本图像处理
       使用 PIL 之前需要 import Image 模块:
import Image
       然后你就可以使用Image.open(‘xx.bmp’) 来打开一个位图文件进行处理了。打开文件你不用担心格式,也不用了解格式,无论什么格式,都只要把文件名丢给 Image.open 就可以了。真所谓 bmp、jpg、png、gif……,一个都不能少。
img = Image.open(‘origin.png’)    # 得到一个图像的实例对象 img
用Python做图像处理[通俗易懂]
图 1原图
       图像处理中,最基本的就是色彩空间的转换。一般而言,我们的图像都是 RGB 色彩空间的,但在图像识别当中,我们可能需要转换图像到灰度图、二值图等不同的色彩空间。 PIL 在这方面也提供了极完备的支持,我们可以:
new_img = img.convert(‘L’)
把 img 转换为 256 级灰度图像, convert() 是图像实例对象的一个方法,接受一个 mode 参数,用以指定一种色彩模式,mode 的取值可以是如下几种:
· 1 (1-bit pixels, black and white, stored with one pixel per byte)
· L (8-bit pixels, black and white)
· P (8-bit pixels, mapped to any other mode using a colour palette)
· RGB (3×8-bit pixels, true colour)
· RGBA (4×8-bit pixels, true colour with transparency mask)
· CMYK (4×8-bit pixels, colour separation)
· YCbCr (3×8-bit pixels, colour video format)
· I (32-bit signed integer pixels)
· F (32-bit floating point pixels)
怎么样,够丰富吧?其实如此之处,PIL 还有限制地支持以下几种比较少见的色彩模式:LA (L with alpha), RGBX (true colour with padding) and RGBa (true colour with premultiplied alpha)。
下面看一下 mode 为 ‘1’、’L’、’P’时转换出来的图像:
用Python做图像处理[通俗易懂]
图 2 mode = ‘1’
用Python做图像处理[通俗易懂]
图 3 mode = ‘L’
用Python做图像处理[通俗易懂]
图 4 mode = ‘P’
convert() 函数也接受另一个隐含参数 matrix,转换矩阵 matrix 是一个长度为4 或者16 tuple。下例是一个转换 RGB 空间到 CIE XYZ 空间的例子:
    rgb2xyz = (
        0.412453, 0.357580, 0.180423, 0,
        0.212671, 0.715160, 0.072169, 0,
        0.019334, 0.119193, 0.950227, 0 )
    out = im.convert(“RGB”, rgb2xyz)
       除了完备的色彩空间转换能力外, PIL 还提供了resize()、rotate()等函数以获得改变大小,旋转图片等几何变换能力,在图像识别方面,图像实例提供了一个 histogram() 方法来计算直方图,非常方便实用。
图像增强
       图像增强通常用以图像识别之前的预处理,适当的图像增强能够使得识别过程达到事半功倍的效果。 PIL 在这方面提供了一个名为 ImageEnhance 的模块,提供了几种常见的图像增强方案:
import ImageEnhance
enhancer = ImageEnhance.Sharpness(image)
for i in range(8):
    factor = i / 4.0
    enhancer.enhance(factor).show(“Sharpness %f” % factor)
上面的代码即是一个典型的使用 ImageEnhance 模块的例子。 Sharpness 是 ImageEnhance 模块的一个类,用以锐化图片。这一模块主要包含如下几个类:Color、Brightness、Contrast和Sharpness。它们都有一个共同的接口 .enhance(factor) ,接受一个浮点参数 factor,标示增强的比例。下面看看这四个类在不同的 factor 下的效果
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
图 5 使用Color 进行色彩增强,factor 取值 [0, 4],步进 0.5
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
图 6 用 Birghtness 增强亮度,factor取值[0,4],步进0.5
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
图 7用 Contrast 增强对比度, factor 取值 [0,4],步进0.5
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
用Python做图像处理[通俗易懂]
图 8用 Sharpness 锐化图像,factor取值 [0,4],步进0.5
图像 Filter
       PIL 在 Filter 方面的支持是非常完备的,除常见的模糊、浮雕、轮廓、边缘增强和平滑,还有中值滤波、ModeFilter等,简直方便到可以做自己做一个Photoshop。这些 Filter 都放置在 ImageFilter 模块中,ImageFilter主要包括两部分内容,一是内置的 Filter,如 BLUR、DETAIL等,另一部分是 Filter 函数,可以指定不同的参数获得不同的效果。示例如下:
import ImageFilter
im1 = im.filter(ImageFilter.BLUR)
im2 = im.filter(ImageFilter.MinFilter(3))
im3 = im.filter(ImageFilter.MinFilter()) # same as MinFilter(3)
可以看到 ImageFilter 模块的使用非常简单,每一个 Filter 都只需要一行代码就可调用,开发效率非常高。
 
用Python做图像处理[通俗易懂]
图 9使用 BLUR
用Python做图像处理[通俗易懂]
图 10使用 CONTOUR
用Python做图像处理[通俗易懂]
图 11使用 DETAIL
用Python做图像处理[通俗易懂]
图 12使用 EMBOSS
用Python做图像处理[通俗易懂]
图 13使用 EDGE_ENHANCE
用Python做图像处理[通俗易懂]
图 14使用 EDGE_ENHANCE_MORE
用Python做图像处理[通俗易懂]
图 15使用 FIND_EDGES
用Python做图像处理[通俗易懂]
图 16使用 SHARPEN
用Python做图像处理[通俗易懂]
图 17使用 SMOOTH
用Python做图像处理[通俗易懂]
图 18使用 SMOOTH_MORE
       以上是几种内置的 Filter 的效果图,除此之外, ImageFilter 还提供了一些 Filter 函数,下面我们来看看这些可以通过参数改变行为的 Filter 的效果:
用Python做图像处理[通俗易懂]
图 19使用 Kernel(),参数:size = (3, 3), kernel = (0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5)
用Python做图像处理[通俗易懂]
图 20使用 MaxFilter,默认参数
用Python做图像处理[通俗易懂]
图 21使用 MinFilter,默认参数
用Python做图像处理[通俗易懂]
图 22使用 MedianFilter,默认参数
用Python做图像处理[通俗易懂]
图 23使用 ModeFilter,参数 size = 3
用Python做图像处理[通俗易懂]
图 24使用 RankFilter,参数 size = 3, rank = 3
小结
       到此,对 PIL 的介绍就告一段落了。总的来说,对于图像处理和识别,PIL 内建了强大的支持,从各种增强算法到 Filter ,都让人无法怀疑使用 Python 的可行性。 Python唯一的劣势在于执行时间过慢,特别是当实现一些计算量大的算法时候,需要极强的耐心。我曾用 Hough Transform(霍夫变换)来查找图像中的直线,纯 Python 的实现处理一个 340 * 100 的图片也要花去数秒时间(P4 3.0G + 1G memory)。但使用 PIL 无需关注图像格式、内建的图像增强算法和 Filter 算法,这些优点使 Python 适合用于构造原型和进行实验,在这两方面Python 比 matlab 更加方便。商业的图像识别产品开发,可以考虑已经被 boost accepted的来自 adobe 的开源 C++ 库 gil,可以兼顾执行性能和开发效率。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/145304.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • turtle画曲线_心形曲线图

    turtle画曲线_心形曲线图这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式欢迎使用Markdown编辑器你好!这是你第一次使用Markdown编辑器所展示的欢迎页。如果你想学习如何使用Markdown编辑器,可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。

    2022年10月9日
    2
  • 开关量电压转换电路

    开关量电压转换电路单片机的I/O口承受输入电压一般是-5V到 +5V,如果一个开关接的距离比较远,就容易受到线路干扰、线缆本身的电阻率影响导致MCU无法识别。虽然MCU的I/O的输入是“高阻抗”的,但是还是很难确保远距离后的影响。  左边可以输入0~12V,右边可以很稳定的输出0~5V

    2022年5月5日
    40
  • 深度学习 机器学习 数据集资源汇总

    深度学习 机器学习 数据集资源汇总目前个人认为较好的数据集网站主要有:数据集网站1.AIStudio数据集:开放数据集-百度AIStudio-人工智能学习与实训社区2.天池数据集:数据集-阿里系唯一对外开放数据分享平台3.PapersWithCode数据集:MachineLearningDatasets|PapersWithCode4.Kaggle数据集:FindOpenDatasetsandMachineLearningProjects|Kaggle5.GravitiO

    2022年7月17日
    29
  • 纸的大小图解_常用纸张尺寸及示意图(A0,A1A3,A4,A5A8)数据源维基百科.PDF

    纸的大小图解_常用纸张尺寸及示意图(A0,A1A3,A4,A5A8)数据源维基百科.PDF常用纸张尺寸及示意图(A0,A1A3,A4,A5A8)数据源维基百科mFPCharging-常用纸张尺寸说明2011-12-09v2.0常用纸张尺寸及示意图(A0,A1…A3,A4,A5…A8)数据源:维基百科标准定义ISO216定义了A、B、C三个系列的纸张尺寸。C系列纸张尺寸主要使用于信封。ISO216的格式遵循着的比率;放在一起的两张纸有着…

    2022年6月20日
    66
  • 在线html代码生成器,支持网页快速排版 CSS代码一键生成的在线设计工具

    在线html代码生成器,支持网页快速排版 CSS代码一键生成的在线设计工具用户体验现在作为很多工作的重中之重,设计师们更要把用户体验放在第一位,如果你曾经尝试过想把你的板面调整到最适合阅读的状态,就会知道多么令人抓狂。但是懒人总是会创造出新科技,国外开发者为我们带来了今天要讲的协助设计网页排版及字型等相关属性的便利工具。typeanything前段时间登上国外媒体网站后深获好评,这是一项非常方便的在线工具,功能设计很简单,主要提供一段文章模板(里头包含h1、h2…

    2022年5月11日
    130
  • oracle更改用户的密码

    oracle更改用户的密码第一种情况,不知道该用户的密码,以管理员身份或者其他有权限的用户更改。1、以system或者sys的身份登录。登录语句sqlplus system/psw@ora_name或者sqlplus  sys/psw@ora_name assysdba。2、alter语句修改用户user1的密码。alter user  user1 identified bynew_psw;3

    2022年7月28日
    7

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号