python 模板匹配原理与实战

python 模板匹配原理与实战1 简述为了让大家不至于看到后面的公式就退却 我先简单描述一下模板匹配的原理 简单来说 模板匹配就是你拿一个模板 图片 在目标图片上依次滑动 每次计算模板与模板下方的子图的相似度 最后我们就计算出了非常多的相似度 如果你只是单个目标的匹配 那你只需要取相似度最大值所在的位置就可以得出匹配位置 如果你要匹配多个目标 那就设定一个阈值 就是说 只要咋俩的相似度大于比如 0 8 我就认为你是我要匹配的目标 2 原理 2 1 原理步骤你有一张模板图像 TTT 和一张较大的待搜索图像 III 模板匹配是

1. 简述

为了让大家不至于看到后面的公式就退却,我先简单描述一下模板匹配的原理:

  • 简单来说,模板匹配就是你拿一个模板(图片)在目标图片上依次滑动,每次计算模板与模板下方的子图的相似度,最后我们就计算出了非常多的相似度;
  • 如果你只是单个目标的匹配,那你只需要取相似度最大值所在的位置就可以得出匹配位置;
  • 如果你要匹配多个目标,那就设定一个阈值,就是说,只要咋俩的相似度大于比如0.8,我就认为你是我要匹配的目标。

2. 原理

2.1 计算步骤

  • 你有一张模板图像 T T T和一张较大的待搜索图像 I I I,模板匹配是一种用于在较大图像中搜索和查找模板图像位置的方法。
  • 具体就是将模板图​​像滑动到输入图像上(就像在卷积操作一样),然后在模板图像下比较模板和输入图像的子图的相似度(以下会介绍几种不同的相似度度量方法)。
  • 它返回一个灰度图像,其中每个像素表示该像素的邻域与模板匹配的相似度。如果输入图像的大小(WxH)和模板图像的大小(wxh),则输出图像的大小将为(W-w + 1,H-h + 1)
  • 获得相似度图像之后,在其上查找最大相似度所在的像素。将其作为匹配区域矩形的左上角,并以(w,h)作为矩形的宽度和高度。该矩形是与模板匹配的区域。
  • 下面放da张图,免得大家看得太枯燥。大概用省略号的方式表示滑动操作:
    在这里插入图片描述

2.2 相似度度量指标

  • 差值平方和匹配 CV_TM_SQDIFF
  • 标准化差值平方和匹配 CV_TM_SQDIFF_NORMED
  • 相关匹配 CV_TM_CCORR
  • 标准相关匹配 CV_TM_CCORR_NORMED
  • 相关匹配 CV_TM_CCOEFF
  • 标准相关匹配 CV_TM_CCOEFF_NORMED

下面的描述多数是公式,其中 T T T表示模板图像, I I I表示目标图像$, R R R表示相似度矩阵
为了简化表示,下述公式仅表示模板与图像中某个位置 ( x , y ) (x, y) (x,y)的相似度函数

2.2.1 差值平方和匹配 CV_TM_SQDIFF

  • 原理: 计算模板与某个子图的对应像素的差值平方和。
  • 越相似该值越小
  • R ( x , y ) = ∑ x ′ , y ′ ( T ( x ′ , y ′ ) − I ( x + x ′ , y + y ′ ) ) 2 R(x, y) = \sum_{x’,y’}{(T(x’, y’) – I(x+x’, y+y’))^2} R(x,y)=x,y(T(x,y)I(x+x,y+y))2

其中, ( x , y ) (x, y) (x,y)是相对于目标大图I左上角的坐标, ( x ′ , y ′ ) (x’, y’) (x,y)是相对于模板或者当前子图的左上角的坐标,那么 ( x + x ′ , y + y ′ ) (x+x’, y+y’) (x+x,y+y)就是当前子图上的某个点 ( x ′ , y ′ ) (x’, y’) (x,y)相对于目标大图的绝对坐标。

2.2.2 标准化差值平方和匹配 CV_TM_SQDIFF_NORMED

  • 标准化的差值平方和
  • 越相似该值越小
  • R ( x , y ) = ∑ x ′ , y ′ ( T ( x ′ , y ′ ) − I ( x + x ′ , y + y ′ ) ) 2 ∑ x ′ , y ′ T ( x ′ , y ′ ) 2 ∑ x ′ , y ′ I ( x + x ′ , y + y ′ ) 2 R(x, y) = \frac{\sum_{x’,y’}{(T(x’, y’) – I(x+x’, y+y’))^2}}{\sqrt{\sum_{x’, y’}{T(x’, y’)^2}\sum_{x’, y’}{I(x+x’, y+y’)^2}}} R(x,y)=x,yT(x,y)2x,yI(x+x,y+y)2
    x,y(T(x,y)I(x+x,y+y))2

这种标准化操作可以保证当模板和图像各个像素的亮度都乘上了同一个系数时,相关度不发生变化。也就是说当 I ( x , y ) I(x,y) I(x,y) T ( x , y ) T(x,y) T(x,y)变为 k × I ( x , y ) k×I(x,y) k×I(x,y) k × T ( x , y ) k×T(x,y) k×T(x,y)时, R ( x , y ) R(x,y) R(x,y)不发生变化。

2.2.3 相关匹配 CV_TM_CCORR

  • 模板与子图对应位置相乘,可以将其看作是差值平方和平方项展开之后中间的那个 2 a b 2ab 2ab
  • 越相似该值越大
  • R ( x , y ) = ∑ x ′ , y ′ ( T ( x ′ , y ′ ) × I ( x + x ′ , y + y ′ ) ) R(x, y) = \sum_{x’,y’}{(T(x’, y’) \times I(x+x’, y+y’))} R(x,y)=x,y(T(x,y)×I(x+x,y+y))

2.2.4 标准相关匹配 CV_TM_CCORR_NORMED

  • 标准化的相关匹配,
  • 和标准化差值平方和匹配类似,都是去除了亮度线性变化对相似度计算的影响。可以保证图像和模板同时变亮或变暗k倍时结果不变。
  • 越相似该值越大
  • R ( x , y ) = ∑ x ′ , y ′ ( T ( x ′ , y ′ ) × I ( x + x ′ , y + y ′ ) ) ∑ x ′ , y ′ T ( x ′ , y ′ ) 2 ∑ x ′ , y ′ I ( x + x ′ , y + y ′ ) 2 R(x, y) = \frac{\sum_{x’,y’}{(T(x’, y’) \times I(x+x’, y+y’))}}{\sqrt{\sum_{x’, y’}{T(x’, y’)^2}\sum_{x’, y’}{I(x+x’, y+y’)^2}}} R(x,y)=x,yT(x,y)2x,yI(x+x,y+y)2
    x,y(T(x,y)×I(x+x,y+y))

2.2.5 相关匹配 CV_TM_CCOEFF

  • 这种方法也叫做相关匹配,但是,这里是把图像和模板都减去了各自的平均值,使得这两幅图像都没有直流分量。
  • 越相似该值越大

T ′ ( x , y ) = T ( x , y ) − ∑ x ′ , y ′ T ( x ′ , y ′ ) w × h T'(x,y)=T(x,y)-\frac{\sum_{x’, y’}{T(x’, y’)}}{w \times h} T(x,y)=T(x,y)w×hx,yT(x,y)

I ′ ( x , y ) = I ( x , y ) − ∑ x ′ , y ′ I ( x ′ , y ′ ) w × h I'(x,y)=I(x,y)-\frac{\sum_{x’, y’}{I(x’, y’)}}{w \times h} I(x,y)=I(x,y)w×hx,yI(x,y)

R ( x , y ) = ∑ x ′ , y ′ ( T ′ ( x ′ , y ′ ) × I ′ ( x + x ′ , y + y ′ ) ) R(x, y) = \sum_{x’,y’}{(T'(x’, y’) \times I'(x+x’, y+y’))} R(x,y)=x,y(T(x,y)×I(x+x,y+y))

2.2.6 标准相关匹配 CV_TM_CCOEFF_NORMED

  • 具体的说,就是在减去了各自的平均值之外,还要各自除以各自的方差。
  • 经过减去平均值和除以方差这么两步操作之后,无论是我们的目标图像还是模板都被标准化了,这样可以保证图像和模板分别改变光照不影响计算结果。
  • 越相似该值越大
  • 计算出的相关系数被限制在了 -1 到 1 之间,1 表示完全相同,-1 表示两幅图像的亮度正好相反,0 表示两幅图像之间没有线性关系。

T ′ ( x , y ) = T ( x , y ) − ∑ x ′ , y ′ T ( x ′ , y ′ ) w × h ∑ x ′ , y ′ T ( x ′ , y ′ ) 2 T'(x,y)=\frac{T(x,y)-\frac{\sum_{x’, y’}{T(x’, y’)}}{w \times h}}{\sqrt{\sum_{x’, y’}{T(x’, y’)^2}}} T(x,y)=x,yT(x,y)2
T(x,y)w×hx,yT(x,y)

I ′ ( x , y ) = I ( x , y ) − ∑ x ′ , y ′ I ( x ′ , y ′ ) w × h ∑ x ′ , y ′ I ( x ′ , y ′ ) 2 I'(x,y)=\frac{I(x,y)-\frac{\sum_{x’, y’}{I(x’, y’)}}{w \times h}}{\sum_{x’, y’}{I(x’, y’)^2}} I(x,y)=x,yI(x,y)2I(x,y)w×hx,yI(x,y)

R ( x , y ) = ∑ x ′ , y ′ ( T ′ ( x ′ , y ′ ) × I ′ ( x + x ′ , y + y ′ ) ) R(x, y) = \sum_{x’,y’}{(T'(x’, y’) \times I'(x+x’, y+y’))} R(x,y)=x,y(T(x,y)×I(x+x,y+y))

3. python实战

3.1 单模板匹配单个目标(同时测试不同的相似度度量指标)

import cv2 from matplotlib import pyplot as plt img = cv2.imread('image3.png', 0) img2 = img.copy() template = cv2.imread('roi3.png', 0) w, h = template.shape[::-1] # All the 6 methods for comparison in a list methods = ['cv2.TM_CCOEFF', 'cv2.TM_CCOEFF_NORMED', 'cv2.TM_CCORR', 'cv2.TM_CCORR_NORMED', 'cv2.TM_SQDIFF', 'cv2.TM_SQDIFF_NORMED'] plt.subplot(4, 2, 1) plt.imshow(template, cmap='gray') plt.title('Template Image'), plt.xticks([]), plt.yticks([]) plt.subplot(4, 2, 2) plt.imshow(img, cmap='gray') plt.title('Target Image'), plt.xticks([]), plt.yticks([]) for i, meth in enumerate(methods): img = img2.copy() method = eval(meth) # Apply template Matching res = cv2.matchTemplate(img, template, method) min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res) # If the method is TM_SQDIFF or TM_SQDIFF_NORMED, take minimum if method in [cv2.TM_SQDIFF, cv2.TM_SQDIFF_NORMED]: top_left = min_loc else: top_left = max_loc bottom_right = (top_left[0] + w, top_left[1] + h) cv2.rectangle(img, top_left, bottom_right, 255, 2) plt.subplot(4, 2, i+3) plt.imshow(img, cmap='gray') plt.title('Matching Result by {}'.format(meth)), plt.xticks([]), plt.yticks([]) plt.show() 

在这里插入图片描述

3.2 单模板匹配多个目标

import cv2 import numpy as np from matplotlib import pyplot as plt img_rgb = cv2.imread('image1.jpg') img_gray = cv2.cvtColor(img_rgb, cv2.COLOR_BGR2GRAY) template = cv2.imread('roi1.png', 0) w, h = template.shape[::-1] plt.subplot(131) plt.imshow(template) plt.subplot(132) plt.imshow(img_rgb) res = cv2.matchTemplate(img_gray,template,cv2.TM_CCOEFF_NORMED) threshold = 0.8 loc = np.where(res >= threshold) for pt in zip(*loc[::-1]): cv2.rectangle(img_rgb, pt, (pt[0] + w, pt[1] + h), (255, 255, 255), 2) plt.subplot(133) plt.imshow(img_rgb) plt.show() 

在这里插入图片描述

3.3 多模板匹配多个目标

import cv2 import numpy as np from matplotlib import pyplot as plt img_rgb = cv2.imread('image4.jpg') img_gray = cv2.cvtColor(img_rgb, cv2.COLOR_BGR2GRAY) template1 = cv2.imread('roi4_1.png', 0) template2 = cv2.imread('roi4_2.png', 0) template3 = cv2.imread('roi4_3.png', 0) template_list = ['roi4_1.png', 'roi4_2.png', 'roi4_3.png'] w1, h1 = template1.shape[::-1] w2, h2 = template1.shape[::-1] w3, h3 = template1.shape[::-1] plt.subplot(131) plt.imshow(template1) plt.subplot(132) plt.imshow(template2) plt.subplot(133) plt.imshow(template3) plt.show() for i in range(len(template_list)): template = cv2.imread(template_list[i], 0) w, h = template.shape[::-1] res = cv2.matchTemplate(img_gray, template, cv2.TM_CCOEFF_NORMED) threshold = 0.65 loc = np.where(res >= threshold) for pt in zip(*loc[::-1]): gray = int(255/(i+1)) cv2.rectangle(img_rgb, pt, (pt[0] + w, pt[1] + h), (gray, gray, gray), 2) plt.imshow(img_rgb) plt.show() 

在这里插入图片描述
在这里插入图片描述

4. 算法优化

4.1 速度优化

这一块我没有看过opencv的优化方法,但是可想而知,直接滑动窗口效率是极其低下的,他们一定不会用这种方法。

  • 我看到的一些相关文章,我没仔细看,放个链接
    https://www.cnblogs.com/imageshop/p/6108764.html
  • 另外我自己的一点想法,因为之前看过卷积网络的卷积优化,而卷积操作的原理就是滑动窗口,那么,就可以将滑动窗口操作改成矩阵运算,具体可以看我之前写过的github博客:各种卷积操作及其矩阵运算。

4.2 精度优化

  • 多尺度模板匹配
  • 旋转目标模板匹配
  • 非极大值抑制
    https://juejin.im/post/5ee51d4546d72d42ce
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/232876.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • java struts2 漏洞_struts2漏洞列表

    java struts2 漏洞_struts2漏洞列表【官方ID】S2-001【危害等级】高【受影响版本】WebWork2.1(开启altSyntax)WebWork2.2.0–WebWork2.2.5Struts2.0.0–Struts2.0.8【漏洞描述】altSyntax特性默认不开启,开启后,允许在文本串中注入OGNL表达式,且注入的表达式被逐层递归执行。攻击者可以在HTML中text域输入OGNL表达式,当form在服务器…

    2022年7月19日
    20
  • Java动态拼接SQL–02–Jpa「建议收藏」

    Java动态拼接SQL–02–Jpa「建议收藏」本篇进行Spring-data-jpa的介绍,几乎涵盖该框架的所有方面,在日常的开发当中,基本上能满足所有需求。这里不讲解JPA和Spring-data-jpa单独使用,所有的内容都是在和Spring整合的环境中实现。如果需要了解该框架的入门,百度一下,很多入门的介绍。在这篇文章的接下来一篇,会有一个系列来讲解mybatis,这个系列从mybatis的入门开始,到基本使用,和spring整合,和第

    2022年6月10日
    257
  • dynamic中文_dynamic cast

    dynamic中文_dynamic castC# 反射、与dynamic最佳组合

    2022年4月21日
    43
  • 什么是A记录  域名

    什么是A记录  域名

    2021年9月22日
    56
  • JavaScript之正则表达式的使用方法详细介绍[通俗易懂]

    JavaScript之正则表达式的使用方法详细介绍[通俗易懂]首先必须说明的是,这类文章(js正则表达式)在c站或者整个it类论坛是很多人写过的,而我认为我这篇的不同之处在于更加“小白”化,这也与我一贯的风格有关吧。关于JavaScript正则表达式,其他的文章大多一上来就太过激进,不利于初学者学习(我当粗就是这么被劝退的),这也是我为什么要坚持写这篇文章,希望小白在看了这篇文章后,不管能不能完全掌握JavaScript正则表达式,但至少对JavaScript正则表达式能有一个比较深刻的印象吧。

    2025年8月5日
    4
  • Python语言实现C-S架构–基于TCP通信[通俗易懂]

    Python语言实现C-S架构–基于TCP通信[通俗易懂]加粗样式@[TOC](http://blog.chinaunix.net/uid-26833883-id-3500874.html欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语…

    2022年8月8日
    4

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号