百度识图解析_蒙眼识字是什么原理

百度识图解析_蒙眼识字是什么原理百度识图原理分析推测其发展方向    2010年12月13日,百度推出相似图片搜索功能—百度识图(shitu.baidu.com),常规的图片搜索,是通过输入关键词的形式搜索到互联网上相关的图片资源,而百度识图则能实现用户通过上传图片或输入图片的url地址,从而搜索到互联网上与这张图片相似的其他图片资源,同时也能找到这张图片相关的信息。     百度的相似图片搜索识图

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

百度识图原理分析 推测其发展方向

 

   2010年12月13日,百度推出相似图片搜索功能—百度识图(shitu.baidu.com),常规的图片搜索,是通过输入关键词的形式搜索到互联网上相关的图片资源,而百度识图则能实现用户通过上传图片或输入图片的url地址,从而搜索到互联网上与这张图片相似的其他图片资源,同时也能找到这张图片相关的信息。  

百度识图解析_蒙眼识字是什么原理

   百度的相似图片搜索识图功能给大家提供两种搜索途径,一种是可以直接上传本地图片,另一个方式是输入图片的URL地址。无论是哪一种,从测试效果可看到,反应都很快。

 

针对这些笔者进行了几幅图的测试用以“肤浅”的分析百度识图的技术。

黑白图像测试

识图对于黑白图像,搜索结果是一样的。(不排除数据量少之类的情形)

测试不同类型的文件格式

主要针对gif动画的测试,测试结果为可以搜索到。应该为百度首先静态化了图像,或者说取了第一帧。

测试不同大小的文件

另外测试图像中,搜索结果中出现大小不同的图像,这说明百度是取像素点匹配的并且有固定取点个数。

测试黑白格子

百度识图解析_蒙眼识字是什么原理

这幅图像中,左边是搜索项,右边是结果,识图还可以把背景为该图片的搜索出来。

简单推论:

第一步:黑白图像,彩色的图片变成黑白的,并且通过技术扩大黑白差异。

第二步:取点,根据灰度的不同,赋予不同的值,并且用矩阵形式存储起来。取点越多,图片就越精确,反之则不够精确。

第三步:根据用户搜索寻找完全匹配、部分匹配、周围匹配(背景图)图片。

推测百度以后发展方向

A.判断照片类型,根据不同类型建设不同的模型(矩阵)来判定图片类型。

B.彩色和黑白可以很好的分开

C.精确判断gif帧

D.延伸图片相关图片

E.根据图片搜索视频

 

识图现在搜索结果还是不够理想,有很大的提升空间,下面介绍几个比较专业的图片搜索引擎。

一、http://images.google.com/imghp (旧版:http://similar-images.googlelabs.com/

Google实验室类似图片搜索:输入一个关键词后,例如“lake”,返回的页面里面点击某个图片的下面的Similarimages,运用Google类似图片搜索功能引擎,即刻为你把类似的图片全部搜索出来,展示给用户以便查看。其准确率、相似率相对比较高。

二:http://tineye.com/

Tineye是典型的以图找图搜索引擎,输入本地硬盘上的图片或者输入图片网址,即可自动帮你搜索相似图片,搜索准确度相对来说还比较令人满意。

三:http://www.gazopa.com/

GazoPa搜索图片时,不依据关键词进行检索,而是通过图片自身的某些特征(例如色彩,形状等信息)来进行搜索。GazoPa搜索方式有三种:

第一种是传统的通过关键词搜索图片

第二种是创新的通过图片搜索图片

第三种是通过手绘图片搜索图片,这种方式其实没太大用处

第四种是通过视频缩略图搜索视频

 

四、http://www.picitup.com/

Picitup是一个刚开始公测的专业图片搜索引擎,功能非常强大,并支持中文关键字的搜索,是国内图片爱好者的不错选择。

 

五、http://www.tiltomo.com/

Tiltomo是由Flickr开发的一个搜索工具,主要用来维护Flickr自己的图片数据库,其搜索算法主要是基于相似的主题风格或相似的色调和材质。

 

六、http://labs.ideeinc.com/upload/

Byo imagesearch是根据你上传的图片来搜索相似的图片,算法主要是基于色彩,也包括主题风格。

 

七、http://cn.bing.com/

Live.com允许你进行一次关键字搜索后再执行相似性的搜索。你可以为Live索引中的任意一张图片寻找相似的图片,但搜索结果看起来并不是很精确。

 

八、http://www.xcavator.net

Xcavator和Live.com很相似,你需要先输入一个关键字,然后在搜索结果中挑选一张图片,在根据这张图片的特点来进行搜索。

 

九、http://www.incogna.com

Incogna的搜索速度非常快,主要是基于色彩和形状上的相似性。

 

十、http://www.terragalleria.com

Terragalleria主要基于视觉上的相似性,而不考虑图片的内容。

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/195057.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • linux抓包命令并生成文件_linux抓包指定端口

    linux抓包命令并生成文件_linux抓包指定端口tcpflow实际上也是一个抓包工具,这个抓包工具与tcpdump不同的是它是以流为单位显示数据内容,而cpdump以包为单位显示数据。我们平常会经常分析HTTP数据,用tcpflow会更便捷,且tcpflow看起来会更加直观些。#截取本机(192.168.31.147)和主机114.114.114.114之间的数据tcpdump-n-ieth0host192.168.31.147an…

    2022年8月22日
    3
  • ireport使用教程_计算机初学者入门教程

    ireport使用教程_计算机初学者入门教程一、iReport 是什么    iReport是一个能够创建复杂报表的开源项目,并且它能调用JasperReports库应用于任何一种Java应用程序。本身是分布式的且由符合GNU通用公共许可的百分之百纯java编写。由于它丰富的图形界面,你能够很快的创建出任何一种你想要的报表。iReport能够让我们提高技术方面的信心,比如它能降低学习JasperReports的XML语法的难

    2022年9月11日
    0
  • vue父组件调用子组件属性_vue子组件获取父组件实例

    vue父组件调用子组件属性_vue子组件获取父组件实例在vue2中,子组件调用父组件,直接使用this.$emit()即可。但是在vue3中,很显然使用this.$emit()已经开始报错了,为什么会报错呢?原因是:在vue3中setup是在声明周期beforeCreate和created前执行,此时vue对象还未创建,因此我们无法使用this。那么我们在vue3中,子组件该如何调用父组件的函数呢?方法一:首先写一个Child.vue,重点在setup函数中引入context形参,配合emit使用。定义了两个函数,toFather

    2022年9月28日
    0
  • IOS框架概览

    IOS框架概览

    2021年12月4日
    39
  • Cocos移植Android-Android.mk编译后的文件

    Cocos移植Android-Android.mk编译后的文件

    2021年12月31日
    34
  • siamfc++代码_c语言代码怎么理解

    siamfc++代码_c语言代码怎么理解文章目录前言一、论文翻译二、论文代码1.backbone网络前言记录自己阅读复现SiamFC的全过程,包括论文翻译,代码理解等一、论文翻译论文原文:链接:https://pan.baidu.com/s/1wvXra0Ji6L9IMVZikaUs9Q提取码:s7t3本文是Siam系列跟踪论文的开篇之作,兼容了速度与精度,引起跟踪社区极大的关注。论文中对一些细节描述分非常充分,适合精读本文。二、论文代码代码参考;https://github.com/HonglinChu/SiamTra.

    2022年9月30日
    0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号