百度识图解析_蒙眼识字是什么原理

百度识图解析_蒙眼识字是什么原理百度识图原理分析推测其发展方向    2010年12月13日,百度推出相似图片搜索功能—百度识图(shitu.baidu.com),常规的图片搜索,是通过输入关键词的形式搜索到互联网上相关的图片资源,而百度识图则能实现用户通过上传图片或输入图片的url地址,从而搜索到互联网上与这张图片相似的其他图片资源,同时也能找到这张图片相关的信息。     百度的相似图片搜索识图

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

百度识图原理分析 推测其发展方向

 

   2010年12月13日,百度推出相似图片搜索功能—百度识图(shitu.baidu.com),常规的图片搜索,是通过输入关键词的形式搜索到互联网上相关的图片资源,而百度识图则能实现用户通过上传图片或输入图片的url地址,从而搜索到互联网上与这张图片相似的其他图片资源,同时也能找到这张图片相关的信息。  

百度识图解析_蒙眼识字是什么原理

   百度的相似图片搜索识图功能给大家提供两种搜索途径,一种是可以直接上传本地图片,另一个方式是输入图片的URL地址。无论是哪一种,从测试效果可看到,反应都很快。

 

针对这些笔者进行了几幅图的测试用以“肤浅”的分析百度识图的技术。

黑白图像测试

识图对于黑白图像,搜索结果是一样的。(不排除数据量少之类的情形)

测试不同类型的文件格式

主要针对gif动画的测试,测试结果为可以搜索到。应该为百度首先静态化了图像,或者说取了第一帧。

测试不同大小的文件

另外测试图像中,搜索结果中出现大小不同的图像,这说明百度是取像素点匹配的并且有固定取点个数。

测试黑白格子

百度识图解析_蒙眼识字是什么原理

这幅图像中,左边是搜索项,右边是结果,识图还可以把背景为该图片的搜索出来。

简单推论:

第一步:黑白图像,彩色的图片变成黑白的,并且通过技术扩大黑白差异。

第二步:取点,根据灰度的不同,赋予不同的值,并且用矩阵形式存储起来。取点越多,图片就越精确,反之则不够精确。

第三步:根据用户搜索寻找完全匹配、部分匹配、周围匹配(背景图)图片。

推测百度以后发展方向

A.判断照片类型,根据不同类型建设不同的模型(矩阵)来判定图片类型。

B.彩色和黑白可以很好的分开

C.精确判断gif帧

D.延伸图片相关图片

E.根据图片搜索视频

 

识图现在搜索结果还是不够理想,有很大的提升空间,下面介绍几个比较专业的图片搜索引擎。

一、http://images.google.com/imghp (旧版:http://similar-images.googlelabs.com/

Google实验室类似图片搜索:输入一个关键词后,例如“lake”,返回的页面里面点击某个图片的下面的Similarimages,运用Google类似图片搜索功能引擎,即刻为你把类似的图片全部搜索出来,展示给用户以便查看。其准确率、相似率相对比较高。

二:http://tineye.com/

Tineye是典型的以图找图搜索引擎,输入本地硬盘上的图片或者输入图片网址,即可自动帮你搜索相似图片,搜索准确度相对来说还比较令人满意。

三:http://www.gazopa.com/

GazoPa搜索图片时,不依据关键词进行检索,而是通过图片自身的某些特征(例如色彩,形状等信息)来进行搜索。GazoPa搜索方式有三种:

第一种是传统的通过关键词搜索图片

第二种是创新的通过图片搜索图片

第三种是通过手绘图片搜索图片,这种方式其实没太大用处

第四种是通过视频缩略图搜索视频

 

四、http://www.picitup.com/

Picitup是一个刚开始公测的专业图片搜索引擎,功能非常强大,并支持中文关键字的搜索,是国内图片爱好者的不错选择。

 

五、http://www.tiltomo.com/

Tiltomo是由Flickr开发的一个搜索工具,主要用来维护Flickr自己的图片数据库,其搜索算法主要是基于相似的主题风格或相似的色调和材质。

 

六、http://labs.ideeinc.com/upload/

Byo imagesearch是根据你上传的图片来搜索相似的图片,算法主要是基于色彩,也包括主题风格。

 

七、http://cn.bing.com/

Live.com允许你进行一次关键字搜索后再执行相似性的搜索。你可以为Live索引中的任意一张图片寻找相似的图片,但搜索结果看起来并不是很精确。

 

八、http://www.xcavator.net

Xcavator和Live.com很相似,你需要先输入一个关键字,然后在搜索结果中挑选一张图片,在根据这张图片的特点来进行搜索。

 

九、http://www.incogna.com

Incogna的搜索速度非常快,主要是基于色彩和形状上的相似性。

 

十、http://www.terragalleria.com

Terragalleria主要基于视觉上的相似性,而不考虑图片的内容。

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/195057.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • robots txt防爬虫[通俗易懂]

    robots txt防爬虫[通俗易懂]title:robots.txt防爬虫date:2018-07-1218:20:00tags:防坑指南categories:防坑指南事因:公司内部项目在百度搜索上输入名字会出现在搜索结果中,大佬们肯定不愿意啊,就需要禁止爬虫爬取。在项目根目录加入这个文件就行了。WHAT?::::::robots.txt是一个纯文本文件,是爬虫抓取网站的时候要查看的第一个文件,…

    2022年6月7日
    40
  • vim命令下显示行号[通俗易懂]

    vim默认不显示行号如何使vim命令显示行号?显示当前行行号在vim的命令模式下,在光标停留处,退出命令模式,然后输入:nu,即可显示当前这行的号码显示所有行号如果要显示该文件的所有行号,则需要在vim的命令模式下,输入:setnu,则可以显示该文件的所有行号取消所有行号如果要显示该文件的所有行号,则需要在vim的命令模式下输入,在光标停留处,退出命令模式,然后输入:setnonu,即可显示当前这行的号码这样的设置方法只能维持在,当前vim打开的文件…

    2022年4月11日
    115
  • 实现labelme批量json_to_dataset方法

    实现labelme批量json_to_dataset方法labelme可以帮助我们快速的实现Mask-RCNN中数据集json文件的生成,然而还需要我们进一步的将json转成dataset,可以直接在cmd中执行labelme_json_to_dataset.exeC:\Users\Administrator\Desktop\total\1.json(路径),但是这个过程需要我们一个json文件的生成,过程很慢。一、打开abelm…

    2022年9月11日
    0
  • Java递归调用_递归算法1加到100

    Java递归调用_递归算法1加到100递归用于解决什么样的问题?1)各种数学问题如:8皇后问题,汉诺塔,阶乘问题,迷宫问题,球和篮子的问题(google编程大赛)2)各种算法中也会使用到递归,比如快排,归并排序,二分查找,分治算法等.3)将用栈解决的问题–>递归代码比较简洁简单的说:递归就是方法自己调用自己,每次调用时传入不同的变量.递归有助于编程者解决复杂的问题,同时可以让代码变得简洁。递归需要遵守的重要规则:1…

    2022年9月2日
    2
  • Android之drawable state各个属性具体解释[通俗易懂]

    Android之drawable state各个属性具体解释

    2022年1月26日
    30
  • MATLAB中canny算子边缘检测「建议收藏」

    MATLAB中canny算子边缘检测「建议收藏」今天来介绍一下关于canny算子做边缘检测的过程:Canny的目标是找到一个最优的边缘检测算法,最优边缘检测的含义是:好的检测-算法能够尽可能多地标识出图像中的实际边缘。好的定位-标识出的边缘要与实际图像中的实际边缘尽可能接近。最小响应-图像中的边缘只能标识一次,并且可能存在的图像噪声不应标识为边缘。1、首先打开MATLAB软件,在其主界面中写入下列代码:I=imre…

    2022年5月8日
    274

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号