百度识图解析_蒙眼识字是什么原理

百度识图解析_蒙眼识字是什么原理百度识图原理分析推测其发展方向    2010年12月13日,百度推出相似图片搜索功能—百度识图(shitu.baidu.com),常规的图片搜索,是通过输入关键词的形式搜索到互联网上相关的图片资源,而百度识图则能实现用户通过上传图片或输入图片的url地址,从而搜索到互联网上与这张图片相似的其他图片资源,同时也能找到这张图片相关的信息。     百度的相似图片搜索识图

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

百度识图原理分析 推测其发展方向

 

   2010年12月13日,百度推出相似图片搜索功能—百度识图(shitu.baidu.com),常规的图片搜索,是通过输入关键词的形式搜索到互联网上相关的图片资源,而百度识图则能实现用户通过上传图片或输入图片的url地址,从而搜索到互联网上与这张图片相似的其他图片资源,同时也能找到这张图片相关的信息。  

百度识图解析_蒙眼识字是什么原理

   百度的相似图片搜索识图功能给大家提供两种搜索途径,一种是可以直接上传本地图片,另一个方式是输入图片的URL地址。无论是哪一种,从测试效果可看到,反应都很快。

 

针对这些笔者进行了几幅图的测试用以“肤浅”的分析百度识图的技术。

黑白图像测试

识图对于黑白图像,搜索结果是一样的。(不排除数据量少之类的情形)

测试不同类型的文件格式

主要针对gif动画的测试,测试结果为可以搜索到。应该为百度首先静态化了图像,或者说取了第一帧。

测试不同大小的文件

另外测试图像中,搜索结果中出现大小不同的图像,这说明百度是取像素点匹配的并且有固定取点个数。

测试黑白格子

百度识图解析_蒙眼识字是什么原理

这幅图像中,左边是搜索项,右边是结果,识图还可以把背景为该图片的搜索出来。

简单推论:

第一步:黑白图像,彩色的图片变成黑白的,并且通过技术扩大黑白差异。

第二步:取点,根据灰度的不同,赋予不同的值,并且用矩阵形式存储起来。取点越多,图片就越精确,反之则不够精确。

第三步:根据用户搜索寻找完全匹配、部分匹配、周围匹配(背景图)图片。

推测百度以后发展方向

A.判断照片类型,根据不同类型建设不同的模型(矩阵)来判定图片类型。

B.彩色和黑白可以很好的分开

C.精确判断gif帧

D.延伸图片相关图片

E.根据图片搜索视频

 

识图现在搜索结果还是不够理想,有很大的提升空间,下面介绍几个比较专业的图片搜索引擎。

一、http://images.google.com/imghp (旧版:http://similar-images.googlelabs.com/

Google实验室类似图片搜索:输入一个关键词后,例如“lake”,返回的页面里面点击某个图片的下面的Similarimages,运用Google类似图片搜索功能引擎,即刻为你把类似的图片全部搜索出来,展示给用户以便查看。其准确率、相似率相对比较高。

二:http://tineye.com/

Tineye是典型的以图找图搜索引擎,输入本地硬盘上的图片或者输入图片网址,即可自动帮你搜索相似图片,搜索准确度相对来说还比较令人满意。

三:http://www.gazopa.com/

GazoPa搜索图片时,不依据关键词进行检索,而是通过图片自身的某些特征(例如色彩,形状等信息)来进行搜索。GazoPa搜索方式有三种:

第一种是传统的通过关键词搜索图片

第二种是创新的通过图片搜索图片

第三种是通过手绘图片搜索图片,这种方式其实没太大用处

第四种是通过视频缩略图搜索视频

 

四、http://www.picitup.com/

Picitup是一个刚开始公测的专业图片搜索引擎,功能非常强大,并支持中文关键字的搜索,是国内图片爱好者的不错选择。

 

五、http://www.tiltomo.com/

Tiltomo是由Flickr开发的一个搜索工具,主要用来维护Flickr自己的图片数据库,其搜索算法主要是基于相似的主题风格或相似的色调和材质。

 

六、http://labs.ideeinc.com/upload/

Byo imagesearch是根据你上传的图片来搜索相似的图片,算法主要是基于色彩,也包括主题风格。

 

七、http://cn.bing.com/

Live.com允许你进行一次关键字搜索后再执行相似性的搜索。你可以为Live索引中的任意一张图片寻找相似的图片,但搜索结果看起来并不是很精确。

 

八、http://www.xcavator.net

Xcavator和Live.com很相似,你需要先输入一个关键字,然后在搜索结果中挑选一张图片,在根据这张图片的特点来进行搜索。

 

九、http://www.incogna.com

Incogna的搜索速度非常快,主要是基于色彩和形状上的相似性。

 

十、http://www.terragalleria.com

Terragalleria主要基于视觉上的相似性,而不考虑图片的内容。

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/195057.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 登录双微信怎么登_windows设置多用户远程登录

    登录双微信怎么登_windows设置多用户远程登录QQ都能登录两个,为啥微信不行。其实微信也可以,让笔者来教教大家第一步:新建一个文本第二步:输入以下内容startD:\Tencent\WeChat\WeChat.exestartD:\

    2022年8月1日
    5
  • Pytorch-BN层详细解读

    Pytorch-BN层详细解读Pytorch-BN层BN解决了InternalCovariateShift问题机器学习领域有个很重要的假设:独立同分布假设,即假设训练数据和测试数据是满足相同分布的。我们知道:神经网络的训练实际上就是在拟合训练数据的分布。如果不满足独立同分布假设,那么训练得到的模型的泛化能力肯定不好。再来思考一个问题:为什么传统的神经网络要求将数据归一化(训练阶段将训练数据归一化并记录均值和方差,测试…

    2022年10月14日
    2
  • linux环境安装mariadb,linux环境下安装Mariadb

    linux环境安装mariadb,linux环境下安装Mariadb一、下载安装mariadb是属于mysql的一个分支,是其创始人在mysql被卖给oracle之后重新分出来的,maria取自于他女儿的名字。mariadb完全兼容于mysql,在很多新版本的linux系统中,mysql都已经被替换成了mariadb。mariadb的官网:mariadb官网,下载地址:下载地址。最新稳定版本的下载直链为:wgethttps://downloads.mariadb…

    2022年6月8日
    207
  • STN(Spatial Transformer Networks)

    STN(Spatial Transformer Networks)上一篇介绍了通道注意力机制SENET,有兴趣的同学可以去看一下SENET.

    2022年10月18日
    0
  • springboot整合shiro实现权限控制

    springboot整合shiro实现权限控制ApacheShiro是一个强大且易用的Java安全框架,执行身份验证、授权、密码学和会话管理。使用Shiro的易于理解的API,您可以快速、轻松地获得任何应用程序,从最小的移动应用程序到最大的网络和企业应用程序。上个月写了一个在线教育的项目用到了shiro权限控制,这几天又复盘了一下,对其进行了深入探究,来总结一下。下面所总结的有关shiro的代码已经传到我的github上,可以访问下面的……

    2025年8月22日
    3
  • JAVA基础:二维数组初始化

    JAVA基础:二维数组初始化二维数组的初始化同一维数组初始化类似,同样可以使用”{}”大括号完成二维数组的初始化,不同的是每个一维数组的元素使用大括号定义新的一维数组,即一维数组的每个元素又是一个新的一维数组。定义一个二维数组:把二维数组所有的赋同一个初始化值arrayType[][]arrayName=new arrayTyp[n][m];for(inti=0;iarrayName.l

    2022年5月26日
    52

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号