Google自定义搜索引擎[通俗易懂]

Google自定义搜索引擎[通俗易懂]本文主要介绍如何通过Google的API来定义自己的搜索引擎,并将Google搜索框嵌入到自己的web页面。另外,分析了自定义搜索引擎请求数据的url,模拟请求并获取搜索的结果。1写在前面前段时

大家好,又见面了,我是你们的朋友全栈君。

本文主要介绍如何通过Google的API来定义自己的搜索引擎,并将Google搜索框嵌入到自己的web页面。另外,分析了自定义搜索引擎请求数据的url,模拟请求并获取搜索的结果。

1 写在前面

前段时间发现了一个网站提供搜索百度网盘资源,挺好用的,但是广告很多,于是自己做了一个Winform窗体程序去获取该网站的数据请求,解析并绑定请求的结果。最后,也将实现Winform程序的这一过程分享到了博客园中,也就是我上一篇博文《百度网盘资源搜索器 》。

后面我发现提供网盘资源搜索的网站内部是利用google搜索引擎的api来完成的。在网上搜索了一些资料,捣鼓了google自定义搜索引擎的功能,发现确实挺好玩的。后面又有同仁问能不能介绍一下如何实现使用google搜索的api,那么下面就开始吧。

2 自定义搜索引擎

1)自定义google的搜索引擎,那首先得有一个google的账号呀,这也是第一步,先注册一个google的账号。

2)注册google的账号之后,进入自定搜索引擎的页面,https://cse.google.com/cse/,页面如下。

2016_11_54c3857e-9321-46c6-b9cb-97af2811288a

3)点击右侧的【新增搜索引擎】,填写你搜搜引擎的基本配置。页面如下。

2016_11_1902b40f-2f7b-4c01-9843-31d69d62ee2c

我可以看到,只需要配置三项即可完成自定义搜索引擎。

  • 第一个是你需要搜索的网站,也就是说你自定义的这个搜索引擎只会在你填写的单个网页、整个网站或者整个域中去搜索你要想要的信息。在这里我们以百度网盘资源为例,填写www.pan.baidu.com
  • 第二个是语言,这个我们选择所有语言。
  • 最后一个是搜索引擎的名称,我们就填写【百度云盘搜索】

2016_11_0ddb85a9-a685-44c0-ada9-894d2a1956f4

4)点击创建,就实现了自己的搜索引擎,点击右侧的【修改搜索引擎】的页面,如下图。

2016_11_0af0e1db-a81b-41c7-ad7e-6a31258da3f8

在修改搜索引擎的页面中有一个【搜索引擎ID】,这个特别关键,你可以点击它,查看你这个搜索引擎的id编码,还可以公开你这个搜索引擎的网址。还有一个很重要的就是【获取代码】,获取这段代码就能够实现将自定义的搜索引擎框嵌入到你自己定义的web页面中,点击【获取代码】。能够获取到一段html代码,如下:

2016_11_9727487f-d4f5-4103-8660-7a806ed1eae0

另外,在上面步骤4)的截图1中,可以测试一下,你自定义的搜索引擎。在这里,我们输入【数学】关键字,结果如下。

2016_11_038e91f6-865f-477c-94fc-65e9d83284a0

3 如何使用自定义搜索引擎

在第二小节中我们已经创建了属于我们的搜索引擎了,那么下面我们如何使用它。在这里,我采用两种方式,第一种方式直接将第二节中的代码拷贝出来,并嵌入到自己web页面中;第二种方式是分析自定义搜索引擎请求的url结构和请求方式,然后去构造搜索的url,模拟请求获取查询结果。

3.1 嵌入web页面

首先自定一个html页面,然后把第二节中讲到的代码拷贝到div中,代码如下。

<html>
<body>
<meta charset="utf-8">
	<style type="text/css">
		#main{
			width:750px;
			margin:20px auto;
			 
		}
		#main p{
			text-align:center;
			font-size:25px;
			font-weight:bold;
			margin-button:100px;
		}
	</style>
</body>
<head>
<div id="main">
<p>
百度网盘资源搜索器@Jaume
</p>
<script>
  (function() {
    var cx = '搜索引擎ID';
    var gcse = document.createElement('script');
    gcse.type = 'text/javascript';
    gcse.async = true;
    gcse.src = 'https://cse.google.com/cse.js?cx=' + cx;
    var s = document.getElementsByTagName('script')[0];
    s.parentNode.insertBefore(gcse, s);
  })();
</script>
<gcse:search></gcse:search>
</div>
</head>
</html>

注意:上面的var cx='搜索引擎ID,这个【搜索引擎ID】就是第二节创建自定义搜索引擎时自动生成的,将你创建的搜索引擎ID替换到这里即可。下面是页面效果。
2016_11_c3fb77e4-4736-4092-99f6-b948590e3520

这下就实现了将自定义搜索引擎嵌入到自己的web页面。

3.2 模拟请求

通过分析,搜索引擎搜索请求的url为:

https://www.proxy.ustclug.org/customsearch/v1element?key=AIzaSyCVAXiUzRYsML1Pv6RwSG1gunmMikTzQqY&rsz=filtered_cse&num=10&hl=zh_CN&prettyPrint=false&source=gcsc&gss=.com&sig=0c3990ce7a056ed50667fe0c3873c9b6&cx=搜索引擎ID&q=数学&sort=&googlehost=www.google.com

url主要参数分析:

  • cx:搜索引擎ID
  • q:搜索关键
  • sort:搜索结果排序方式

构造上面这种模式的url,采用GET的方式去请求,会得到如下返回的json数据,json数据包含了搜索结果以及附带属性(搜索结果总数等)。如下图所示。

2016_11_dd51d22f-7770-4502-b330-1b17bcc1355b

明白了引擎请求搜索结果的这一流程,那么用c#语言来实现就非常简单了。代码非常简单,就不贴出来。

4 总结

使用google的api自定义搜索引擎最最关键的一点就是,你的机器要能够访问google。要是不能访问google,那就只能/(ㄒoㄒ)/~~。本文举的例子是搜索百度网盘资源,当然你也可以搜索博客园的所有资源。

其实,google自定义搜索引擎api还有更加精彩设置,你可以去玩玩。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/154436.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 吐槽下安卓手机_吐槽手机像素不好的说说

    吐槽下安卓手机_吐槽手机像素不好的说说吐槽下安卓手机安卓手机的问题:1、安卓的机子运行时间长了,都需要折腾的,这就跟电脑一样,3-6个月恢复一次系统才快。很少有安卓系统不预装自己的软件的。2、安卓手机为了炒作,很多配备多核CPU,导致发热量很大,掉电很快,手机发烫厉害影响手感。3、曲面屏,这是营销炒作出来的卖点,曲面屏由于外框没有保护,很容易摔碎,而且也有误触的问题。4、有些手机采用了窄边框,而误触处理没有做好,导致用户体验极差,这不…

    2022年9月2日
    6
  • MyBatis面试题总结「建议收藏」

    MyBatis面试题总结「建议收藏」啃下MyBatis源码-MyBatis面试题总结1.概念/使用方法向的问题1.1什么是Mybatis?1.2为什么说Mybatis是半ORM框架?/与Hibernate有哪些不同?1.3Mybaits的优点?1.4MyBatis框架的缺点?1.5#{}和${}的区别?1.6怎么解决实体类中的属性名和表中的字段名不一样的问题?1.7在mapper中如何传递多个参数?…

    2022年6月11日
    26
  • ftp镜像下载

    ftp镜像下载

    2022年3月8日
    43
  • 太极阳支持的Android版本,三星 Android 7.0 无法使用太极阳

    太极阳支持的Android版本,三星 Android 7.0 无法使用太极阳什么问题太极阴无法变成太极阳详细情况按照官网操作刷入magisk(+manager)magisk菜单download中搜索taichi,下载taichi4.9.1模块安装,然后重启手机从浏览器搜索稳定版网址链接,然后下载太极5.1.114.下载完成直接安装后,显示还是太极阴重启系统后,进入太极应用依然显示太极阴进入magisk菜单modules,发现Taichiv4.9.1模块已经被…

    2022年6月4日
    43
  • python函数–isalpha()方法[通俗易懂]

    python函数–isalpha()方法[通俗易懂]isalpha()方法描述:Pythonisalpha()方法检测字符串是否只由字母组成。isalpha()方法语法:str.isalpha()参数:无。返回值:如果字符串至少有一个字符并且所有

    2022年7月5日
    26
  • 《javascript高级程序设计》笔记:对象数据属性和访问器属性

    《javascript高级程序设计》笔记:对象数据属性和访问器属性

    2022年3月8日
    49

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号