HttpEntity接口的详细解释与应用「建议收藏」

爬虫之对接口HttpEntity的解释(二)前言之前写了一些关于如何使用HttpClient包基本功能HttpGet与HttpPost。在其中提到了HttpEntity接口。这篇文章是对HttpEntity接口深入的探讨。一、使用的位置与方式HttpEntity是在HttpCore包中实现的,下面以HttpGet中使用位置为例(参见上一篇)DefaultHttpClienth

大家好,又见面了,我是你们的朋友全栈君。

爬虫之对接口HttpEntity的解释(二)

前言

之前写了一些关于如何使用HttpClient包基本功能HttpGet与HttpPost。在其中提到了HttpEntity接口。这篇文章是对HttpEntity接口深入的探讨。

一、使用的位置与方式

HttpEntity是在HttpCore包中实现的,下面以HttpGet中使用位置为例(参见上一篇)

DefaultHttpClient httpClient = new DefaultHttpClient();                               (A)

HttpGet httpGet = new HttpGet(url);                                             (B)

HttpResponse httpResponse = httpClient.execute(httpGet);                           (C)

HttpEntity httpEntity = httpResponse.getEntity();                                    (D)

Do something on httpEntity                                                    (E)

EntityUtils.consume(httpEntity)                                                  (F)

httpGet.releaseConnection()   

HttpEntity其实相当于一个消息实体,内容是http传送的报文(这里可以说是html,css等等文件)。这里只需要知道它是用来表征一个http报文的实体就行了,用来发送或接收。通过上面的例子,可以对使用HttpEntity有一些认识。实现HttpEntity接口有不同的类,下面介绍。

二、HttpEntity的分类

按HttpEntity内容的来源,它可以分为三类:

1.streamed(流式):从一个流传输中获得,一般是来自http连接。特点:使用时产生,不可重复

2.self-contained(自包含):存储在内存中的,独立于http连接。特点:可以重复

3.wrapping(代理,包装):从其他HttpEntity中获得。特点:依附于获取的类

在HttpEntity帮助文档中建议,将实时性的不可重复的作为流式实体处理,把可重复的(如果不会产生巨大影响)作为自我包含实体处理。

三、HttpEntity的方法介绍

HttpEntity类非常简洁,它的方法如下:

InputStreamgetContent()返回的是一个实体内容的流

注:此时这里的流与上面所说的流式实体概念有所不同。上文所说流式实体是指从连接产生具有实时性的流,而这里仅仅只内容流形式,不要混淆。

HeadergetContentEncoding()获取HttpEntity(如果有的话)实体已编码内容的头部信息(具体Header内容可以参见HttpCore帮助文档中Header类)

Long getContentLength()显而易见是获取整个实体内容的长度

BooleanisRepeatable()判断实体是否具有重现的能力,也就是一中讨论的分类

BooleanisStreaming()判断实体的内容是不是基于流

VoidwriteTo(OutputStream outstream)将实体写入一个输出流

四.实现接口HttpEntity的类

这些实现接口HttpEntity的类,其实就是在HttpEntity功能上添加了一些小小的功能。看这些类的名字就能知道它添加了什么功能。

类如下:

AbstractHttpEntity,BasicHttpEntity,BufferedHttpEntity,ByteArrayEntity,InputStreamEntity,StringEntity等等。如果在接下来的文章中有用到的话,我会提及一部分。其实这些类非常简单,完全可以自己实现。也可以参考HttpCore帮助文档。

后记

我发现自己写的内容都很简单,甚至说是很幼稚。但是,我想如果对一个已经很熟练的人来说,这样的文章也许没用,他也完全不需要去看。但是如果对一个刚刚开始学习的人来说,也许意义会有所不同,他会少走很多弯路。不过,随着学习爬虫不停地深入,我想会写出一些能值得参考的东西来的。所以,不喜勿喷。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/125944.html原文链接:https://javaforall.net

(1)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • vue项目怎么关闭eslint_vue plugin

    vue项目怎么关闭eslint_vue plugineslint的检测功能太严格了,导致写了一点代码就会报一堆无关紧要的异常,大多都是格式不规范的问题,但是这样太影响效率和心情了。网上找了半天好多都是很老的解决办法,也不适合现在的vue-cli,最后终于找到一个可行的解决办法,也很简单。不小心在创建项目时打开了eslint检测功能也没关系,只需要在vue.config.js里加入:module.exports={lintOnSave:false}…

    2022年10月8日
    4
  • 罗技键盘锁了,按哪个键就开了_无线键盘自动休眠

    罗技键盘锁了,按哪个键就开了_无线键盘自动休眠在弹出的界面中查看一下系统是不是已经开启了休眠。如果没有休眠,则无需关闭,如果有这个选项,就继续看下面;然后打开开始菜单,在开始菜单的右边会有一个控制面板的选项,打开控制面板,在控制面板中,找到电源选项,然后点击打开统已经默认设定了一个电源计划,即推荐的选项,但是,系统休眠会占用许多系统空间,所以要把它给设置为关闭。点击平衡右边的蓝色的设置链接,即更改计划设置;在更改计划的设置中,点击下面的更改高…

    2022年10月10日
    3
  • 怎么将pdf转换成image_php从入门到精通 pdf

    怎么将pdf转换成image_php从入门到精通 pdf上次找到fpdf发现文档支持不足。而且含有php5.4不能用了的过期函数,图片进去也显示不了等问题。特意找到这个tcpdf。下载的地址搞一个试试中文字体包下载%20Sans%20Fallback%20-%20PHP.zip/download下载后,将它解压放在droidsansfallback.php、droidsansfallback.z以及droidsansfallback.ctg.z这三个文…

    2025年9月23日
    4
  • java axis_Java 使用Axis实现WebService实例

    java axis_Java 使用Axis实现WebService实例在上一篇WebService实例中,基于jdk1.6以上的javax.jws发布webservice接口。这篇博文则主要用eclipse/myeclipse使用axis插件进行发布和调用WebService。1.下载axis,并解压到tomcat/webapps目录下2.在tomcat部署axis2启动tomcat,可以看到多了个axis2文件在浏览器输入:http://localho…

    2022年7月21日
    14
  • 7.4v升12v锂电池升压芯片方案_电池升压

    7.4v升12v锂电池升压芯片方案_电池升压HU5912是一款5V输入,支持四节锂电池的升压充电管理IC。HU5912,采用异步开关架构,使其在应用时仅需要极少的外围器件,可有效减少整体方案尺寸,降低BOM成本。HU5912的升压开关充电转换器的工作效率为90%。HU5912输入电压为5V,内置自适应环路,可智能调节充电电流,防止拉挂适配器的输出,可匹配所有适配器。描述20W,4A输入异步开关升压充电升压充电效率90%充电电流外部可调自动调节输入电流,匹配所有适配器支持LED充电状态指示内置功率MO

    2022年10月7日
    5
  • 经excel要将数据库(ORACLE)要插入数据

    经excel要将数据库(ORACLE)要插入数据

    2022年1月13日
    53

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号