扫清盲点,如何正确的从HttpClient 3.x系统升级到HttpClient 4.x

扫清盲点,如何正确的从HttpClient 3.x系统升级到HttpClient 4.x如果周期比较长的项目,或者这个项目开发人员换过了好几拨人,很有可能出现一些奇怪的问题,比如一个项目中出现了多种Spring注入bean的方式,不同版本的jar冲突等等爬虫项目有的时候更是过犹不及,拿模拟登陆来说,开发人员的迭代,每个人的风格和技术各不相同,模拟登陆的方式也是五花八门,早在之前看到过一个项目的源码,其中使用HttpClient也是各种风格,虽然官方已经强烈建议使用HttpClie…

大家好,又见面了,我是你们的朋友全栈君。

如果周期比较长的项目,或者这个项目开发人员换过了好几拨人,很有可能出现一些奇怪的问题,比如一个项目中出现了多种Spring注入bean的方式,不同版本的jar冲突等等

爬虫项目有的时候更是过犹不及,拿模拟登陆来说,开发人员的迭代,每个人的风格和技术各不相同,模拟登陆的方式也是五花八门,早在之前看到过一个项目的源码,其中使用HttpClient也是各种风格,虽然官方已经强烈建议使用HttpClient 4.x之后版本,但是在该项目中均存在HttpClient 3.x的和HttpClient 4.x的创建Httpclient对象。造成风格不一,维护繁杂,而新进项目的同学又很难进行区分不易上手,是有可能继续使用旧代码造成不良循环。

本文针对以上的情况进行了详细讲述:

1.   关于HttpClient 3.x 和 HttpClient 4.x项目的历史

如下图所示:

原Commons HttpClient project(HttpClient 3.x) 是 Jakarta Commons 项目下的一个子项目,在2007年Commons项目独立,Commons摒弃了Httpclient 3.x,不再对其维护;而在早些年2005年Jakarta成立了子项目HttpComponents项目用于开发HttpClients 3.x的替代项目HttpClient 4.x。就在Commons项目脱离Jakarta项目的同年2007年,HttpComponents也脱离Jakarta项目成为Apache顶级项目,进行开发维护HttpClient 4.x及后续版本。

从Httpclient历史中可以看出早在2005年Apache就有了要取代3.x的打算,成立了单独项目HttpComponents,并在两年后发布4.x版本取代了3.x。

Apache官方公告链接:https://hc.apache.org/httpclient-3.x/

扫清盲点,如何正确的从HttpClient 3.x系统升级到HttpClient 4.x

2.   区分HttpClient 3.x 和 HttpClient 4.x 的jar包

如下图所示,如果是HttpClient 3.x 在项目中需要引入 import org.apache.commons.httpclient。而HttpClient 4.x 则需要引入 import org.apache.http.client.HttpClient。

扫清盲点,如何正确的从HttpClient 3.x系统升级到HttpClient 4.x

另外关于3.x和4.x的jar包依赖,在上图中可以看出,3.x的jar依赖于commons-logging和commons-codec。而4.x依赖于httpcore、commons-logging和commons-codec。从下图的maven依赖中也可以清晰的看出区分。

扫清盲点,如何正确的从HttpClient 3.x系统升级到HttpClient 4.x

3.   HttpClient 3.x 升级到 4.x 的参照表总结如下:

  Commons HttpClient 3.x HttpComponents HttpClient 4.x
import

import org.apache.commons.httpclient.Cred;font-family:Consolas, SimSun, Helvetica, sans-serif;font-size:13px;entials;

import org.apache.commons.httpclient.Header;

import org.apache.commons.httpclient.HostConfiguration;

import org.apache.commons.httpclient.HttpClient;

import org.apache.commons.httpclient. MultiThreadedHttpConnectionManager;

import org.apache.commons.httpclient. UsernamePasswordCredentials;

import org.apache.commons.httpclient.auth.AuthScope;

import org.apache.commons.httpclient.methods.DeleteMethod;

import org.apache.commons.httpclient.methods.GetMethod;

import org.apache.commons.httpclient.methods.PostMethod;

import org.apache.http.Header;

import org.apache.http.HttpEntity;

import org.apache.http.HttpHost;

import org.apache.http.HttpResponse;

import org.apache.http.auth.AuthScope;

import org.apache.http.auth.Credentials;

import org.apache.http.auth.UsernamePasswordCredentials;

import org.apache.http.client.HttpClient;

import org.apache.http.client.methods.HttpGet;

import org.apache.http.client.methods.HttpPost;

import org.apache.http.conn.params.ConnRoutePNames;

import org.apache.http.entity.ContentType;

import org.apache.http.entity.StringEntity;

import org.apache.http.impl.client.DefaultHttpClient;

import org.apache.http.util.EntityUtils;

HttpClient HttpClient client = new HttpClient(connectionManager);

DefaultHttpClient client = new DefaultHttpClient(); // 4.3版本前

// 4.3版本后的创建方式见表下方代码

proxy configuration

client.getHostConfiguration().setProxy( proxyHost, proxyPort);

client.getState().setAuthenticationPreemptive( true);

Credentials cred = new  UsernamePasswordCredentials(proxyUser, proxyPassword);

client.getState().setProxyCredentials(AuthScope.ANY_HOST, proxyHost, cred)

client.getCredentialsProvider().setCredentials(

 new AuthScope(proxyHost, proxyPort),

 new UsernamePasswordCredentials(proxyUser, proxyPassword));

HttpHost proxy = new HttpHost(proxyHost proxyPort);

client.getParams().setParameter( ConnRoutePNames.DEFAULT_PROXY, proxy);

GET

GetMethod getMethod = new GetMethod();

getMethod.setPath(url.getFile());

HttpGet httpGet = new HttpGet(url.getFile());
GET Header getMethod.setRequestHeader(key, value); httpGet.addHeader(key, value);
Execute GET client.executeMethod(getMethod);

HttpHost targetHost = new HttpHost(url.getHost(), url.getPort(), url.getProtocol());

HttpResponse httpResponse = client.execute( targetHost, httpGet);

POST

PostMethod post = new PostMethod();

post.setPath(url.getFile());

HttpPost post = new HttpPost(url.getFile());
POST Header post.setRequestHeader(key, (String) headers.get(key)); post.addHeader(key, (String) headers.get(key));
POST Body post.setRequestBody(message);

StringEntity messageEntity = new StringEntity( message,

ContentType.create(“text/plain”, “UTF-8”));

post.setEntity(messageEntity);

Execute POST client.executeMethod(post);

HttpHost targetHost = new HttpHost(url.getHost(), url.getPort(), url.getProtocol());

HttpResponse httpResponse = client.execute(targetHost, post);

Response Header Header[] rspHeaders = post.getResponseHeaders(); Header[] rspHeaders = httpResponse.getAllHeaders();
Response Body String responseMsg = post.getResponseBodyAsString()

StringBuffer buffer = new StringBuffer();

BufferedReader reader = new BufferedReader(new InputStreamReader(httpResponse.getEntity().getContent()));

String dataLine = null;

while((dataLine = reader.readLine()) != null){

    buffer.append(dataLine);

}

String responseMsg =    buffer.toString();

在上表中需要注意的是:如果是HttpClient 4.3之后的版本,创建HttpClient对象的方法有如下几种:

// 一般默认的创建HC对象的方法,实际上底层实现为:HttpClientBuilder.create().build()
CloseableHttpClient httpClient = HttpClients.createDefault(); 
 
// HttpClientBuilder 创建HC对象的各种方式
CloseableHttpClient closeableHttpClient = new HTTPClientBuilder().build();
 
CloseableHttpClient closeableHttpClient = new HTTPClientBuilder().withCookiesStore().build();
 
CloseableHttpClient closeableHttpClient = new HTTPClientBuilder().withGlobalConfig().build();
 
CloseableHttpClient closeableHttpClient = new HTTPClientBuilder().withSllContext().build();
 
CloseableHttpClient closeableHttpClient = new HTTPClientBuilder().withCookiesStore()
    .withGlobalConfig()
    .withSllContext()
    .build();

4.   HttpClient 3.x 和 4.x 废弃API一览:

在每个版本的HttpClient中都有Deprecated list(废弃API一览),下面的官方连接中可以方便查询到官方不建议使用的API,这些API如果继续使用会和JDK的API一样出现删除线。

3.x 版本 https://hc.apache.org/httpclient-3.x/apidocs/deprecated-list.html
4.x 版本 https://hc.apache.org/httpcomponents-client-ga/httpclient/apidocs/deprecated-list.html

5.   HttpClient 3.x 和 4.x 的常量变化一览:

在无论是3.x还是4.x的版本中,默认都定义了常量文件,里面提供了默认的状态码,协议头等等的常量,这样一些常用的就不需要自己再次定义了,可以直接使用HttpClient的常量类直接来使用,具体的详细常量参照下面的链接:

3.x 版本 https://hc.apache.org/httpclient-3.x/apidocs/constant-values.html
4.x 版本 https://hc.apache.org/httpcomponents-client-ga/httpclient/apidocs/constant-values.html

6.   HttpClient 3.x 和 4.x 超时Timeout设置变化:

HttpClient 3.x

HttpClient client = new HttpClient();
client.setConnectionTimeout(5000);  
client.setTimeout(5000);
 
HttpClient httpClient= new HttpClient();  
httpClient.getHttpConnectionManager().getParams().setConnectionTimeout(5000);

HttpClient 4.x到HttpClient4.3以下

HttpClient httpClient=new DefaultHttpClient();
httpClient.getParams().setParameter(CoreConnectionPNames.CONNECTION_TIMEOUT,5000);
httpClient.getParams().setParameter(CoreConnectionPNames.SO_TIMEOUT,5000);

HttpClient4.3以上

CloseableHttpClient httpClient = HttpClients.createDefault();
HttpGet httpGet = new HttpGet("https://www.csdn.net/");
RequestConfig requestConfig = RequestConfig.custom().setSocketTimeout(5000).setConnectTimeout(5000).build();
httpGet.setConfig(requestConfig);
httpClient.execute(httpGet);

7.   对于HttpClient 4.5.x 之后的版本废弃API版本替代策略(针对SSL相关API)

HttpClient4.5之后依然有很多的变化,其中一些API也废弃掉了。
下文针对 4.x 以后 SSL证书验证相关废弃(@Deprecated)API提供了最新的替换策略。

HttpClient 4.5.x 之后 Deprecated 废弃API 的替代对应策略:https://blog.csdn.net/dietime1943/article/details/86705539

8.   其他一些有用的链接:

HttpClient官方指南教程:https://hc.apache.org/httpcomponents-client-ga/tutorial/html/index.html

What does setDefaultMaxPerRoute and setMaxTotal mean in HttpClient?
https://stackoverflow.com/questions/30689995/what-does-setdefaultmaxperroute-and-setmaxtotal-mean-in-httpclient

本文原创由`bluetata`发布于blog.csdn.net、转载请务必注明出处。

Flag Counter

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/163261.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Python实现简单截图识别获取文字符号信息[通俗易懂]

    Python实现简单截图识别获取文字符号信息[通俗易懂]版权声明:本文为博主原创文章,遵循CC4.0BY-SA版权协议,转载请附上原文出处链接和本声明。本文链接:https://blog.csdn.net/weixin_42365530有时候我们百度出来一些自己需要信息后,想要直接复制粘贴(借鉴借鉴),提升工作效率,比如学校要求写什么加油稿,期末总结,思想汇报啊…额~,被请去办公室喝茶了,到时别说是博主教的啊!但是百度文库经常会限制我们复制…

    2022年5月20日
    43
  • 领域驱动实践总结(基本理论总结与分析+架构分析与代码设计V+具体应用设计分析)

    领域驱动实践总结(基本理论总结与分析+架构分析与代码设计V+具体应用设计分析)领域驱动设计DDD是一种设计思想,它可以同时指导中台业务建模和微服务设计(中台本质是业务模型,微服务是业务模型的系统落地),领域驱动设计强调领域模型和微服务设计的一体性,先有领域模型然后才有微服务,而不是脱离领域模型来谈微服务设计。

    2022年4月28日
    41
  • word2vec原理与实现「建议收藏」

    word2vec原理与实现「建议收藏」定义word2vec是一种把词转到某种向量空间的方法,在新的向量空间,词之间的相互关系,上下文关系都以某种程度被表征出来。方法词向量的转换方法有两种:CBOW(Continounsbagsofwords)和Skip-gram。以下图示为CBOW的网络结构图上图中的x1,x2,….Xc代表的是源码中的context向量中的每个单词,这个上下文的窗口大小对每个词都是随…

    2022年5月16日
    31
  • 角度和弧度之间的转换

    角度和弧度之间的转换在编程中,我们经常会用到角度或者弧度,但是往往我们所得到的不是角度就是弧度,需要转换一下才能用到,这里我总结了角度和弧度之间的转换,1、转换方法:角度转弧度π/180×角度弧度变角度180/π×弧度例:角度转弧度//其中a是最开始的角度,现在将它转换成弧度制a//4*atan(1.0)就是我们用到的圆周率π,不管角度还是弧度,都是double型voidCBa…

    2022年6月23日
    31
  • gluster源码浅析

    gluster源码浅析gluster的volume是由一系列的translator组成的,translator就像输入输出流的堆栈式结构一样,由一个translator调用另一个translator,每个translator在运行时作为shared-object,根据不同的文件操作调用不同的函数.每个translator一般需要定义xlator_fops、xlator_cbks、init、fini、volume…

    2025年6月8日
    0
  • 并发编程面试题(2020最新版)「建议收藏」

    文章目录基础知识并发编程的优缺点为什么要使用并发编程(并发编程的优点)并发编程有什么缺点并发编程三要素是什么?在Java程序中怎么保证多线程的运行安全?并行和并发有什么区别?什么是多线程,多线程的优劣?线程和进程区别什么是线程和进程?进程与线程的区别什么是上下文切换?守护线程和用户线程有什么区别呢?如何在Windows和Linux上查找哪个线程cpu利用率最高?什么是线程死锁形成死锁的…

    2022年4月18日
    38

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号