作者:chszs,转载需注明。博客主页:http://blog.csdn.net/chszs
Apache HttpClient 4系列已经发布很久了,但由于它与HttpClient 3.x版本完全不兼容,以至于业内采用此库的公司较少,在互联网上也少有相关的文档资料分享。
本文旨在写一个简要的Apache HttpClient 4.3开发指南,帮助开发者快速上手Apache HttpClient 4.3.x库。
要注意的是,本文档中的代码在低于HttpClient 4.3版本的地方可能不能运行。
作者:chszs,转载需注明。博客主页:http://blog.csdn.net/chszs
很多网站都使用了URL重定向技术,把一个原始请求从一个位置路由到另一个位置。原因可能是多方面的,比如域名转发、URL缩写、隐私保护、在同一网站维持相似的域名等。
本文讲述怎样使用Apache HTTPComponents HttpClient实现URL重定向。
本文使用的工具:
1. Apache HttpComponents Client 4.3.1
2. JDK 1.7
项目我命名为HttpClientTest,导入如下JAR包:
1)创建和配置CloseableHttpClient
CloseableHttpClient是线程安全的,单个实例可用于处理多个HTTP请求。Http Client会自动处理所有的重定向,除非明确地使用disableAutomaticRetries()关闭自动重定向。
2)使用链接创建HttpGet实例,获取重定向。
3)创建本地HTTP执行上下文HttpClientContext。
4)使用Http Client并传递本地实例HttpClientContext,执行HttpGet请求。
5)成功执行请求后,使用上下文对象来获取所有的重定向位置。
6)关闭响应CloseableHttpResponse,释放资源。
500 – 服务器内部错误
200 - 服务器成功返回网页
我在新浪微博中找了个URL缩短的地址作为输入,执行后,果然找到了重定向地址。
控制台输出为:
用在线URL重定向检测工具测试:
验证OK。
最近用到了HttpClient写爬虫,可能我有新版本强迫症,老是喜欢用新版本的东西(虽说新版本不一定好用),然后就用了HttpClient 4.3。HttpClient这货和Lucene一样,每个版本的API都变化很大,这有点让人头疼。就好比创建一个HttpClient对象吧,每一个版本的都不一样,
3.X是这样的
HttpClient httpClient=
new
DefaultHttpClient();
|
4.3是这样的
CloseableHttpClient httpClient = HttpClients.createDefault();
我要讲的是超时设置,HttpClient有三种超时设置,最近比较忙,没时间具体归纳总结,以后再补上,我这里就讲一些最简单最易用的超时设置方法。
这是个3.X的超时设置方法
1
2
3
|
HttpClient client =
new
HttpClient();
client.setConnectionTimeout(
30000
);
client.setTimeout(
30000
);
|
1
2
|
HttpClient httpClient=
new
HttpClient();
httpClient.getHttpConnectionManager().getParams().setConnectionTimeout(
5000
);
|
1
2
3
|
HttpClient httpClient=
new
DefaultHttpClient();
httpClient.getParams().setParameter(CoreConnectionPNames.CONNECTION_TIMEOUT,
2000
);
//连接时间
httpClient.getParams().setParameter(CoreConnectionPNames.SO_TIMEOUT,
2000
);
//数据传输时间
|
1
2
3
4
5
|
CloseableHttpClient httpClient = HttpClients.createDefault();
HttpGet httpGet=
new
HttpGet(
"http://www.baidu.com"
);//HTTP Get请求(POST雷同)
RequestConfig requestConfig = RequestConfig.custom().setSocketTimeout(
2000
).setConnectTimeout(
2000
).build();
//设置请求和传输超时时间
httpGet.setConfig(requestConfig);
httpClient.execute(httpGet);
//执行请求
|