通过http.client解析url返回的数据时为什么中文变成了unicode码
今天在解析json数据的时候得到了一堆这样的数据:{"errNum":0,"errMsg":"success","retData":[{"title":"\u6536\u5e9f\u54c1\u5927\u53d4\u521a\u4e0a\u53f0\uff0c\u5c31\u60e8\u906d\u8bc4\u59d4\u706d\u706f\uff0c\u4f46\u63a5\u4e0b\u6765\u5168\u573a\u90fd\u9707\u60ca\u4e86\uff01","url":"http:\/\/toutiao.com\/group\/6263036756505920002\/","abstract":"\u8ba2\u9605\u6211\u83b7\u53d6\u66f4\u591a\u7cbe\u5f69\u5185\u5bb9\uff01","image_url":"http:\/\/p1.pstatp.com\/list\/2f90009a31a7ee8bb15"}]}
这是因为,为了更好的传输中文,json进行了Unicode编码。
这样一来,我们在解析json之前,就得要先将json数据中的Unicode编码转换为我们使用的中文;
一:http请求数据返回json中string字段包含unicode的转码
- public static String decodeUnicode(String theString) {
- char aChar;
- int len = theString.length();
- StringBuffer outBuffer = new StringBuffer(len);
- for (int x = 0; x < len;) {
- aChar = theString.charAt(x++);
- if (aChar == '\\') {
- aChar = theString.charAt(x++);
- if (aChar == 'u') {
- // Read the xxxx
- int value = 0;
- for (int i = 0; i < 4; i++) {
- aChar = theString.charAt(x++);
- switch (aChar) {
- case '0':
- case '1':
- case '2':
- case '3':
- case '4':
- case '5':
- case '6':
- case '7':
- case '8':
- case '9':
- value = (value << 4) + aChar - '0';
- break;
- case 'a':
- case 'b':
- case 'c':
- case 'd':
- case 'e':
- case 'f':
- value = (value << 4) + 10 + aChar - 'a';
- break;
- case 'A':
- case 'B':
- case 'C':
- case 'D':
- case 'E':
- case 'F':
- value = (value << 4) + 10 + aChar - 'A';
- break;
- default:
- throw new IllegalArgumentException(
- "Malformed \\uxxxx encoding.");
- }
- }
- outBuffer.append((char) value);
- } else {
- if (aChar == 't')
- aChar = '\t';
- else if (aChar == 'r')
- aChar = '\r';
- else if (aChar == 'n')
- aChar = '\n';
- else if (aChar == 'f')
- aChar = '\f';
- outBuffer.append(aChar);
- }
- } else
- outBuffer.append(aChar);
- }
- return outBuffer.toString();
- }
二、普通string含有unicode转码方法
- public static String reEncoding(String text, String newEncoding) {
- String str = null;
- try {
- str = new String(text.getBytes(), newEncoding);
- } catch (UnsupportedEncodingException e) {
- log.error("不支持的字符编码" + newEncoding);
- throw new RuntimeException(e);
- }
- return str;
- }
三、说一下比较奇怪的方案,测试中无意发现的,暂时没弄明白原理(有明白原理的大神,请告知一声,谢谢)
我用HttpClent的post方式获取的json数据,得到的是带Unicode码的数据,需要转换成中文才行,但是转换的时间感觉有点长,就用HttpURLConnection的get方式又试了一下,在不转码的情况下,经过gson解析后,竟然神奇的自动转换成了中文:
简直是太神奇了,而且需要的时间相对于HttpClient的post请求方式的请求和处理时间更短,所以,果断换用HttpURLConnection的get方式了
①现在先贴一下HttpURLConnection的get的方式:
- @Test
- public void test() {
- try {
- long start = System.currentTimeMillis();
- URL url = new URL("http://apis.baidu.com/songshuxiansheng/news/news");
- HttpURLConnection connection = (HttpURLConnection) url.openConnection();
- connection.addRequestProperty("apikey","0fc807e45a37ce264f45d169646f4a9e" );
- String dataString = new String(GsonTools.IsToByte(connection.getInputStream()),"utf-8");
- HeadlineJson newsJson = GsonTools.getObjectData(dataString, HeadlineJson.class);
- List<Headline>list = newsJson.getRetData();
- System.out.println(list.toString());
- long end = System.currentTimeMillis();
- System.out.println("timeGap:"+(end-start));
- } catch (Exception e) {
- // TODO Auto-generated catch block
- e.printStackTrace();
- }
- }
调用的GsonTools的方法:(之前的博文中有写到过)
- public static <T> T getObjectData(String jsonString, Class<T> type) {
- T t = null;
- try {
- Gson gson = new Gson();
- t = gson.fromJson(jsonString, type);
- } catch (JsonSyntaxException e) {
- // TODO Auto-generated catch block
- e.printStackTrace();
- }
- return t;
- }
②然后贴一下HttpClient的post方式:
- @Test
- public void TestHeadLine() {
- long start = System.currentTimeMillis();
- List<NameValuePair> params = new ArrayList<NameValuePair>();
- String url = "http://apis.baidu.com/songshuxiansheng/news/news";
- String jsonString = HttpUtils.getBaiDuString2(url, params);
- HeadlineJson lineJson = GsonTools.getObjectData(jsonString, HeadlineJson.class);
- System.out.println(lineJson.toString());
- long end = System.currentTimeMillis();
- System.out.println("timeGap:"+(end-start));
- }
调用的HttpUtils的方法:
- public static String getBaiDuString(String url,List<NameValuePair> params) {
- String serverDataString = null;
- HttpPost post = new HttpPost(url);
- try {
- post.setEntity(new UrlEncodedFormEntity(params, HTTP.UTF_8));
- post.addHeader("apikey", UrlUtils.BAIDU_API_KEY);
- HttpClient client = new DefaultHttpClient();
- HttpResponse response = client.execute(post);
- int code = response.getStatusLine().getStatusCode();
- System.out.println("StatusCode:" + code);
- if (code == 200) {
- serverDataString = decodeUnicode(EntityUtils.toString(response.getEntity()));
- // serverDataString = EntityUtils.toString(response.getEntity());
- System.out.println("接收字符串数据成功\nServerData:"+serverDataString);
- }
- } catch (Exception e) {
- // TODO Auto-generated catch block
- e.printStackTrace();
- }
- return serverDataString;
- }
③调用的HttpClient的get方式
- public static String getBaiDuString2(String url,List<NameValuePair> params) {
- String serverDataString = null;
- HttpGet get = new HttpGet(url);
- try {get.addHeader("apikey", UrlUtils.BAIDU_API_KEY);
- HttpClient client = new DefaultHttpClient();
- HttpResponse response = client.execute(get);
- int code = response.getStatusLine().getStatusCode();
- System.out.println("StatusCode:" + code);
- if (code == 200) {
- // serverDataString = decodeUnicode(EntityUtils.toString(response.getEntity()));
- serverDataString = EntityUtils.toString(response.getEntity());
- System.out.println("接收字符串数据成功\nServerData:"+serverDataString);
- }
- } catch (Exception e) {
- // TODO Auto-generated catch block
- e.printStackTrace();
- }
- return serverDataString;
- }
谷歌提供的HttpClient的通信和HttpURLConnection网络通信的时间间隔我也做了比较,明显,HttpURLConnection的请求时间更短,所以果断使用HttpURLConnection的方式
四、java中本身就提供了对Unicode 的url进行解码的方法了:
- System.out.println(URLDecoder.decode("\u82f9\u679c", "utf-8")); 详细介绍请查看全文:https://cnblogs.com/qianzf/
通过http.client解析url返回的数据时为什么中文变成了unicode码的更多相关文章
- 【原创】@ResponseBody返回json数据时出现中文乱码
ι 版权声明:本文为博主原创文章,未经博主允许不得转载. 原因: Spring中解析字符串的转换器默认编码格式是ISO-8859-1 public class StringHttpMessageCon ...
- Mock拦截请求URL返回模板数据
背景 : 前后端开发依赖后端数据, 当前端页面开发完成 ,后端在没有提供前端数据的情况下 ,前端无法测试, 导致开发效率低 ,速度慢 ,为了解决这一问题 ,通过Mock模拟生成数据在不改变原有代码前提 ...
- 如何解析Json返回的数据
Json在Web开发的用处非常广泛,作为数据传递的载体,如何解析Json返回的数据是非常常用的.下面介绍下四种解析Json的方式: Part 1 var list1 = [1,3,4]; alert( ...
- SpringMVC返回JSON数据时日期格式化问题
https://dannywei.iteye.com/blog/2022929 SpringMVC返回JSON数据时日期格式化问题 博客分类: Spring 在运用SpringMVC框架开发时,可 ...
- (转)MySQL 插入数据时,中文乱码问题的解决
MySQL 插入数据时,中文乱码问题的解决 原文:http://www.cnblogs.com/sunzn/archive/2013/03/14/2960248.html 当向 MySQL 数据库插 ...
- java 解析http返回xml数据
//post 请求 private static String sendPost(String url, String urlParameters) throws Exception { URL ob ...
- jquery easyui 解析数据库返回的数据
- springMVC返回json数据时date类型数据被转成long类型
在项目的过程中肯定会遇到ajax请求,但是再用的过程中会发现,在数据库中好好的时间类型数据:2017-05-04 17:52:24 在转json的时候,得到的就不是时间格式了 而是145245121这 ...
- SpringMVC 配置.html拦截时,返回JSON数据时出现406错误解决方案
[说明]在SpringMVC框架的使用中常常会使用@ResponseBody注解,修饰"处理器"(Controller的方法),这样在处理器在返回完毕后,就不走逻辑视图,而是将返回 ...
随机推荐
- HDFS 总结
HDFS是一个分布式文件存储系统 Client 提交读写请求(拆分blocksize) NameNode 全局把控(知道blocksize的地址) dataNode 存储数据(将数据存储进去,且以P ...
- 贪吃蛇Ground Java实现(二)
package cn.tcc.snake.antition; import java.awt.Color;import java.awt.Graphics; import java.awt.Point ...
- Java-排序算法-冒泡排序
一.冒泡排序的原理 冒泡排序,就是从第一个元素开始,通过两两交换,使小的先冒出来,然后再走第二轮使次小的冒出来,直到最后一轮最大的冒出来,排序完成 二.冒泡排序的伪代码实现: bubblesort(A ...
- TZOJ 3209 后序遍历(已知中序前序求后序)
描述 在数据结构中,遍历是二叉树最重要的操作之一.所谓遍历(Traversal)是指沿着某条搜索路线,依次对树中每个结点均做一次且仅做一次访问. 这里给出三种遍历算法. 1.中序遍历的递归算法定义: ...
- [leetcode]300. Longest Increasing Subsequence最长递增子序列
Given an unsorted array of integers, find the length of longest increasing subsequence. Example: Inp ...
- C++ 求最长递增子序列(动态规划)
i 0 1 2 3 4 5 6 7 8 a[i] 1 4 7 2 5 8 3 6 9 lis[i] 1 2 3 2 3 4 3 4 5 时间复杂度为n^2的算法: //求最长递增子序列 //2019/ ...
- 比特币测试网络搭建以及RPC服务开启-配置注意事项
.bitcoin QA Test环境 启动指定参数: "C:\Program Files (x86)\Bitcoin\bitcoin-qt.exe" -testnet -serve ...
- mysql-mysqldump命令导出多个数据库结构(实战)
环境:windows server 2012 打开CMD命令行模式, >cd c:\Program Files\Mysql\Mysql 5.7.1\bin c:\Program Files\My ...
- python3.6.5 路径处理与规范化
在Linux和Mac平台上,该函数会原样返回path,在windows平台上会将路径中所有字符转换为小写,并将所有斜杠转换为饭斜杠. >>> os.path.normcase('c: ...
- 17.Mysql分区
17.Mysql分区分区是指根据一定的规则把一个表分解成多个部分,逻辑上仍是一张表,实际上由多个物理分区对象组成.分区对于应用是完全透明的,不影响业务逻辑和SQL编写.分区的优点: 可以存储更多的数据 ...