xml解析错误:Invalid byte 2 of 2-byte UTF-8 sequence

在做接口解析时候出现的错误:Invalid byte 2 of 2-byte UTF-8 sequence. Nested exception: Invalid byte 2 of 2-byte UTF-8 sequence.



非常明显是在读取XML文件时候出现的编码问题。

在測试过程中发现。主要原因是xml文件里声明的编码与xml文件本身保存时的编码不一致。



如今解决的办法就有几个,主要说我測试过的两个方。

假设你是直接以文件的形式读取 能够更改XML文件里的 UTF-8编码 改为 GBK或GB2312 .

另一种可能是 你直接以URL 通过网络地址获取InputStream流形式读取 在转换成Document对象。这样的方法的解决的方法是先down 下来保存在本地。实现比較简单 用个OutputStream流写到你想保存的文件夹就可以。再解析down下来的文件 当中在 SAXReader saxReader = new SAXReader();

正常写法:

private ImpowerDeviceVo getResponseXml(String requestUrl, String requestXml) throws Exception

{

  if (StringUtils.isEmpty(requestUrl))

  {

   String message = "config-WebPortal.xml配置文件未配置,获取接口连接为空!";

   logger.debug(message);

   logger.error(message);

  }

 

  URL httpurl = new URL(requestUrl);

  HttpURLConnection httpConn = (HttpURLConnection) httpurl.openConnection();

  httpConn.setConnectTimeout(ImpowerXmlNodeName.connectTimeout);

  httpConn.setReadTimeout(ImpowerXmlNodeName.readTimeout);

  httpConn.setRequestMethod(ImpowerXmlNodeName.requestMethod);

  httpConn.setDoInput(true);

  // 将doOutput标志设置为true,指示应用程序要将数据写入URL连接。

httpConn.setDoOutput(true);

  OutputStream out = httpConn.getOutputStream();

  logger.debug("requestXml:" + requestXml);

  // 将參数写入URL接口连接

  out.write(requestXml.getBytes("utf-8"));

 

  SAXBuilder sax = new SAXBuilder();

  Document doc = sax.build(httpConn.getInputStream());

 

  // 获取到信息

  ImpowerDeviceVo impowerDeviceVo = this.getImpowerDeviceVoByDocument(doc);

 

  httpConn.disconnect();

  out.close();

return impowerDeviceVo;

}

改动方法例如以下:

造一个暂时文件保存所定的编码报文,然后读取,读取解析后关闭流,再删除文件,否则会报文件读取多误 read error

private ImpowerDeviceVo getResponseXml(String requestUrl, String requestXml) throws Exception

{

  if (StringUtils.isEmpty(requestUrl))

  {

   String message = "config-WebPortal.xml配置文件未配置,获取接口连接为空!";

   logger.debug(message);

   logger.error(message);

  }

 

  URL httpurl = new URL(requestUrl);

  HttpURLConnection httpConn = (HttpURLConnection) httpurl.openConnection();

  httpConn.setConnectTimeout(ImpowerXmlNodeName.connectTimeout);

  httpConn.setReadTimeout(ImpowerXmlNodeName.readTimeout);

  httpConn.setRequestMethod(ImpowerXmlNodeName.requestMethod);

  httpConn.setDoInput(true);

  // 将doOutput标志设置为true。指示应用程序要将数据写入URL连接。

httpConn.setDoOutput(true);

  OutputStream out = httpConn.getOutputStream();

  logger.debug("requestXml:" + requestXml);

  // 将參数写入URL接口连接

  out.write(requestXml.getBytes("utf-8"));

InputStream inputStream = httpConn.getInputStream();

  String fileName = "tempxml.xml";

 

  // 保存文件

  File f = new File(fileName);

  if (!f.exists())

  {

   f.createNewFile();

  }

  String xmlContent = readXmlStream(inputStream);

  System.out.println("进入-----------"+xmlContent);

  FileOutputStream fileOutputStream = new FileOutputStream(f);

  fileOutputStream.write(xmlContent.getBytes("utf-8"));

  fileOutputStream.close();

  // 打开文件

  f = new File(fileName);

  FileInputStream fileInputStream = new FileInputStream(f);

 

  SAXBuilder sax = new SAXBuilder();

//  Document doc = sax.build(httpConn.getInputStream());

  Document doc = sax.build(fileInputStream);

 

  // 获取到信息

  ImpowerDeviceVo impowerDeviceVo = this.getImpowerDeviceVoByDocument(doc);

 

  httpConn.disconnect();

  out.close();

  fileInputStream.close();

  f.delete();

return impowerDeviceVo;

}

xml:Invalid byte 2 of 2-byte UTF-8 sequence的更多相关文章

  1. CocoaPods pod install的时候报错:invalid byte sequence in UTF-8 (ArgumentError)解决办法

    CocoaPods pod install的时候报错:invalid byte sequence in UTF-8 (ArgumentError)解决办法: 基本可以确定是Podfile中的内容编码有 ...

  2. Python3 使用requests请求,解码时出错:'utf8' codec can't decode byte 0x8b in position 1: invalid start byte

    requests请求的响应内容能够通过几个属性获得: response.text 为解码之后的内容,解码会根据响应的HTTP Header中的Content-Type选择字符集.例如 "'C ...

  3. 使用 Visual Studio 2015 + Python3.6 + tensorflow 构建神经网络时报错:'utf-8' codec can't decode byte 0xcc in position 78: invalid continuation byte

    使用 Visual Studio 2015 + Python3.6 + tensorflow 构建神经网络时报错:'utf-8' codec can't decode byte 0xcc in pos ...

  4. 当在命令行中执行virtualenv venv时报此错误:'utf-8' codec can't decode byte 0xd5 in position 38: invalid continuation by

    1.windows中安装虚拟环境virtualenv时, 当在命令行中执行virtualenv venv时报此错误:'utf-8' codec can't decode byte 0xd5 in po ...

  5. python 读取文件时报错: UnicodeDecodeError: 'gbk' codec can't decode byte 0xa4 in position 127: illegal multibyte sequence

    UnicodeDecodeError: 'gbk' codec can't decode byte 0xa4 in position 127: illegal multibyte sequence p ...

  6. Python读取CSV文件,报错:UnicodeDecodeError: 'gbk' codec can't decode byte 0xa7 in position 727: illegal multibyte sequence

    Python读取CSV文件,报错:UnicodeDecodeError: 'gbk' codec can't decode byte 0xa7 in position 727: illegal mul ...

  7. python csv文件打开错误:_csv.Error: line contains NULL byte

    当python读取文件出现_csv.Error: line contains NULL byte时, # -*- coding:utf-8 -*- import csv with open(r'E:\ ...

  8. [原创]java WEB学习笔记81:Hibernate学习之路--- 对象关系映射文件(.hbm.xml):hibernate-mapping 节点,class节点,id节点(主键生成策略),property节点,在hibernate 中 java类型 与sql类型之间的对应关系,Java 时间和日期类型的映射,Java 大对象类型 的 映射 (了解),映射组成关系

    本博客的目的:①总结自己的学习过程,相当于学习笔记 ②将自己的经验分享给大家,相互学习,互相交流,不可商用 内容难免出现问题,欢迎指正,交流,探讨,可以留言,也可以通过以下方式联系. 本人互联网技术爱 ...

  9. 【转】java中byte, int的转换, byte String转换

    原文网址:http://freewind886.blog.163.com/blog/static/661924642011810236100/ 最近在做些与编解码相关的事情,又遇到了byte和int的 ...

随机推荐

  1. 【iOS】文件上传小记

    iOS由该系统提供API可以实现可以实现文件的上传和下载,有两种方法来. NSURLConnection与NSURLSession. 当中NSURLConnection是使用非常久的的一种方式.NSU ...

  2. Directx11学习笔记【十】 画一个简单的三角形

    本篇笔记要实现的是在屏幕上渲染出一个三角形,重点要学习的是渲染一个几何体的流程方式. 为了渲染几何图形,需要一个顶点缓存和一个描述顶点布局的输入层,还有着色器(主要是顶点着色器和像素着色器),下面来看 ...

  3. 探索WebKit核心(一)------ 新秀开始

    为什么WebKit 现在,研究人员WebKit越来越多的人,我不能逃脱,其中还增加.WebKit也多亏了流行的浏览器和WebOS乱斗.随着Palm WebOS, Chrome OS, Firefox ...

  4. Red Hat Enterprise Linux Server(RHEL) yum安装软件时This system is not registered with RHN. RHN support will be disabled. 的解决方法(转)

    新安装了redhat6.5.安装后,登录系统,使用yum update 更新系统.提示: This system is not registered to Red Hat Subscription M ...

  5. 玩转Web之Jsp(三)-----Jsp+SQLServer 用sql语句实现分页

    在BBS的实现里,jsp与sqlserver 结合的操作中,怎样实现分页,使每页显示根帖的名字,并按发表时间降序排列? 在这里举例说明,page_size为每页显示的条数,pageNo为当前页数,st ...

  6. [Apache Spark源代码阅读]天堂之门——SparkContext解析

    略微了解Spark源代码的人应该都知道SparkContext,作为整个Project的程序入口,其重要性不言而喻,很多大牛也在源代码分析的文章中对其做了非常多相关的深入分析和解读.这里,结合自己前段 ...

  7. PHP获取表单方法

    php接收HTML当表单提交的信息,数据将存储提交在全局阵列中,我们能够调用系统特定的自己主动全局变量数组来获取这些值.经常使用的自己主动全局变量例如以下所看到的: $_GET $_POST $_RE ...

  8. NET MVC过滤器

    NET MVC过滤器 本系列目录:ASP.NET MVC4入门到精通系列目录汇总 在ASP.NET MVC中有四种过滤器类型

  9. PHP实现协同程序

    于server其中编程.为了实现异步.通常情况下,需要回调.比例如下面的代码 function send($value) { $data = process($value); onReceive($d ...

  10. SQL入门学习1-查询基础

    2-1 SELECT语句基础 SELECT语句作用 SELECT 语句用于从表中选取数据. 结果被存储在一个结果表中(称为结果集). 重点 使用SELECT语句从表中选取数据. 为列设定显示用的别名 ...