xml解析错误:Invalid byte 2 of 2-byte UTF-8 sequence

在做接口解析时候出现的错误:Invalid byte 2 of 2-byte UTF-8 sequence. Nested exception: Invalid byte 2 of 2-byte UTF-8 sequence.



非常明显是在读取XML文件时候出现的编码问题。

在測试过程中发现。主要原因是xml文件里声明的编码与xml文件本身保存时的编码不一致。



如今解决的办法就有几个,主要说我測试过的两个方。

假设你是直接以文件的形式读取 能够更改XML文件里的 UTF-8编码 改为 GBK或GB2312 .

另一种可能是 你直接以URL 通过网络地址获取InputStream流形式读取 在转换成Document对象。这样的方法的解决的方法是先down 下来保存在本地。实现比較简单 用个OutputStream流写到你想保存的文件夹就可以。再解析down下来的文件 当中在 SAXReader saxReader = new SAXReader();

正常写法:

private ImpowerDeviceVo getResponseXml(String requestUrl, String requestXml) throws Exception

{

  if (StringUtils.isEmpty(requestUrl))

  {

   String message = "config-WebPortal.xml配置文件未配置,获取接口连接为空!";

   logger.debug(message);

   logger.error(message);

  }

 

  URL httpurl = new URL(requestUrl);

  HttpURLConnection httpConn = (HttpURLConnection) httpurl.openConnection();

  httpConn.setConnectTimeout(ImpowerXmlNodeName.connectTimeout);

  httpConn.setReadTimeout(ImpowerXmlNodeName.readTimeout);

  httpConn.setRequestMethod(ImpowerXmlNodeName.requestMethod);

  httpConn.setDoInput(true);

  // 将doOutput标志设置为true,指示应用程序要将数据写入URL连接。

httpConn.setDoOutput(true);

  OutputStream out = httpConn.getOutputStream();

  logger.debug("requestXml:" + requestXml);

  // 将參数写入URL接口连接

  out.write(requestXml.getBytes("utf-8"));

 

  SAXBuilder sax = new SAXBuilder();

  Document doc = sax.build(httpConn.getInputStream());

 

  // 获取到信息

  ImpowerDeviceVo impowerDeviceVo = this.getImpowerDeviceVoByDocument(doc);

 

  httpConn.disconnect();

  out.close();

return impowerDeviceVo;

}

改动方法例如以下:

造一个暂时文件保存所定的编码报文,然后读取,读取解析后关闭流,再删除文件,否则会报文件读取多误 read error

private ImpowerDeviceVo getResponseXml(String requestUrl, String requestXml) throws Exception

{

  if (StringUtils.isEmpty(requestUrl))

  {

   String message = "config-WebPortal.xml配置文件未配置,获取接口连接为空!";

   logger.debug(message);

   logger.error(message);

  }

 

  URL httpurl = new URL(requestUrl);

  HttpURLConnection httpConn = (HttpURLConnection) httpurl.openConnection();

  httpConn.setConnectTimeout(ImpowerXmlNodeName.connectTimeout);

  httpConn.setReadTimeout(ImpowerXmlNodeName.readTimeout);

  httpConn.setRequestMethod(ImpowerXmlNodeName.requestMethod);

  httpConn.setDoInput(true);

  // 将doOutput标志设置为true。指示应用程序要将数据写入URL连接。

httpConn.setDoOutput(true);

  OutputStream out = httpConn.getOutputStream();

  logger.debug("requestXml:" + requestXml);

  // 将參数写入URL接口连接

  out.write(requestXml.getBytes("utf-8"));

InputStream inputStream = httpConn.getInputStream();

  String fileName = "tempxml.xml";

 

  // 保存文件

  File f = new File(fileName);

  if (!f.exists())

  {

   f.createNewFile();

  }

  String xmlContent = readXmlStream(inputStream);

  System.out.println("进入-----------"+xmlContent);

  FileOutputStream fileOutputStream = new FileOutputStream(f);

  fileOutputStream.write(xmlContent.getBytes("utf-8"));

  fileOutputStream.close();

  // 打开文件

  f = new File(fileName);

  FileInputStream fileInputStream = new FileInputStream(f);

 

  SAXBuilder sax = new SAXBuilder();

//  Document doc = sax.build(httpConn.getInputStream());

  Document doc = sax.build(fileInputStream);

 

  // 获取到信息

  ImpowerDeviceVo impowerDeviceVo = this.getImpowerDeviceVoByDocument(doc);

 

  httpConn.disconnect();

  out.close();

  fileInputStream.close();

  f.delete();

return impowerDeviceVo;

}

xml:Invalid byte 2 of 2-byte UTF-8 sequence的更多相关文章

  1. CocoaPods pod install的时候报错:invalid byte sequence in UTF-8 (ArgumentError)解决办法

    CocoaPods pod install的时候报错:invalid byte sequence in UTF-8 (ArgumentError)解决办法: 基本可以确定是Podfile中的内容编码有 ...

  2. Python3 使用requests请求,解码时出错:'utf8' codec can't decode byte 0x8b in position 1: invalid start byte

    requests请求的响应内容能够通过几个属性获得: response.text 为解码之后的内容,解码会根据响应的HTTP Header中的Content-Type选择字符集.例如 "'C ...

  3. 使用 Visual Studio 2015 + Python3.6 + tensorflow 构建神经网络时报错:'utf-8' codec can't decode byte 0xcc in position 78: invalid continuation byte

    使用 Visual Studio 2015 + Python3.6 + tensorflow 构建神经网络时报错:'utf-8' codec can't decode byte 0xcc in pos ...

  4. 当在命令行中执行virtualenv venv时报此错误:'utf-8' codec can't decode byte 0xd5 in position 38: invalid continuation by

    1.windows中安装虚拟环境virtualenv时, 当在命令行中执行virtualenv venv时报此错误:'utf-8' codec can't decode byte 0xd5 in po ...

  5. python 读取文件时报错: UnicodeDecodeError: 'gbk' codec can't decode byte 0xa4 in position 127: illegal multibyte sequence

    UnicodeDecodeError: 'gbk' codec can't decode byte 0xa4 in position 127: illegal multibyte sequence p ...

  6. Python读取CSV文件,报错:UnicodeDecodeError: 'gbk' codec can't decode byte 0xa7 in position 727: illegal multibyte sequence

    Python读取CSV文件,报错:UnicodeDecodeError: 'gbk' codec can't decode byte 0xa7 in position 727: illegal mul ...

  7. python csv文件打开错误:_csv.Error: line contains NULL byte

    当python读取文件出现_csv.Error: line contains NULL byte时, # -*- coding:utf-8 -*- import csv with open(r'E:\ ...

  8. [原创]java WEB学习笔记81:Hibernate学习之路--- 对象关系映射文件(.hbm.xml):hibernate-mapping 节点,class节点,id节点(主键生成策略),property节点,在hibernate 中 java类型 与sql类型之间的对应关系,Java 时间和日期类型的映射,Java 大对象类型 的 映射 (了解),映射组成关系

    本博客的目的:①总结自己的学习过程,相当于学习笔记 ②将自己的经验分享给大家,相互学习,互相交流,不可商用 内容难免出现问题,欢迎指正,交流,探讨,可以留言,也可以通过以下方式联系. 本人互联网技术爱 ...

  9. 【转】java中byte, int的转换, byte String转换

    原文网址:http://freewind886.blog.163.com/blog/static/661924642011810236100/ 最近在做些与编解码相关的事情,又遇到了byte和int的 ...

随机推荐

  1. zoj3829 Known Notation --- 2014 ACM-ICPC Asia Mudanjiang Regional Contest

    根据规则,可以发现,一*之前必须有至少2数字.一(11*)这反过来可以被视为一数字. 因此,总位数必须大于*号码,或者你会加入数字. 添加数字后,,为了确保该解决方案将能够获得通过交流.那么肯定是*放 ...

  2. Ubuntu下搭建ASP.NET 5

    在Ubuntu下搭建ASP.NET 5开发环境   0x00 写在前面的废话 年底这段时间实在太忙了,各种事情都凑在这个时候,没时间去学习自己感兴趣的东西,所以博客也好就没写了.最近工作上有个小功能要 ...

  3. 单链表的实现---SingleLinkedList

    单链表的实现,定义为SingleLinkedList class Node<AnyType>{ //结点Node类 public AnyType data; public Node< ...

  4. nginx+lua+redis构建高并发应用(转)

    nginx+lua+redis构建高并发应用 ngx_lua将lua嵌入到nginx,让nginx执行lua脚本,高并发,非阻塞的处理各种请求. url请求nginx服务器,然后lua查询redis, ...

  5. 用友财务总帐(GL)模BI数据ETL分析

    业务需求,如下面的: 现在用友总帐一家公司BI分析案例. /* Sql Server2012使用作业设置定时任务,为了保证有一天运行时间 */ /* 意temp1表里一定要保证要有记录,否则以temp ...

  6. CacheManager

    .Net缓存管理框架CacheManager Cache缓存在计算机领域是一个被普遍使用的概念.硬件中CPU有一级缓存,二级缓存, 浏览器中有缓存,软件开发中也有分布式缓存memcache, redi ...

  7. Xcode_6.3_beta_4 官方 下载地址

    http://adcdownload.apple.com//Developer_Tools/Xcode_6.3_beta_4/Xcode_6.3_beta_4.dmg

  8. nginx 日志和监控

    原文地址:http://nginx.com/resources/admin-guide/logging-and-monitoring/ Logging and Monitoring 日志和监控 Thi ...

  9. Cocos2d-iPhone V3 (1) 其基本程序常用的行动框架和介绍

    Cocos2d-iPhone V3 (1) 其基本程序常用的行动框架和介绍 博客:http://blog.csdn.net/prevention 笔者:犀利哥 - 第一部分:一个 Cocos2d-iP ...

  10. 数据库管理——Powershell——使用Powershell脚本找出消耗最多磁盘空间的文件

    原文:数据库管理--Powershell--使用Powershell脚本找出消耗最多磁盘空间的文件 原文译自: http://www.mssqltips.com/sqlservertip/2774/p ...