近期我们使用tomcat和MySQL搭建了一个Java Webserver,并将游戏的server逻辑部署在该server上。

游戏上线后不久,我们发现数据库中出现了大量的乱码。这是个很严重的问题,因此必须立即解决。可是问题出在什么地方呢,依据分析,乱码仅仅可能出如今两个时间点:

1.       将数据从client传送到server的时候。

2.       server将数据存储到数据库的时候。

经过调试之后,我们发现server输出的数据是正常的,因此乱码问题仅仅能发生在存储入库的时候。

既然是MySQL数据库编码的问题,那事情就相对好办了,首先,输入命令:

mysql>show variables like '%char%';

+--------------------------+----------------+

|Variable_name              | Value            |

+--------------------------+----------------+

|character_set_client      | utf8              |

| character_set_connection| utf8     
        |

|character_set_database   | latin1            |

|character_set_filesystem | binary           |

|character_set_results     | utf8             |

|character_set_server      | latin1          |

|character_set_system      | utf8              |

+--------------------------+----------------+

上述命令用于显示当前MySQL用到的数据库编码。当看到这么多项数据编码之后,脑袋都有点大,没办法,仅仅能硬着头皮一个一个地把这些參数搞明确。

l   character_set_server:创建数据库时,假设没有指定字符编码,那么系统将使用character_set_server的值作为默认值。

l   character_set_database:创建表时,假设没有指定字符编码,那么系统将使用character_set_database的值作为默认值。

l   character_set_client:定义了MySQL客户端所发送数据的编码。

l   character_set_connection:当MySQLserver接收到client发送过来的数据之后,会将这些数据转化成character_set_connection所指定的编码。

l   character_set_results:MySQLserver返回查询结果所使用的字符编码。

知道这些參数的含义之后,就没有那么茫然无助了,因此脑海中回想下数据存储入库的过程。

通过MySQLclient运行插入的步骤例如以下,MySQLclient将用户输入的数据编码成character_set_client,发送到server,server接收到之后,将其转化成character_set_connection,然后server再将这些数据存储成character_set_table(上面这些參数不包括这个,即假设建表时没有指定,该值即为character_set_database)。

回顾一下,发现当时建表的时候并没有主动在建表语句后面指定字符编码,那么依据上面的描写叙述,数据库的表就会使用character_set_database所指定的字符编码,即latin1。因为UTF-8编码的中文无法存储成latin1,因此在往latin1编码的表中存储UTF-8编码的中文时,数据库会将无法识别的字符变成?,而且这个过程是不可逆的。

为了证明这一点,我试着通过MySQLclient往表中插入中文,结果插入失败。因此我决定将表的字符编码改动成UTF-8,看看能否往表中插入中文,运行例如以下语句之后:

mysql> ALTER TABLE `tableName` DEFAULTCHARACTER SET utf8 COLLATE utf8_general_ci

表的字符编码被改动成了UTF-8,这时候发现也能往表中插入中文了。

当时以为事情到这里就结束了,但是当我们启动tomcat进行測试之后,发现数据库中存入的依旧是乱码。既然MySQLclient都能插入中文,为啥使用JDBC就不能呢?非常有可能JDBC并不使用character_set_client来编码client数据。

翻阅了无数文档之后,发现假设不在JDBC URL中通过characterEncoding属性指定连接编码,JDBC Driver会使用character_set_server作为连接的编码,在本案例中,即使用latin1。既然原因找到了,那问题就比較好攻克了。

将JDBC URL改动成jdbc:mysql://localhost/some_db?useUnicode=yes

&characterEncoding=UTF-8就可以,假设使用的是tomcat数据源,那么记得把’&’替换成’&’。

最后,当再次启动server时,发现数据库中最终出现了正确的字符。

深入理解Java和MySQL乱码问题的更多相关文章

  1. 10分钟学会理解和解决MySQL乱码问题

    在阅读本文之前,强烈建议对字符集编码概念还比较模糊的同学 阅读下博主之前对相关概念的一篇科普:十分钟搞清字符集和字符编码 本博客已经迁移至: http://cenalulu.github.io/ 为了 ...

  2. 理解和解决MySQL乱码问题【转】

    本文来自:http://www.cnblogs.com/cenalulu/p/4325693.html 要了解为什么会出现乱码,我们就先要了解从客户端发起请求,到MySQL存储数据,再到下次从表取回客 ...

  3. 理解和解决MySQL乱码问题

    本文将详细介绍MySQL乱码的成因和具体的解决方案 在阅读本文之前,强烈建议对字符集编码概念还比较模糊的同学 阅读下博主之前对相关概念的一篇科普:十分钟搞清字符集和字符编码 MySQL出现乱码的原因 ...

  4. 41、java与mysql乱码的问题

    解决方法一:(最重要的一种方法)你看下my.ini,有无 [MySQL] default-character-set=utf8 [client] default-character-set=utf8 ...

  5. 【转载】10分钟学会理解和解决MySQL乱码问题

    原文地址:http://cenalulu.github.io/mysql/mysql-mojibake/ 原文作者:Junyi Lu,卢钧轶 / cenalulu / Luke 查看原文.

  6. MySQL乱码问题(为什么?追根溯源)

    引言 定位:查询数据库得到的结果集乱码,client端向数据库插入数据乱码. 网上有不少帖子,手把手地教给我们如何去改这一问题.方案大多数如下: 方案中最多介绍的就是更改配置文件,win下my.ini ...

  7. Java连接MySQL中文乱码处理【转载】

    本文转载地址:http://developer.51cto.com/art/200906/130425.htm 感谢相关作者! MySQL默认编码是latin1 mysql> show vari ...

  8. sql点滴40—mysql乱码问题总结

    原文:sql点滴40-mysql乱码问题总结 本文将为大家讲解如何处理Java连接过程中的MySQL中文乱码问题.一般MySQL中文乱码问题都是与字符集有关,这里作者的经历也大致差不多. MySQL默 ...

  9. Java连接MySQL数据库增删改查通用方法

    版权声明:本文为博主原创文章,未经博主允许不得转载. Java连接MySQL数据库增删改查通用方法 运行环境:eclipse+MySQL 以前我们Java连接MySQL数据库都是一个数据库写一个类,类 ...

随机推荐

  1. 【BZOJ1483】[HNOI2009]梦幻布丁(平衡树启发式合并+并查集)

    题目: BZOJ1483 分析: (这题码了一下午,码了近250行,但是意外跑的比本校各位神仙稍快,特写博客纪念) 首先能看出一个显然的结论:颜色段数只会变少不会变多. 我们考虑用并查集维护区间,对于 ...

  2. SublimeText学习(一)-安装

    1.下载安装包:http://www.sublimetext.com/2 2.开始安装,一直下一步 3.开始汉化 汉化包下载:http://files.cnblogs.com/files/2star/ ...

  3. Android开发高手课 - 02 崩溃优化(下):应用崩溃了,你应该如何去分析?

    崩溃现场 1. 崩溃信息 进程名.线程名 崩溃类型和堆栈信息 2. 系统信息 Logcat 机型.系统.厂商.CPU.ABI.Linux 版本等 设备状态:是否 root.是否模拟器.是否有 Xpos ...

  4. Angular——引入模板指令

    基本介绍 引入模板一般都是固定的东西,比如导航栏,比如页面的底部,每个页面都重复写很麻烦,不如直接定义两个模板,引入到需要的页面中.这个过程实际是一个跨域的异步请求过程. 基本使用 <!DOCT ...

  5. CSS——伪类

    在a标签中运用最多: 1.a:link {color: #FF0000} /* 未访问的链接 */ 2.a:visited {color: #00FF00} /* 已访问的链接 */ 3.a:hove ...

  6. 详谈java集合框架

    1.为什么使用集合框架 当我们并不知道程序运行时会需要多少对象,或者需要更复杂方式存储对象——可以使用Java集合框架 2.Java集合框架包含的内容 接口:(父类)Collection接口下包含Li ...

  7. (转) Arcgis for Javascript实现两个地图的联动

    http://blog.csdn.net/gisshixisheng/article/details/40127895 今天在看天地图的时候,有一个多时相的地图显示功能,感觉很好玩,作为技术控的我晚上 ...

  8. Sandbox 沙盒

    In computer security, a sandbox is a security mechanism for separating running programs, usually in ...

  9. jboss 虚拟路径

    jboss 虚拟路径 上传文件到服务器时,保存到服务器发布应用外路径.这时,就要通过在jboss配置虚拟路劲以访问. 在standalong.xml里找到 <subsystem xmlns=&q ...

  10. 网络爬虫 robots协议 robots.txt

    网络爬虫 网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成.传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上 ...