入门扫盲:https://www.2cto.com/database/201701/584442.html

1、修改springweb类bug

2、数据库连接配置

3、数据库字符集

https://www.cnblogs.com/chuiyuan/p/5198663.html

在将数据插入到MySQL数据库后,出现了中文乱码。

解决过程中,主要参考了下面几个文章。

字符集与字符编码

http://cenalulu.github.io/linux/character-encoding/(重点参考)

解决MySQL乱码问题

http://cenalulu.github.io/mysql/mysql-mojibake/(重点参考)

http://www.ha97.com/5359.html(重点参考)

一.字符集与字符编码

字符集规定某个文字对应的二进制数字存放方式(编码)和某串二进制数值代表了哪个文字(解码)的转换关系。

字符集只是一个规则的集合的名字,对应到真实的生活中,字符集就是对某种语言称呼,如英语,汉语。一个字符集有三个关键的元素:

字库表:所有可读或者可以显示的字符的数据库,决定了这个字符集能够展现的所有字符的范围。

编码字符集:用一个编码值(code point)来表示一个字符在字库表中的位置。

字符编码:编码字符集与实际存储数值之前的转换关系,一般来说都是将code point值作为编码后的值直接存储。如A 在ASCII的表中排第65位,而编码后的A就是65。

问题:字库表中每个字符都有一个自己的序号,直接将序号作为存储内容就可以了,为什么还要通过字符编码把序号转换成另外一种存储格式呢?

原因:统一字库表的目的是能够含有所有的字符,但是实际使用时只会使用一小部分,如中文地区不会使用日语,而一些英语国家甚至只用简单的ASCII字库表就可以了,如果把每个字符都用字库表中的序号来表示,则每个字符都要3个字节(unicode字库为例子),这种情况对原来只战胜一个字符的ASCII编码的国家显然是一个浪费。

二.UTF-8和Unicode的关系

Unicode

编码字符集,随着互联网的发展,对同一字库集的要求越来越迫切,因此出现了Unicode标准,它几乎涵盖了各个国家的语言可能出现的符号与文字,并将它们进行编号。

UTF-8

字符编码,是Unicode规则字库的一种实现形式。虽然它现在是接受度最好的一个字符集编码,但是并没有涵盖整个Unicode的字库。

三.UTF-8编码实现

下面介绍下UTF-8的编码实现,也就是它的物理存储和Unicode序号的转换关系。

UTF-8编码为变长编码,最小编码单位(code unit)为一个字节,一个字节的前1-3个bit为描述性部分,后面为实际序号部分。

  • 如果一个字节的第一位为0,那么代表当前字符为单字节字符,占用一个字节的空间。0之后的所有部分(7个bit)代表在Unicode中的序号。
  • 如果一个字节以110开头,那么代表当前字符为双字节字符,占用2个字节的空间。110之后的所有部分(5个bit)加上后一个字节的除10外的部分(6个bit)代表在Unicode中的序号。且第二个字节以10开头
  • 如果一个字节以1110开头,那么代表当前字符为三字节字符,占用2个字节的空间。110之后的所有部分(5个bit)加上后两个字节的除10外的部分(12个bit)代表在Unicode中的序号。且第二、第三个字节以10开头
  • 如果一个字节以10开头,那么代表当前字节为多字节字符的第二个字节。10之后的所有部分(6个bit)和之前的部分一同组成在Unicode中的序号。

可以看到,UTF-8字符编码是以一定方式实现了Unicode规则的字库。

四.乱码的出现

出现的原因:在编码与解码时使用了不同或者不兼容的字符集。

就如同英语的bless与法语的bless,意思不同一样,同一个汉字在UTF-8中的编码与在GBK中的编码不同,就会出现筹码。

五.MySQL出现乱码的原因

  主要分析:从客户端发起请求,到MySQL存储数据,再到下一次从表中取出数据到客户端,中间那些环节出现了编码/解码。

(1)存入MySQL的过程

1.客户端(也就是用户端)编码成二进制流。

2. MySQL Server解码。

3.Client编码向表编码转换。

详细的过程为:

  • 在terminal中使用输入法输入
  • terminal中气字符编码转换成二进制流
  • 二进制流通过MySQL客户端传输到MySQL Server
  • Server通过character-set-client解码
  • 判断character-set-client和目标表的charset是否一致
  • 如果不一致则进行一次从client-charset到table-charset的字符编码转换
  • 将转换后的字符编码二进制流保存到文件中

(2)从MySQL表中取出数据的过程

1.table-charset向character-set-client编码的转换。

2.MySQL Server根据character-set-client编码得到二进制流。

3.client解码展示。

详细过程为:

从文件读出二进制数据流

用表字符集编码进行解码

将数据转换成character-set-client的编码

使用character-set-client编码为二进制流

Server通过网络等传输到远端的client

client通过bash配置的字符编码展示结果

(3)造成MySQL乱码的原因

1.存入和取出时对应环节的编码不一致

  如在存入时,我们客户端使用的UTF-8编码,而读出时,客户端却使用的windows的GBK编码。则会出现乱码。

2.单个流程中三步的编码不一致

  上面的任意一幅图中的同方向的三步中,只有两步或者两步以上的编码有不一致,就有可能出现编码解码错误。如果不同的两个字符集之前无法进行无损编码转换,则一定会

出现乱码。如:bash 是UTF8编码,MySQL的character-set-client配置成了GBK,而表结构的编码又是charaset=utf8,则肯定会出现乱码。

(4)关于MySQL编码解码的问题

从上面的图中可以看到,系统之前是用二进制流进行传输的,那为什么不直接将这串二进制流存入表文件,而还要在存储前进行两次编解码呢?

1.Client to Server的编码解码原因是MySQL要对传来的二进制流做语法和词法解析,如果不做编码解码和校验,我们甚至不知道传输来的二进制流是insert 还是update。

2.File to Engine的编码解码是为知道二进制流内的分词情况,例如从表里面取出某个字段的前两个字符的命令:select left(col,2) from table  ,存储引擎从文件诗篇这个column的值,再按照相应的编码进行分割,不同的编码分割的结果是不一样的(有的一个字符为两字节,有的为三字符等)。因此,在从数据文件读取数据后,如果不进行编码解码的话,在存储引擎同是无法进行字符级别的操作的。

(5)如何避免乱码

从上面的分析可以看出,只要做到:客户端,MySQL character-set-client,table-charset三个字符集完全一致就可以保证不出现乱码了。

六 .Linux下修改字符集编码为UTF8,解决中文乱码问题

(1)查看当前数据库的相关编码集

可以看到,character_set_database和character_set_server的默认字符集还是latin1。

注意:

latin1是8bit 大小的字符集,latin1, ASCII,UTF8字符集的区别参考

http://blog.sina.com.cn/s/blog_5edf2a9f0100sicm.html

(2)修改mysql配置文件

  首先我们通过命令whereis找到mysql配置文件的位置。

在/etc/mysql/中找到配置文件my.cnf里说明有

因此我们将其复制到用户目录下,并修改其权限

修改配置中的字符集

在[client]里加入

default-character-set=utf8

在[mydqld]里加入

character-set-server=utf8

在[mysql]里加入

default-character-set=utf8

修改后,重启 mysql服务

sudo /etc/init.d/mysql restart

但是在我们再次使用mysql时,出现了下图中的问题

原因是之前的步骤中我们修改了.my.cnf文件的权限,mysql担心这种文件被其它用户恶意修改,所以选择了忽略,改正这个问题

再次启动,发现修改~/.my.cnf的并没有生效,先忽略这个问题,直接在/etc/mysql/my.cnf中修改,重启,查看字符集

这次正确了。

注意:暂没有发现为什么~/.my.cnf文件修改后没有起到作用。

springboot字符集乱码的更多相关文章

  1. MySQL字符集乱码详解

    对于MySQL数据库中出现乱码经常是新手碰到的一个头痛的问题,不知道为什么经常出现中文乱码. 1.对于所谓的数据库中乱码,其实这中说法是错误的,只是我们不认识服务器给我们的字符.其实还是原来的字符?那 ...

  2. mysql proxy 数据库读写分离字符集乱码

    mysql proxy 数据库读写分离字符集乱码 解决办法 在对应配置后端数据库服务器的配置.cnf中加入如下代码 init-connect='SET NAME UTF8' skip-characte ...

  3. 【转】Spring-boot 字符集设置 解决乱码方案

    使用spring-boot开发时候,有时候程序没事,往往不经意会造成中文到前端变成乱码(????这样情况) 下面给出spring-boot项目统一字符集设置方案: 1.Spring Boot修改编码方 ...

  4. MySQL2.字符集乱码

    MySQL2.字符集 此节记录下MySQL出现乱码的原因.还是参考小册子~ 字符集简介 计算机中只能存储二进制数据,建立字符与二进制数据的映射关系来存储字符. 从两方面考虑: 1.界定清楚字符范围,即 ...

  5. 常见字符集&乱码问题

    字符集 常用字符集分类 ASCII及其扩展字符集 作用:表语英语及西欧语言. 位数:ASCII是用7位表示的,能表示128个字符:其扩展使用8位表示,表示256个字符. 范围:ASCII从00到7F, ...

  6. MySQL字符集乱码

    学数据库,最让人丧气的就是字符集的问题了,一旦出问题,就会有砸电脑的冲动,特别是在修改很多次字符集后依然不成功的时候! 我用的数据库软件是MySQL 5.1.28.最初出问题的时候,是这样的: 情景一 ...

  7. 字符集乱码问题:ISO-8859-1和GBK

    问题,引用百度知道的问题吧: http://zhidao.baidu.com/question/51342167.html?qbl=relate_question_0&word=%C3%84% ...

  8. SpringBoot中文乱码解决方案

    转载:https://blog.csdn.net/wangshuang1631/article/details/70753801 方法一,修改application.properties文件 增加如下 ...

  9. mysql字符集乱码问题

    程序错误截图如下: 分析:我们mysql数据库没有设置默认编码, 导致创建的库字符集为 latin1,然而我们创建表的时候,指定字符集为其他的,比如utf8 我的解决思路:把数据库的编码修改为utf8 ...

随机推荐

  1. 【原】无脑操作:IDEA + maven + SpringBoot + JPA + EasyUI实现CRUD及分页

    背景:上一篇文章的界面太丑.没有条件查询功能.所以做一些改进,整合EasyUI做实现.(仅以此文纪念表格中出现的这些朋友工作六周年,祭奠一下逝去的青春^_^) 一.开发环境(参照上一篇文章) 补充:E ...

  2. 记录解决python在spark运行加载第三方库的问题

    一般写python的我们经常会import一些常用的库,然后有时集群环境上的python没有这些库,怎么办呢? 通过一段时间的摸索发现有二种方式可以解决这个问题: 第一种方法: 下载对应python的 ...

  3. AIX分页(交换)空间的监控

    1.分页和交换 这两个概念,很多人混为一回事儿,两者虽然有共性,但也有些差别.分页是进程的部分内容在RAM和磁盘的分页空间间移动,而交换是整个进程在RAM和磁盘的分页空间间移动,在将进程移到磁盘分页空 ...

  4. sublime COMMAND + B 调用 python3 运行

    用sublime写了python3的代码,COMMAND + B运行调用 PYTHON3 我们先来新建一个sublime build system 然后自动打开了一个文本,清空并写入以下内容: { & ...

  5. 【原创】Linux服务器集群通过SSH无密码登录

    SSH 无密码授权访问slave集群机器 1. 安装SSH,所有集群机器,都要安装SSH环境介绍:  Master : CNT06BIG01 192.168.3.61 SLAVE 1: CNT06BI ...

  6. 常用数据库连接池 (DBCP、c3p0、Druid) 配置说明

    1. 引言 1.1 定义 数据库连接是一种关键的有限的昂贵的资源,这一点在多用户的网页应用程序中体现得尤为突出.对数据库连接的管理能显著影响到整个应用程序的伸缩性和健壮性,影响到程序的性能指标.数据库 ...

  7. Redis sentinel & cluster 原理分析

    1. Redis集群实现分析 1.1  sentinel 1.   功能 Sentinel实现如下功能: (1)monitoring--redis实例是否正常运行. (2)notification-- ...

  8. Docker 网络管理及容器跨主机通信

    1.网络模式 docker支持四种网络模式,使用--net选项指定: host,--net=host,如果指定此模式,容器将不会获得一个独立的network namespace,而是和宿主机共用一个. ...

  9. linux --> ubuntu和mac通过samba共享

    ubuntu和mac通过samba共享 如果想快速配置,直接跳到第五步. 一.安装smb 执行下列命令 sudo apt-get install samba sudo apt-get install ...

  10. Java多线程:ThreadLocal

    一.ThreadLocal基础知识 ThreadLocal是线程的一个本地化对象,或者说是局部变量.当工作于多线程中的对象使用ThreadLocal维护变量时,ThreadLocal为每个使用该变量的 ...