MySQL 字符集与比较规则

由于 MySQL 客户端与服务端之间通信时需要将字符串编码传输,所以不可避免会产生编码转换

字符集

MySQL 中 utf8 就是 utf8mb3,只使用 1~3 个字节表示字符

utf-8md4 使用 1~4 个字节表示字符

相关参数

MySQL 服务器有以下几个参数与编码有关

字符集相关参数:

character_set_server 服务器级别的字符集

character_set_database 当前数据库的字符集 (如果没有使用 USE 选择数据库,则查看服务器级别的字符集) 只读,无法通过修改改变当前数据库参数

字符集转换相关参数:

character_set_client 服务器会认为客户端发送的请求为这个字符集,会将请求以这个字符集的形式进行解码,获取请求内容

character_set_connection 服务器内部处理请求时使用的字符集,服务器会将客户端的请求以这个字符集的形式进行编码 (如果与处理的数据字符集不同就会再进行一次转换)

character_set_results 服务器会将返回的结果以这个字符集的形式进行编码后返回给客户端

查看命令

MySQL 支持许多字符集,通过以下命令可以查看所有支持的字符集

SHOW CHARACTER SET;
SHOW CHARSET;

其中 Default collation 就是这种字符集的默认比较规则,Maxlen 就是这种字符集表示一个字符最多需要的字节数

查看其他参数

SHOW VARIABLES LIKE 'character_set_server';
SHOW VARIABLES LIKE 'character_set_database';
SHOW VARIABLES LIKE 'character_set_client';
SHOW VARIABLES LIKE 'character_set_connection';
SHOW VARIABLES LIKE 'character_set_results';

设置命令

设置字符集参数

服务器级别:

SET character_set_server 字符集名;

数据库级别:

CREATE DATABASE 数据库名
CHARACTER SET 字符集名称; ALTER DATABASE 数据库名
CHARACTER SET 字符集名称;

表级别

CREATE TABLE 表名 (列的信息)
CHARACTER SET 字符集名称; ALTER TABLE 表名
CHARACTER SET 字符集名称;

列级别

CREATE TABLE 表名(列名 字符串类型 CHARACTER SET 字符集名称);

ALTER TABLE 表名 MODIFY 列名 字符串类型 CHARACTER SET 字符集名称 ;

设置字符集转换参数

一般为了方便会将三个参数设置为同一字符集

使用以下命令就可以同时设置三个参数

SET NAMES 字符集名;

当然也可以分开设置

SET character_set_client = 字符集名;
SET character_set_connection = 字符集名;
SET character_set_results = 字符集名;

比较规则

比较规则有时也称为排序规则,用于在字符串比较大小时规定其顺序的

同一种字符集可以有多种比较规则

命名规则

每一种字符集都可能对应多种比较规则,这些比较规则命名规律为

  • 比较规则名称以对应的字符集名称开头
  • 中间部分表示主要用于哪种语言
  • 后缀有以下几种:
后缀 全称 含义
`_ai` accent insensitive 不区分重音
`_as` accent sensitive 区分重音
`_ci` case insensitive 不区分大小写
`_cs` case sensitive 区分大小写
`_bin` binary 以二进制方式比较

示例:
`utf8_spanish_ci` 表示以西班牙语比较,且不区分大小写

相关参数

collation_server 服务器级别的比较规则

collation_database 当前数据库的比较规则 (如果没有使用 USE 选择数据库,则查看服务器级别的比较规则) 只读,无法通过修改改变当前数据库参数

查看命令

将比较规则全部列出来比较多,可以根据对应的字符集进行筛选

SHOW COLLATION;
SHOW COLLATION LIKE 'utf8\_%';

其中 Charset 表示对应的字符集,Default 表示是否为默认比较规则

设置命令

设置比较规则参数

服务器级别:

SET collation_server 比较规则名;

数据库级别:

CREATE DATABASE 数据库名
COLLATE 比较规则名称; ALTER DATABASE 数据库名
COLLATE 比较规则名称;

表级别

CREATE TABLE 表名 (列的信息)
COLLATE 比较规则名称; ALTER TABLE 表名
COLLATE 比较规则名称;

列级别

CREATE TABLE 表名(列名 字符串类型 COLLATE 比较规则名称);

ALTER TABLE 表名 MODIFY 列名 字符串类型 COLLATE 比较规则名称 ;

总结

当只修改某个级别的字符集或比较规则时,相同级别对应的比较规则或字符集也会跟着改变为对应的 (默认的)

当创建数据库时如果没有指定字符集和比较规则,则默认使用服务器级别的参数

创建表时没有指定字符集和比较规则,则默认使用表所在数据库的参数

创建列时没有指定字符集和比较规则,则默认使用列所在表的参数

MySQL 字符集与比较规则的更多相关文章

  1. MySQL字符集与排序规则总结

      字符集与排序规则概念 在数据库当中都有字符集和排序规则的概念, 很多开发人员甚至包括有些DBA都会将这个混淆,当然这个情况也有一些情有可原的原因.一来两者本来就是相辅相成,相互依赖关联: 另外一方 ...

  2. MySql字符集与排序规则详解

    前段时间往MySQL中存入emoji表情或生僻字.繁体字时,报错无法添加,研究后发现这是字符集编码的问题,今天就来分析一下各个字符集与排序规则 一.字符集 先说字符,字符是各种文字和符号的总称,包括各 ...

  3. MySQL字符集及校对规则的理解

      阅读目录:MySQL的字符集和校对规则 MySQL的字符集 MySQL与字符集 正确使用字符集 MySQL客户端与字符集 字符集编码转换原理 字符集常见处理操作 字符集的正确实践 MySQL的校对 ...

  4. Mysql字符集与校对规则

    字符集是一套字符和编码的集合,校对规则是用于比较字符集的一套规则. 所以字符集有两部分组成字符集合和对应的编码集合.比如说,现在有这几个字符:A B a b, 假设它们对应的编码分别是00, 01, ...

  5. mysql字符集与比较规则

    MySQL有4个级别的字符集和比较规则,分别是: 服务器级别 数据库级别 表级别 列级别 查看服务器级别命令: mysql> SHOW VARIABLES LIKE 'character_set ...

  6. MySQL 字符集及校验规则

    字符集 Mysql 的字符集有4个级别的默认设置:服务器级,数据库级,表级和字段级,客户端交互时,也可以指定字符集 # 字符集:是一个系统支持的所有抽象字符的集合.字符是各种文字和符号的总称,包括各国 ...

  7. Mysql 字符集及排序规则

    一.字符集 字符集:就是用来定义字符在数据库中的编码的集合. 常见的字符集:utf8.Unicode.GBK.GB2312(支持中文).ASCCI(不支持中文)   二.字符集排序规则   作者本人用 ...

  8. mysql字符集问题,及排序规则

    字符集问题: 基本概念 • 字符(Character)是指人类语言中最小的表义符号.例如’A'.’B'等:• 给定一系列字符,对每个字符赋予一个数值,用数值来代表对应的字符,这一数值就是字符的编码(E ...

  9. MySQL 字符集和校验规则工作流程

    MySQL 字符集和校验规则工作原理 字符编码相关参数 数据流中的转码过程 校验规则 Tips:字符集和校验规则总是相伴的 一 从简单的建库语句开始 CREATE DATABASE [IF NOT E ...

随机推荐

  1. python中copy()和deepcopy()详解

    **首先直接上结论: —–我们寻常意义的复制就是深复制,即将被复制对象完全再复制一遍作为独立的新个体单独存在.所以改变原有被复制对象不会对已经复制出来的新对象产生影响.—–而浅复制并不会产生一个独立的 ...

  2. 排序算法| Array.sort()算法规则

    1.js的Array.sort()是使用什么算法排序: 1.火狐中是“归并排序” 2.V8引擎是 “插入排序和快速排序结合”.数组长度不超过10时,使用插入排序.长度超过10使用快速排序.在数组较短时 ...

  3. ASM与ASMD

    时序机 状态机 控制器 数据通路之间的关系 样例代码

  4. python之海龟绘图

    1. 基本功能介绍 在海龟作图中,我们可以编写指令让一个虚拟的(想象中的)海龟在屏幕上来回移动.这个海龟带着一只钢笔,我们可以让海龟无论移动到哪都使用这只钢笔来绘制线条.通过编写代码,以各种很酷的模式 ...

  5. 洛谷 P3373 【模板】线段树 2

    洛谷 P3373 [模板]线段树 2 洛谷传送门 题目描述 如题,已知一个数列,你需要进行下面三种操作: 将某区间每一个数乘上 xx 将某区间每一个数加上 xx 求出某区间每一个数的和 输入格式 第一 ...

  6. Keras保存模型并载入模型继续训练

    我们以MNIST手写数字识别为例 import numpy as np from keras.datasets import mnist from keras.utils import np_util ...

  7. Python连载51-网络编程基础知识

    一.网络编程 1.网络.网络协议(一套规则) 2.网络模型: (1)七层模型-七层 物理层(比如网线.锚).数据链路层(比如电压电流).网络层.传输层.会话层.表示层.应用层(我们的活动基本都在这一层 ...

  8. python接口自动化7-post文件上传

    前言 文件上传在我们软件是不可少的,最多的使用是体现在我们后台,当然我们前台也会有.但是了解过怎样上传文件吗?这篇我们以禅道文档-创建文档,上传文件为例. post请求中的:Content-Type: ...

  9. 常用的app包名和类名

    应用 包名 启动类 QQ com.tencent.mobileqq com.tencent.mobileqq.activity.HomeActivity 微信 com.tencent.mm com.t ...

  10. 关于unittest单元测试框架中常用的几种用例加载方法

    unittest模块是Python自带的一个单元测试模块,我们可以用来做单元测试.unittest模块包含了如下几个子模块: 测试用例:TestCase 测试集:TestSuite 加载用例:Test ...