Mysql字符类型比较
一、 binary和char比较:
- binary 字节为单位,char字符为单位,字符占几个字节取决于字符集
- binary 比较规则基于字节值,char基于字符,即使是_bin的比较规则
- 范围都0-255字节,char对于不同字符集,可以存取的字节数不同
- 排序和比较规则都会根据字符码值,而不是词典顺序,如果采用binary那么是区分大小写的,和我们常用的utf8_general_ci相冲突
相同特性,摘自官方文档:
Specifying the CHARACTER SET binary attribute for a character data type causes the column
to be created as the corresponding binary data type: CHAR becomes BINARY, VARCHAR becomes VARBINARY , and TEXT becomes BLOB . For the ENUM and SET data types, this does not occur;
以下两种表定义是等义的:
CREATE TABLE t
(
c1 VARCHAR(10) CHARACTER SET binary,
c2 TEXT CHARACTER SET binary,
c3 ENUM('a','b','c') CHARACTER SET binary
);
CREATE TABLE t
(
c1 VARBINARY(10),
c2 BLOB,
c3 ENUM('a','b','c') CHARACTER SET binary
);
占用空间比较,测试uuid在不同字符集下的占用空间,主要是考虑到uuid是否适合业务主键的问题
创建4个表,第一个表是utf8字符集比较规则是utf8_bin
mysql> create table tc1(synid char(36) character set utf8 collate utf8_bin);
Query OK, 0 rows affected (0.07 sec)
mysql> create table tc2(synid char(36) character set utf8 collate utf8_general_ci);
Query OK, 0 rows affected (0.08 sec)
mysql> create table tc3(synid char(36) character set binary);
Query OK, 0 rows affected (0.06 sec)
mysql> create table tc4(synid binary(36));
Query OK, 0 rows affected (0.11 sec)
插入相同的数据1000条数据,表大小相同:
mysql> SELECT table_name,SUM(data_length) AS data_length
-> FROM information_schema.TABLES WHERE
-> table_name IN ('tc1','tc2','tc3','tc4')
-> GROUP BY table_name;
+------------+----------------+
| table_name | data_length |
+------------+----------------+
| tc1 | 1589248 |
| tc2 | 1589248 |
| tc3 | 1589248 |
| tc4 | 1589248 |
+------------+----------------+
4 rows in set (0.00 sec)
对于相同的原因主要有两方面:
- Basic Latin letters, digits, and punctuation signs use one byte,mysql支持的utf8编码对于基本的拉丁字母、数字、标点符号用一个字节
- A UUID is a 128-bit number represented by a utf8 string of five hexadecimal numbers in aaaaaaaa-bbbb-cccc-dddd-eeeeeeeeeeee format。利用uuid函数生成的uuid是32个十六进制数表示的字符串(由0-9和a-f组成),中间有4个横线分隔,总共有36个字符。
当时测试以上问题主要是为了讨论uuid适不适合做业务主键,以下是我的一些总结:
- 我们物理主键采用int自增,但是业务主键采用uuid
- 这样虽然不够友好,但是可以屏蔽从自增id上获取的业务量。
- 存储上虽然比int要多32个字节,但是现在存储很廉价。我们可以通过去掉无意义的'-'分隔符(32字节),或者采用uuid_short()(20字节)获取全局唯一标识
- 效率依赖于业务,如果是拿uuid查询,那么说明区分度很高了,建立索引效率不成问题。uuid做索引会比主键索引大很多,但在合理内存范围内就不会产生多余IO
- 和SQLServer保持兼容,如果合并停车记录两张表,显然会冲突,用uuid则不会。为了保证兼容sqlserver的Chinese_PRC_CI_AS,建议采用字符集是utf8,比较规则是utf8_general_ci
- 需要注意的是does not work with statement-based replication,主从复制时,基于语句级别的binlog不支持uuid()函数
二、 char和varchar
- 允许创建char(0)类型字段,用于某个字段存在,但是并不用它的值,只存储两个值:null和''
- 范围是0-65535字节,可以存储多少个字符由字符集决定。当字段类型小于255字节时,前缀会存储1个字节;当字段长度大于255时,前缀会存储2个字节
- 当char被存储时,会自动在尾部填充空格到设置的长度。varchar会保留空格。当char被检索时,会移除尾部空格,除非设置了PAD_CHAR_TO_FULL_LENGTH
- 当char被检索时,会移除尾部空格,除非设置了PAD_CHAR_TO_FULL_LENGTH;varchar在检索时会保留尾部空格
- 在严格的SQL mode下,char和varchar类型字段超过最大长度会截断并产生警告,如果截断的是非空字符,那么会阻止插入并报错,在任何SQL mode下,varchar会截断超出长度的空格,char则会截断尾部所有空格
- char和varchar的比较都是忽略尾部空格的,但是除了将尾部空格作为like匹配条件的
注意:需要注意的是,varchar显示是不截断尾部空格的,但在比较的时候忽略空格的,此外varchar存储时会去掉尾部空格,如果该字段被定义成唯一建或主键,去除结尾空格后相同的字符串会违反唯一性约束
三、 binary和vbinary
- binary和vbinary在超过最大设置长度时,在非strict SQL mode下,那么会自动截断并警告;在strict SQL mode下,会阻止插入,并报错。
- binary存储时自动填充值\0(0x00),满足指定长度,例如,char(3),'a '插入变成'a \0','a'变成'a\0\0'。在检索的时候,并不去掉结尾的填充值。
- varbinary,存储时不会填补\0,检索时不会去掉结尾\0
- binary和varbinary在比较时,包括order by和distinct,所有的字节都是有意义的。注0x00<space,不相等
注意:同样,vbinary在需要注意在存储时去掉尾部\0,如果该字段被定义成唯一建或主键,去除结尾\0后相同的字符串会违反唯一性约束
Mysql字符类型比较的更多相关文章
- mysql字符类型大小写敏感的讨论
mysql字符类型默认是不区分大小写的,即select * from t where name='AAA'与='aaa'没区别,以下是测试的例子 (root)); (root,,,,'BbB'); ( ...
- MySQL字符类型datetime与timestamp
这片博客来详细分区一下这哥俩! 首先来说明这两个字符类型: DATETIME 8 1000-01-01 00:00:00 ~9999~12-31 23:59:59 0000-00-00 00:00:0 ...
- mysql string types ---- mysql 字符类型详解
一.mysql 中包涵的字符类型: [national] char [(m)] [character set charset_name] [collate collation_name] [natio ...
- mysql字符类型
字符类型 #官网:https://dev.mysql.com/doc/refman/5.7/en/char.html #注意:char和varchar括号内的参数指的都是字符的长度 #char类型:定 ...
- MySQL字符类型学习笔记
目录 一.字符集和字符编码 1.1.字符集 1.2.字符编码 二.字符集排序规则 2.1.排序规则定义 2.2 .排序规则特征 三.CHAR和VARCHAR 3.1.CHAR类型 3.2.VARCHA ...
- MySQL 字符类型
字符类型 MySQL提供了多种关于字符存储的类型,但是在大多数情况下我们只使用char和varchar即可 类型 大小 用途 CHAR 0-255字节 定长字符串 VARCHAR 0-65535 字节 ...
- MYSQL字符类型数值排序
今天遇到MySQL数字排序问题,我的排序字段是经过计算后的,而计算后的字段直接拿来排序就会按照字符一个个排序,所以这里找到简单的方法, ORDER BY 排序字段* 或者 ORDER BY 排序字段+ ...
- mysql字符类型总结及常用字符函数
常用字符串函数: concat(s1,s2,s3..) 连接s1,s2,...sn为一个字符串 INSERT(str,x,y,instr)将字符串str从x位置开始,y个字符串替换为字符串 ...
- mysql数值类型总结及常用函数
最近在学习下,总结一下mysql数值类型: mysql字符类型分: 1.整数类型: 字节 值范围 INTERGER 1 ...
随机推荐
- ado.net五大对象
五大对象分别是: 1. Connection:与数据源建立连接. 2. Command:对数据源执行SQL命令并返回结果. 3. DataReader:读取数据源的数据,只允许对将数据源以只读.顺向的 ...
- MYSQL常见语句
SHOW INDEXES from tablename EXPLAIN tablename EXPLAIN SELECT * FROM tablename
- jQuery获取多种input值的方法
1 if($("input[name=item][value='val']").attr('checked')==true) //判断是否已经打勾 name即控件name属性,va ...
- while 循环的使用
以下是一个基本的while循环,测试条件是:如果COUNTER小于5,那么返回 true.COUNTER从0开始,每次循环处理时,COUNTER加1.运行上述脚本,返回数字1到5,然后终止. COUN ...
- CentOS 7 ssh脚本 求两个数值的“和”,“乘积”,”商“
1:在目录下创建一个 sh文件 touch 1.sh 2:进入sh文件书写sh脚本 #!/bin/bash read -p "请输入第一个数值" A read -p " ...
- 设置XtraForm标题居中
public class CustomFormPainter : FormPainter { public CustomFormPainter(Control owner, DevExpress.Sk ...
- .net解决程序集版本冲突的方法
以log4net为例,分为两种情况 1.不同version,相同publicKeyToken 在bin里放较新版本的dll 并在web|app.config的<configuration> ...
- CocoaPods使用详细说明
使用说明: 原文:http://blog.csdn.net/lizhongfu2013/article/details/26384029 http://blog.csdn.net/showhillle ...
- js随机颜色生成
return '#'+('00000'+(Math.random()*0x1000000<<0).toString(16)).slice(-6);
- 服务端性能测试工具校验v1.1
服务端性能测试工具校验v1.1 更新说明: 1.精简CRT运行库支持. 2.添加响应模拟测试,校验压力测试工具的响应时间统计准确性. 3.大并发请求请降低延迟时间 WEIMJSAM原创,转载请注明出处 ...