数据库设计的误区—>CHAR与VARCHAR
字符型字段是数据库表中最常见的字段,而字符型字段又分为定长和变长两种。一般来说,VARCHAR类型用于存储内容长度变化较大的数据,CHAR类型用于存储内容长度没有变化或变化不大的数据。
在数据的内部存储上,一般VARCHAR型字段会使用1或2个字节作为数据的长度描述,数据的后面不含无意义的空格;而CHAR型字段会将数据的结尾以空格填充,直至填满定义的长度。
在数据的操作效率上,UPDATE含有变长字段的变长记录会花费较多时间,而对INSERT、DELETE和SELECT操作则没有明显差别。
在数据的索引和匹配上,VARCHAR型字段会将’张三’和’张三 ‘认为是两项不同的数据,而CHAR则认为它们是等同的。
当CHAR型字段与VARCHAR型字段进行关联时,多数的数据库都是以变长字段作为基准,不对CHAR型字段的尾部空格进行裁剪。因此,VARCHAR(12)中的’张三’和CHAR(12)中的’张三’是不相等的,无法进行直接关联。
通常,对于VARCHAR型字段的处理周期为:获取数据、TRIM数据、存储数据、读取数据、展示数据;而对于CHAR型字段的处理周期为:获取数据、存储数据、读取数据、TRIM数据、展示数据。
从对比中我们可以看出,两者的差别在于TRIM数据的处理位置。实际上两者差别还在于:对于VARCHAR型字段来说,TRIM是必须的,而对于CHAR型字段来说,TRIM则是根据需要可选的。也就是说,总体上讲,VARCHAR型字段的处理过程比CHAR型字段的处理过程复杂,因而效率也就不如CHAR型字段高。
另一方面,在进行字段值相等的判断时,VARCHAR型字段首先比较两个字段值的长度,只有在长度相同的情况下才进一步比较其内容;而CHAR型字段直接进行内容的比较。因此从字段值相等的判断这个角度来看,多数情况下,VARCHAR型字段的效率要高于CHAR型字段。
那么在数据库表的设计时,应该如何选择字段的CHAR和VARCHAR类型呢?我主张的原则是:对于长度变化不大的字段,应该使用CHAR型,而对于长度变化较大的字段,则可以考虑使用VARCHAR。还有一些长度变化较大的字段,由于其记录经常被修改,为提高效率,这类字段也应该使用CHAR型字段。也就是说,应该首选CHAR型。举几个例子来说明:
对于9位的机构编码字段,由于所有编码都是9位填满的,因此应该使用CHAR型,如果使用了VARCHAR型,则不仅浪费了存储空间,也降低了所有处理的效率。
对于身份证号码,由于存在15位与18位的差别,此时可以选择使用VARCHAR字段;但是考虑到15和18之间的变化不大,使用CHAR字段也是可以的。特别是15位身份证号是一个历史遗留问题,后续的数据都将是18位的,因此选用CHAR型字段对将来的效率优势是明显的。
对于家庭住址,由于其长度的差距会较大,而且其所在记录也不会被频繁修改,因此非常适宜用VARCHAR型字段进行存储。
通常情况下,满足下列条件之一,我们就应该使用CHAR:
1.字段值长度不变或变化不大;
2.所在记录会被频繁修改。
掌握了上述原则,我们就可以在数据库表的设计时,通过综合考虑各方面的因素来确定字符型数据的类型。按照上一篇中推荐的“业务键”设计模式,通常作为主键的字段都是长度没有变化或变化不大的字段,如账号、卡号、机构号、身份证号等,应该采用CHAR型;而对于其它非索引字段,可根据其内容及其它因素选用CHAR或VARCHAR。
当我们的数据表与外部系统的数据表关联时,如果对方没有按照我们的规则进行数据库表设计,导致在关联字段上一方使用的是CHAR而另一方为VARCHAR,这时就要仔细斟酌数据的转换方式。
如果双方在关联字段上都没有索引,则将CHAR转为VARCHAR会好一些;如果一方有索引而另一方没有,那么就要把关联的数据类型转换为有索引的那个;如果双方都有索引且都要在操作中使用,那么就将数据记录相对较少的那个转换为相对较多的那个。CHAR转VARCHAR使用TRIM,VARCHAR转CHAR使用CAST。
现在,VARCHAR的滥用是数据库设计中另一个非常严重的现象。在数据库设计时,不对数据进行调研和分析,甚至直接想当然地就把所有字符字段设定为VARCHAR(30),这对应用系统的运行和维护都是非常不利的。不针对字段的特点进行精确的描述,就不便于精确地理解业务模型,随着应用系统功能的不断扩充和升级,整个系统模型就会越来越模糊,直至无法维护,最后只好推翻重来,这个代价是非常大的。
数据库设计的误区—>CHAR与VARCHAR的更多相关文章
- 数据库字段类型中char和Varchar区别
char和varchar区别 char类型:对英文(ASCII)字符占用1个字节,对一个汉字占用2个字节,char存储定长数据很方便,char字段上的索引效率级高,比如定义char(10),那么不论你 ...
- 数据库设计(字段)中的char、varchar、text和nchar、nvarchar、ntext的区别
char.varchar.text和nchar.nvarchar.ntext的区别 1.CHAR.CHAR存储定长数据很方便,CHAR字段上的索引效率级高,比如定义char(10),那么不论你存储的数 ...
- 数据库中char和varchar区别
区别: 1)char长度是固定,而varchar长度是可变的: 比如:'abc'对于char(10)表示存储字符将占10个字节(包括7个空字符),而同样varchar(10)只占3个自己长度,10只是 ...
- MySQL之char、varchar和text的设计
最近有表结构设计中出现了varchar(10000)的设计引起了大家的讨论,我们下面就来分析分析. 首先我们先普及一下常识: 1.char(n)和varchar(n)中括号中n代表字符的个数,并不代表 ...
- 数据库中char和varchar的区别
1. char类型的长度是固定的,varchar的长度是可变的. 这就表示,存储字符串'abc',使用char(10),表示存储的字符将占10个字节(包括7个空字符) 使用varchar2(10),, ...
- sqlserver数据库中char、varchar、text与nchar、nvarchar、ntext数据类型使用详解
很多开发者进行数据库设计的时候往往并没有太多的考虑char, varchar类型,有的是根本就没注意,因为存储价格变得越来越便宜了,忘记了最开始的一些基本设计理论和原则,这点让我想到了现在的年轻人,大 ...
- 数据库中char与varchar类型的区别
在建立数据库表结构的时候,为了给一个String类型的数据定义一个数据库的数据库类型,一般参考的都是char或者varchar,这两种选择有时候让人很纠结,今天想总结一下它们两者的区别,明确一下选择塔 ...
- 小谈数据库Char、VarChar、NVarChar差异
1. char 固定长度,最长n个字符. 2. varchar 最大长度为n的可变字符串. (n为某一整数,不同数据库,最大长度n不同) char和varchar区别: ...
- 批量替换数据库中所有用户数据表中字段数据类型为char和varchar到nvarchar的脚本
解决问题:字段类型为char的总是占用指定字节长度(末尾好多空白符号),varchar数据类型长度一个汉字占2个字节,内容存储为中文的字段个人建议全部使用nvarchar. 操作说明:打开SQL Se ...
随机推荐
- mysql distinct、group_concat
mysql distinct语句用于查询多条不重复记录值(去重.过滤多余的重复记录) distinct同时作用了两个字段或者两个以上的字段,必须得作用了的字段都相同的才被排除.如果想让单个列" ...
- bootstrap-table 表头和内容对不齐解决办法
偶然机会学习bootstrap,表格利用bootstrap-table实现,使用bootstrap-table过程中,发现了一个非常棘手的问题,在ie浏览器中,表格的表头和内容对不齐,特别是列比较多且 ...
- 可用类型的几何对象esriGeometryType Constants
The available kinds of geometry objects. Constant Value Description esriGeometryNull 0 A geometry of ...
- spring boot + neo4j restful
整整折腾了三天,终于把spring boot + neo4j的路走通了. 这里介绍3个部分,pom,entity,repository 1)pom <?xml version="1.0 ...
- Nginx http_user_agent 防御 ab 等
日志出现大量: xxxxxxxxxxxxx - - [04/Jul/2013:23:37:49 +0800] "GET /1000.html HTTP/1.0" 200 56471 ...
- java 单元测试 注入
ApplicationContext appContext = new ClassPathXmlApplicationContext("appContext.xml"); MySQ ...
- PHP 正则函数
在PHP中有两套正则表达式函数库.一套是由PCRE(Perl Compatible Regular Expression)库提供的.PCRE库使用和Perl相同的语法规则实现了正则表达式的模式匹配,其 ...
- Delphi中unicode转汉字函数(转)
源:Delphi中unicode转汉字函数 近期用到这个函数,无奈没有找到 delphi 自带的,网上找了下 有类似的,没有现成的,我需要的是 支持 “\u4f00 ” 这种格式的,即前面带标准的 “ ...
- Android SQLite 加入自定义函数
SQLite Database 自定义函数实现: //Here's how to create a function that finds the first character of a strin ...
- iOS开发 missing iOS distribution signing identity for 。。。
苹果真是不让人省心,新年一来上传APP,就出现Missing iOS Distribution signing indetity for xxx 于是就把证书删了做,做了删了再重做,还是不行 百度了一 ...