oracle汉字占多少字节问题

这个其实和Oracle的配置是相关的,用以下语句查询: select * from v$nls_parameters t where t.PARAMETER='NLS_CHARACTERSET'; 可以查询到当前数据库的字符集,如果value=ZHS16GBK,那么一个汉字占用2个字节,如果value=AL32UTF8,那么一个汉字占用3个字节.…

字节数与字符数mysql_mysql里一个中文汉字占多少字节数？

在mysql中,如果是latin1字符集下,一个中文汉字占2个字节数:如果是utf8字符集下,一个中文汉字占3个字节数:如果是gbk字符集下,一个中文汉字占2个字节数. mysql各字符集下汉字和字母占字节数 varchar(N), 这里的N是指字符数,并不是字节数．占用的字节数与编码有关在mysql 5.1.5-alpha下测试得出如下结论 latin1: 1character=1byte, 1汉字=2character, 也就是说一个字段定义成 varchar(200),则它可以存储100…

Oracle 汉字在不同字符集下所占字节

今天发现了一个问题,一个长度设置为2000字节的字段,插入一条长度为1000的汉字数据,竟然报错了. 一个汉字占两个字节,按理说刚好是2000个字节.但通过查看日志,发现插入数据的长度为3000字节. 百度了一下,原来是不同的字符集造成的. 一般情况下,数据库的NLS_CHARACTERSET 为AL32UTF8或UTF8,即一个汉字占用三到四个字节.如果NLS_CHARACTERSET为ZHS16GBK,则一个字符占用两个字节. 而公司的运行环境上是AL32UTF8,因此一个汉字占到了3个字节…

mysql和oracle的一个汉字占几个字符

以前一直使用oracle11g,一个汉字占3个字节,所以在操作mysql时也一直这样分配长度. 今天测试了下发现不对了可以看到第一个的长度确实是15,但是第二个为什么是5? 在网上找到资料:char_length计算的是字符长度,而length计算的是字节长度,刚好我使用的是utf8,一个汉字占3个字节,占一个字符. 那好了,应该是对的上了,可是好奇心我就试了下为什么这是相同的?因为这不是汉字好了,现在知道原来mysql和oracle一样的,但是又看到一篇说mysql的varchar与or…

Oracle-一个中文汉字占几个字节?

Oracle 一个中文汉字占用几个字节 Oracle 一个中文汉字占用几个字节,要根据Oracle中字符集编码决定!!! 1. 如果定义为VARCHAR2(32 CHAR),那么该列最多就可以存储32个汉字,如果定义字段为VARCHAR2(32) 或VARCHAR2(32 BYTE)那么它最多可以存储多少个汉字就要视数据库字符集编码决定 *************************************************************** 2.ORACLE数据库中文可以…

yii2: oracle汉字占用字节长度

OCIStmtExecute: ORA-12899: value too large for column "WSG"."WX_ENTER_TASTE"."GENDER" (actual: 3, maximum: 2) 今天调查一个oracle数据库问题的时候,发现在11g中一个汉字占2个字节,在10g中占3个字节,导致将11g数据库中的数据导入到10g的时候总是出错,开始的时候还以为是11g和10g的版本不一样,汉字占用字节数不一样,后来一想,…

ORACLE中一个字符占多少字节？

问题描述或许你会说一个中文字符占2个字节,这是一定的?如何计算一个字符串的字节数? 解决方案在oracle中一个字符特别是中文占几个字节是不同的. 比如我创立一个表create table test_ly(a varchar2(4),b nvarchar2(4)) 你说a列能插入两个汉字吗? 错!最多能插入一个汉字加一个字母(或数字). 这是为什么?因为一个汉字在a字段中占了3个字节,其他字符(比如数字或者字母或者英文标点符号)占1个字节, 你说b列最多能插入多少个汉字,2个? 错!b列最多…

关于java中char占几个字节，汉字占几个字节

我们平常说,java中char占2个字节,可又说汉字在不通的编码格式中所占的位数是不同的,比如gbk中汉字占2个字节,utf8中多数占3个字节,少数占4个.而所有汉字在java程序中我们都可以简单的用 char c = '字' 表示; 那么问题来了,在java程序运行的时候,究竟汉字占几个字节呢? -------------------------- 文章抄袭自:http://www.cnblogs.com/louiswong/p/6062417.html 在讨论这个问题之前,我们需要先区分un…

oracle汉字占用字节长度

1. 今天调查一个oracle数据库问题的时候,发如今11g中一个汉字占2个字节,在10g中占3个字节.导致将11g数据库中的数据导入到10g的时候总是出错.開始的时候还以为是11g和10g的版本号不一样,汉字占用字节数不一样,后来一想,oracle不会这么干吧.那样区别也太大了,后来一调查,发现是跟oracle的字符集编码有关: 假设是下面字符集,一个汉字占用2个字节: SIMPLIFIED CHINESE_CHINA.ZHS16GBK …

python中文utf8编码后是占3个字符,unicode汉字为2字节

一个中文utf8编码后是占3个字符,所以求长度的函数可以这样写 def str_len(str): try: row_l=len(str) utf8_l=len(str.encode('utf-8')) +row_l except: return None return None unicode中汉字为两字节, utf-8中汉字为三字节 https://en.wikipedia.org/wiki/Unicode https://en.wikipedia.org/wiki/UTF-8…

ORACLE的VARCHAR2是字节还是字符

往Oracle一个表的VACHAR2(20)字段中插入七个汉字,提示错误:插入的值太大. 改成插入六个汉字,又可以. 于是百度,原来这与ORACLE的字符集设置有关.(以前的项目都是设置成的ZHS16GBK) 字符集设置成ZHS16GBK:汉字占2个字节. 字符集设置成AL32UTF8:汉字占3个字节. 查询字符集:select * from v$nls_parameters t where t.PARAMETER='NLS_CHARACTERSET';…

utf-8中的汉字占用多少字节

转载:http://blog.csdn.net/chummyhe89/article/details/7777613 占2个字节的:〇占3个字节的:基本等同于GBK,含21000多个汉字占4个字节的:中日韩超大字符集里面的汉字,有5万多个一个utf8数字占1个字节一个utf8英文字母占1个字节在查找 UTF-8 编码资料时发现,很多的帖子说的 UTF-8 编码里,一个汉字占用3个字节,有的还做了个证明,大概是这样的,创建一个没有BOM的UTF-8编码的文本文件,里面保存了几个汉字,然后…

mysql 编码和汉字存储占用字节问题的探索

MySql 5.5 之前,UTF8 编码只支持1-3个字节,只支持BMP这部分的unicode编码区,BMP是从哪到哪?基本就是 0000 ~ FFFF 这一区. 从MySQL 5.5 开始,可支持4个字节UTF编码utf8mb4,一个字符最多能有4字节,所以能支持更多的字符集. utf8mb4 is a superset of utf8 tf8mb4兼容utf8,且比utf8能表示更多的字符. 至于什么时候用,看你做的什么项目了...在做移动应用时,会遇到IOS用户在文本的区域输入emoji表…

java梳理-一个汉字占多大空间

面试题:一个汉字占多大空间. 事实上这个问题我了解不深的,知道结论不知道为什么.借此梳理下认识. 先回想下java基本类型一基本类型 :简称四类八种,声明变量的同一时候分配了空间.举比例如以下: Int a =1;一.4种整型 byte 1字节 -128--127 short 2 字节 -32,768 -- 32,767 int 4 字节 -2,147,483,648 --2,147…

JS判断字符串长度（英文占1个字符，中文汉字占2个字符）

//计算字符串长度(英文占1个字符,中文汉字占2个字符) 方法一: String.prototype.gblen = function() { var len = 0; for (var i=0; i<this.length; i++) { if (this.charCodeAt(i)>127 || this.charCodeAt(i)==94) { len += 2; } else { len ++; } } return len; } 方法二: function strlen(str){…

JS判断字符串长度，结合element el-input el-form 表单验证（英文占1个字符，中文汉字占2个字符）

首先看看判断字符串长度的几种方法(英文占1个字符,中文汉字占2个字符) 方法一: function strlen(str) { var len = 0; for (var i = 0; i < str.length; i++) { var c = str.charCodeAt(i); //单字节加1 if ((c >= 0x0001 && c <= 0x007e) || (0xff60 <= c && c <= 0xff9f)) { len++…

Oracle 插入超4000字节的CLOB字段的处理方法

最近在做系统开发的时候需要想Oracle数据库插入超过4000字节的CLOB字段,在网上查询了N久才发现下面的解决方案,故留存以备后查. 我们可以通过创建单独的OracleCommand来进行指定的插入,即可获得成功,这里仅介绍插入clob类型的数据,blob与此类似,这里就不介绍了,下面介绍两种办法在通过拼组sql语句来实现数据插入的应用中,我们很有可能会遇到需要插入大型数据的情况,例如,在oracle中需要插入字节数超过4000的字段内容时,我们如果通过简单的拼组sql语句来实现插入,显然…

在C语言中基本数据类型所占的字节数

基本数据类型所占的字节数其实跟C语言本身没有太大的关系,它取决于编译器的位数,下面这张表说明了不同编译器下基本数据类型的长度: 32位编译器中各基本类型所占字节数: 注:对于32位的编译器,指针变量的大小都是4个字节,也就是32位.原因是32位的寻址空间,也就是每个存储单元的地址都是32位的.指针变量中存储的正好也就是这个32位的地址,所以指针变量的大小是4个字节.同理64位编译器. 64位编译器中各基本类型所占字节数: 对比一下发现,其实没有多大的变化.只不过指针变量的大小和long类型的大小…

oracle汉字转拼音(获得全拼/拼音首字母/拼音截取等)

oracle汉字转拼音(获得全拼/拼音首字母/拼音截取等) 效果如下: Oracle 字符集 GBK 没有问题 , UTF -8 需要修改一下 Sql代码 --oracle汉字转拼音 PACKAGE --1.获得全拼 www.2cto.com SELECT GETHZPY.GETHZFULLPY('汉字') FROM DUAL; 结果 : HanZi --2.拼音首字母 SELECT GETHZPY.GETHZPYCAP('汉字') FROM DUA…

Java中文字符所占的字节数

Java语言中,中文字符所占的字节数取决于字符的编码方式,一般情况下,采用ISO8859-1编码方式时,一个中文字符与一个英文字符一样只占1个字节:采用GB2312或GBK编码方式时,一个中文字符占2个字节:而采用UTF-8编码方式时,一个中文字符会占3个字节.我们可以通过String类的getBytes(String charsetName)方法来获取到字符串以指定编码方式编码后所得到的字节数组,然后字节数组的长度就是该字符串在指定编码方式下所占的字节数. [测试示例] public clas…

oracle 汉字转拼音

oracle汉字转拼音(获得全拼/拼音首字母/拼音截取等) 效果如下: Oracle 字符集 GBK 没有问题 , UTF -8 需要修改一下 Sql代码 --oracle汉字转拼音 PACKAGE --1.获得全拼 www.2cto.com SELECT GETHZPY.GETHZFULLPY('汉字') FROM DUAL; 结果 : HanZi --2.拼音首字母 SELECT GETHZPY.GETHZPYCAP('汉字') FROM DUAL; 结果 : HZ --3.拼音截取等 S…

c++类型所占的字节和表示范围

一:数值类型的大杂烩 (1)short.int 和 long 类型都表示整型值.存储空间的大小不同一般, short 类型为半个机器字长,int 类型为一个机器字长,而 long 类型为一个或两个机器字长(在 32 位机器中 int 类型和 long 类型通常字长是同样的). (2)常量的定义以及表示范围: unsigned int 0-4294967295 就是2^32-1 int …

ORACLE数据库汉字占几个字节问题

一同事由于系统需求关系,将SQL SERVER数据库的一个表导入ORACLE数据库时,发现居然报错:ORA-12899: value too large for column xxxx (actual:56, maximum:50),该字段长度在两个数据库都是50,之所以出现这个错误,原因无外乎两个: 一:因为ORACLE数据库它可以存储字节或字符,例如 CHAR(12 BYTE) CHAR(12 CHAR)的意义是不同的.一般来说默认是存储字节,你可以查看数据库参数NLS_LENGTH_SEM…

Oracle 汉字占用字节数

在oracle中一个字符特别是中文字符占几个字节是与字符集有关的. 比如GBK,汉字就会占两个字节,英文1个:如果是UTF-8,汉字一般占3个字节,英文还是1个.但是一般情况下,我们都认为是两个字节处理,因为oracle安装时候默认我们都选择GBK的编码格式,但是我们在页面做输入字符串长度的校验的时候,还是以数据库设计字段最大长度除3来作为最大长度-----防止数据库移植时设置不同编码格式. 查看字符串占用的字符数: select length('12中华') from dua…

请问utf-8的中文是一个汉字占三个字节长度吗？

这是个好问题,可以当作一个笔试题.先从字符编码讲起. 1.美国人首先对其英文字符进行了编码,也就是最早的ascii码,用一个字节的低7位来表示英文的128个字符,高1位统一为0: 2.后来欧洲人发现尼玛你这128位哪够用,比如我高贵的法国人字母上面的还有注音符,这个怎么区分,得,把高1位编进来吧,这样欧洲普遍使用一个全字节进行编码,最多可表示256位.欧美人就是喜欢直来直去,字符少,编码用得位数少: 3.但是即使位数少,不同国家地区用不同的字符编码,虽然0--127表示的符号是一样的,但是128…