Oracle LPAD/RPAD函数在处理中文时的注意事项
首先看下Oracle官方对函数的定义:
The RPAD function returns an expression, right-padded to a specified length with the specified characters; or, when the expression to be padded is longer than the length specified after padding, only that portion of the expression that fits into the specified length.
RPAD函数将指定的字符串从目标字符串的右侧填充指定长度的字符串,若待填充的字符串的长度大于制定的填充长度,则会根据填充的长度对目标字符串进行截取。
函数语法
RPAD (text-exp , length [, pad-exp])
对Length填充长度的解释
关于对各个参数的解释,我们重点来看看length这个参数:
Length
The total length of the return value as it is displayed on your terminal screen. In most character sets, this is also the number of characters in the return value. However, in some multibyte character sets, the display length of a character string can differ from the number of characters in the string.
When you specify a value for length that is shorter than the length of text-exp, then this function truncates the expression to the specified length.
粗体部分大意为:返回值的总长度正如它们在你的终端屏幕上显示的长度一样,注意,是终端显示的长度,非该字符串在数据库中的实际显示长度(字节)。这在多字节支持的数据库(如简体中文,AL32UTF8等等)中尤为明显。
通过下面的一个示例来理解一下这句话:
SQL> SELECT '甲骨文' ORA_STR,
2 LENGTHB('甲骨文') ORA_STR_LENGTH,
3 RPAD('甲骨文', 10, '$') ORA_RPAD_STR,
4 LENGTHB(RPAD('甲骨文', 10, '$')) ORA_RPAD_STR_LENGTH
5 FROM dual
6 ; ORA_STR ORA_STR_LENGTH ORA_RPAD_STR ORA_RPAD_STR_LENGTH
--------- -------------- ------------- -------------------
甲骨文 9 甲骨文$$$$ 13 SQL>
我的数据库的字符集是AL32UTF8,所以一个中文字符占3个字节。在这个例子中,LENGTHB函数对字符串“甲骨文”的字节长度计算很准确,为9个字节,但是你会发现,我们用RPAD函数向字符串”甲骨文“后面填充$符号,总长度为10时,结果范围的却是”甲骨文$$$$",并不是我们期望得到的值"甲骨文$",同时也会发现,截取完后的字符串长度也并不是10个字节。
我们回到官方定义中对于返回长度Length的解释,这个长度取决于当前字符在屏幕终端显示时所占据的大小,对于中文来说,通常在屏幕上占据的是2个字节的宽度:

因此RPAD在进行填充的时候对这些字符按照两个字节去处理,所以出现了上述示例所描述的情况。这种不可预知(Sometimes)的情况对于那些输出固定字节宽度的程序来说无疑会产生问题。
解决方法
下面是针对这种问题的解决方法:
SQL> SELECT '甲骨文' ORA_STR,
2 LENGTHB('甲骨文') ORA_STR_LENGTH,
3 RPAD('甲骨文', 10, '$') ORA_RPAD_STR,
4 LENGTHB(RPAD('甲骨文', 10, '$')) ORA_RPAD_STR_LENGTH,
5 -- 解决方法
6 SUBSTRB('甲骨文' || RPAD('$', , '$'), , ) SOLUTION
7 FROM dual
8 ; ORA_STR ORA_STR_LENGTH ORA_RPAD_STR ORA_RPAD_STR_LENGTH SOLUTION
--------- -------------- ------------- ------------------- ----------
甲骨文 9 甲骨文$$$$ 13 甲骨文$ SQL>
在实际应用中,我们可以将上述方法抽象为一个函数来使用:
CREATE OR REPLACE
FUNCTION rpad2(str IN VARCHAR2,
len IN PLS_INTEGER,
pad IN VARCHAR2)
RETURN VARCHAR2
IS
BEGIN
RETURN SUBSTRB(str || RPAD(pad, len, pad), 1, len);
END rpad2;
使用范例:
SQL> SELECT rpad2('甲骨文', 10, '$') PADDED_VALUE FROM DUAL;
PADDED_VALUE
-----------------------
甲骨文$
SQL>
参考链接
- Oracle Bug? RPAD of Japanese (kanji) character in Oracle 10gR2 UTF8 database
- Issue with LPAD/RPAD when using with Japanese data
- Oracle Documentation - RPAD
Oracle LPAD/RPAD函数在处理中文时的注意事项的更多相关文章
- oracle lpad rpad函数
学习并记录 1.情况一 ) from dual; 运行结果如下: email长度5,默认添加3个空格在左边 2.情况二 ) from dual; 运行结果如下: email长度5,截取2两个字符 3. ...
- oracle 使用count()函数进行分组计数时所踩的坑!
1.情景展示 需要对id_card字段按字符长度进行分组统计并进行计数. 2.错误方式 第一步:统计出id_card字段共存在几种情况. 第一种方式:distinct 第二种方式:group by ...
- Oracle EBS在编码方式为AL32UTF8时的注意事项
现如今的EBS系统中,为了推进国际化的进程,以及系统向全球化的扩展,在Oracle数据库的编码方式上渐渐从支持中国本土简体中文的ZHS16GBK转向了更趋于国际化的AL32UTF8编码方式.但随之而来 ...
- Oracle中Lpad函数和Rpad函数的用法
http://blog.csdn.net/woshixuye/article/details/17262307 一.Lpad函数 lpad函数将左边的字符串填充一些特定的字符其语法格式如下:lpad ...
- oracle中extract()函数----用于截取年、月、日、时、分、秒
oracle中extract()函数从oracle 9i中引入,用于从一个date或者interval类型中截取到特定的部分 语法如下: extract ( { year | month | day ...
- [转载]ORACLE日期时间函数大全
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年 ...
- ORACLE 常用字符函数
ORACLE 常用字符函数1 ASCII(arg1)返回参数arg1的十进制数字表示.如果数据库设置为ASCII,则采用的是ASCII码字符.如果设置为EBCDIC,则采用的是EBCDIC字符 sel ...
- [转]ORACLE日期时间函数大全
本文转自:http://www.cnblogs.com/chuncn/archive/2009/04/29/1381282.html ORACLE日期时间函数大全 TO_DATE格式(以时间: ::2 ...
- ORACLE单字符函数的函数
1. ASCII(C) 说明:返回C的首字符在ASCII码中相应的十进制 举例: SQL>SELECT ASCII('A') A,ASCII('a') B,ASCII( ...
随机推荐
- SSH: 本地.ssh目录下的公钥文件最好删掉
这次ssh amazon ec2的instance,在家里电脑登录OK,到了公司电脑登录失败(只支持公钥机制).私钥已经拷贝到公司的ubuntu上了,奇怪. 后来发现是.ssh目录下存在一些公钥文件导 ...
- 修改efi分区
换了ssd硬盘,速度真快! 我特意准备了一个efi分区(fat32,忘记指定efi了),然而win10安装时不能指定启动位置,自己创建了一块. 下面我们把让win10使用自己创建的efi分区. 以管理 ...
- MyEclipse8.5集成Tomcat7时的启动错误:Exception in thread “main” java.lang.NoClassDefFoundError org/apache/commons/logging/LogFactory
今天,安装Tomcat7.0.21后,单独用D:\apache-tomcat-7.0.21\bin\startup.bat启动web服务正常.但在MyEclipse8.5中集成配置Tomcat7后,在 ...
- codeforces D. Design Tutorial: Inverse the Problem
题意:给定一个矩阵,表示每两个节点之间的权值距离,问是否可以对应生成一棵树, 使得这棵树中的任意两点之间的距离和矩阵中的对应两点的距离相等! 思路:我们将给定的矩阵看成是一个图,a 到 b会有多条路径 ...
- 你需要知道的Sass插值
你也许会不时地写写 Sass 玩玩,你也会很享受它带给你各种便利.但还有一件事,你并不一定完全了解:插值 (interpolation) - 将一个占位符,替换成一个值.好了,你们都很幸运,因为今天我 ...
- [Unity3D] 浅尝Unity3D
01. Move and Rotate 标准全局坐标系 Keyboard using UnityEngine; using System.Collections; public class NewBe ...
- [Code::Blocks] Install wxWidgets & openCV
The open source, cross platform, free C++ IDE. Code::Blocks is a free C++ IDE built to meet the most ...
- Android学习笔记之ConnectivityManager+NetWorkInfo
PS:眼看就要开学了,该收收心了. 学习内容: 1.ConnecivityManager 2.NetWorkInfo ConnectivityManger:网络连接管理者,用于管理Android设 ...
- 使用Kibana 分析Nginx 日志并在 Dashboard上展示
一.Kibana之Visualize 功能 在首页上Visualize 标签页用来设计可视化图形.你可以保存之前在discovery中的搜索来进行画图,然后保存该visualize,或者加载合并到 d ...
- 谈论XSS
XSS 叫跨站脚本攻击(Cross Site Script),那么XSS原本应该叫做CSS,但是由于CSS的简称已经被连级样式表 使用了,所以就换个称谓XSS. 为什么叫做跨站脚本攻击呢? 它的意思就 ...