PostgreSql字符串函数和操作符

本节描述了用于检查和操作字符串数值的函数和操作符。在这个环境中的字符串包括所有 character, character varying, text 类型的值。除非另外说明，所有下面列出的函数都可以处理这些类型，不过要小心的是，在使用 character 类型的时候，需要注意自动填充的潜在影响。通常这里描述的函数也能用于非字符串类型，我们只要先把那些数据转化为字符串表现形式就可以了。有些函数还可以处理位串类型。

SQL 定义了一些字符串函数，它们有指定的语法(用特定的关键字而不是逗号来分隔参数)。详情请见表9-5，这些函数也用正常的函数调用语法实现了(参阅表9-6)。

表9-5. SQL 字符串函数和操作符

函数	返回类型	描述	例子	结果
`string \|\| string`	`text`	字符串连接	`'Post' \|\| 'greSQL'`	`PostgreSQL`
`bit_length(string)`	`int`	字符串里二进制位的个数	`bit_length('jose')`	`32`
`char_length(string)` 或`character_length(string)`	`int`	字符串中的字符个数	`char_length('jose')`	`4`
`convert(string usingconversion_name)`	`text`	使用指定的转换名字改变编码。转换可以通过 `CREATE CONVERSION` 定义。当然系统里有一些预定义的转换名字。参阅表9-7获取可用的转换名。	`convert('PostgreSQL' using iso_8859_1_to_utf8)`	UTF8编码的`'PostgreSQL'`
`lower(string)`	`text`	把字符串转化为小写	`lower('TOM')`	`tom`
`octet_length(string)`	`int`	字符串中的字节数	`octet_length('jose')`	`4`
`overlay(string placing stringfrom int [for int])`	`text`	替换子字符串	`overlay('Txxxxas' placing 'hom' from 2 for 4)`	`Thomas`
`position(substring in string)`	`int`	指定的子字符串的位置	`position('om' in 'Thomas')`	`3`
`substring(string [from int] [forint])`	`text`	抽取子字符串	`substring('Thomas' from 2 for 3)`	`hom`
`substring(string from pattern)`	`text`	抽取匹配 POSIX 正则表达式的子字符串。参见节9.7获取更多关于模式匹配的信息。	`substring('Thomas' from '...$')`	`mas`
`substring(string from pattern forescape)`	`text`	抽取匹配 SQL 正则表达式的子字符串。参见节9.7获取更多关于模式匹配的信息。	`substring('Thomas' from '%#"o_a#"_' for '#')`	`oma`
`trim([leading \| trailing \| both] [characters] from string)`	`text`	从字符串 `string` 的开头/结尾/两边删除只包含 `characters` 中字符(缺省是一个空白)的最长的字符串	`trim(both 'x' from 'xTomxx')`	`Tom`
`upper(string)`	`text`	把字符串转化为大写	`upper('tom')`	`TOM`

还有额外的字符串操作函数可以用，它们在表9-6列出。它们有些在内部用于实现表9-5列出的 SQL 标准字符串函数。

表9-6. 其它字符串函数

函数	返回类型	描述	例子	结果
`ascii(string)`	`int`	参数第一个字符的 ASCII 码	`ascii('x')`	`120`
`btrim(string text [, characterstext])`	`text`	从 `string` 开头和结尾删除只包含 `characters` 中字符(缺省是空白)的最长字符串	`btrim('xyxtrimyyx', 'xy')`	`trim`
`chr(int)`	`text`	给出 ASCII 码的字符	`chr(65)`	`A`
`convert(string text, [src_encoding name,]dest_encoding name)`	`text`	把原来编码为 `src_encoding` 的字符串转换为 `dest_encoding` 编码(如果省略了`src_encoding` 将使用数据库编码)	`convert( 'text_in_utf8', 'UTF8', 'LATIN1')`	以ISO 8859-1编码表示的`text_in_utf8`
`decode(string text, type text)`	`bytea`	把早先用 `encode` 编码的 `string` 里面的二进制数据解码。参数类型和 `encode`相同。	`decode('MTIzAAE=', 'base64')`	`123\000\001`
`encode(data bytea, type text)`	`text`	把二进制数据编码为只包含 ASCII 形式的数据。支持的类型有：`base64`, `hex`,`escape`	`encode( E'123\\000\\001', 'base64')`	`MTIzAAE=`
`initcap(string)`	`text`	把每个单词的第一个子母转为大写，其它的保留小写。单词是一系列字母数字组成的字符，用非字母数字分隔。	`initcap('hi THOMAS')`	`Hi Thomas`
`length(string)`	`int`	`string` 中字符的数目	`length('jose')`	`4`
`lpad(string text, length int [,fill text])`	`text`	通过填充字符 `fill`(缺省时为空白)，把 `string` 填充为 `length` 长度。如果`string` 已经比 `length` 长则将其尾部截断。	`lpad('hi', 5, 'xy')`	`xyxhi`
`ltrim(string text [, characterstext])`	`text`	从字符串 `string` 的开头删除只包含 `characters` 中字符(缺省是一个空白)的最长的字符串。	`ltrim('zzzytrim', 'xyz')`	`trim`
`md5(string)`	`text`	计算 `string` 的MD5散列，以十六进制返回结果。	`md5('abc')`	`900150983cd24fb0 d6963f7d28e17f72`
`pg_client_encoding()`	`name`	当前客户端编码名称	`pg_client_encoding()`	`SQL_ASCII`
`quote_ident(string)`	`text`	返回适用于 SQL 语句的标识符形式(使用适当的引号进行界定)。只有在必要的时候才会添加引号(字符串包含非标识符字符或者会转换大小写的字符)。嵌入的引号被恰当地写了双份。	`quote_ident('Foo bar')`	`"Foo bar"`
`quote_literal(string)`	`text`	返回适用于在 SQL 语句里当作文本使用的形式。嵌入的引号和反斜杠被恰当地写了双份。	`quote_literal( 'O\'Reilly')`	`'O''Reilly'`
`regexp_replace(string text,pattern text, replacement text[,flags text])`	`text`	替换匹配 POSIX 正则表达式的子字符串。参见节9.7以获取更多模式匹配的信息。	`regexp_replace('Thomas', '.[mN]a.', 'M')`	`ThM`
`repeat(string text, number int)`	`text`	将 `string` 重复 `number` 次	`repeat('Pg', 4)`	`PgPgPgPg`
`replace(string text, from text,to text)`	`text`	把字符串 `string` 里出现地所有子字符串 `from` 替换成子字符串 `to`	`replace( 'abcdefabcdef', 'cd', 'XX')`	`abXXefabXXef`
`rpad(string text, length int [,fill text])`	`text`	使用填充字符 `fill`(缺省时为空白)，把 `string` 填充到 `length` 长度。如果`string` 已经比 `length` 长则将其从尾部截断。	`rpad('hi', 5, 'xy')`	`hixyx`
`rtrim(string text [, characterstext])`	`text`	从字符串 `string` 的结尾删除只包含 `characters` 中字符(缺省是个空白)的最长的字符串。	`rtrim('trimxxxx', 'x')`	`trim`
`split_part(string text,delimiter text, field int)`	`text`	根据 `delimiter` 分隔 `string` 返回生成的第 `field` 个子字符串(1为基)。	`split_part('abc~@~def~@~ghi', '~@~', 2)`	`def`
`strpos(string, substring)`	`int`	指定的子字符串的位置。和 `position(substring in string)` 一样，不过参数顺序相反。	`strpos('high', 'ig')`	`2`
`substr(string, from [, count])`	`text`	抽取子字符串。和 `substring(string from from for count)` 一样	`substr('alphabet', 3, 2)`	`ph`
`to_ascii(string text [, encodingtext])`	`text`	把 `string` 从其它编码转换为 ASCII (仅支持 `LATIN1`, `LATIN2`, `LATIN9`, `WIN1250`编码)。	`to_ascii('Karel')`	`Karel`
`to_hex(number int 或 bigint)`	`text`	把 `number` 转换成十六进制表现形式	`to_hex(2147483647)`	`7fffffff`
`translate(string text, fromtext, to text)`	`text`	把在 `string` 中包含的任何匹配 `from` 中字符的字符转化为对应的在 `to` 中的字符	`translate('12345', '14', 'ax')`	`a23x5`

表9-7. 内置的转换

转换名[a]	源编码	目的编码
`ascii_to_mic`	`SQL_ASCII`	`MULE_INTERNAL`
`ascii_to_utf8`	`SQL_ASCII`	`UTF8`
`big5_to_euc_tw`	`BIG5`	`EUC_TW`
`big5_to_mic`	`BIG5`	`MULE_INTERNAL`
`big5_to_utf8`	`BIG5`	`UTF8`
`euc_cn_to_mic`	`EUC_CN`	`MULE_INTERNAL`
`euc_cn_to_utf8`	`EUC_CN`	`UTF8`
`euc_jp_to_mic`	`EUC_JP`	`MULE_INTERNAL`
`euc_jp_to_sjis`	`EUC_JP`	`SJIS`
`euc_jp_to_utf8`	`EUC_JP`	`UTF8`
`euc_kr_to_mic`	`EUC_KR`	`MULE_INTERNAL`
`euc_kr_to_utf8`	`EUC_KR`	`UTF8`
`euc_tw_to_big5`	`EUC_TW`	`BIG5`
`euc_tw_to_mic`	`EUC_TW`	`MULE_INTERNAL`
`euc_tw_to_utf8`	`EUC_TW`	`UTF8`
`gb18030_to_utf8`	`GB18030`	`UTF8`
`gbk_to_utf8`	`GBK`	`UTF8`
`iso_8859_10_to_utf8`	`LATIN6`	`UTF8`
`iso_8859_13_to_utf8`	`LATIN7`	`UTF8`
`iso_8859_14_to_utf8`	`LATIN8`	`UTF8`
`iso_8859_15_to_utf8`	`LATIN9`	`UTF8`
`iso_8859_16_to_utf8`	`LATIN10`	`UTF8`
`iso_8859_1_to_mic`	`LATIN1`	`MULE_INTERNAL`
`iso_8859_1_to_utf8`	`LATIN1`	`UTF8`
`iso_8859_2_to_mic`	`LATIN2`	`MULE_INTERNAL`
`iso_8859_2_to_utf8`	`LATIN2`	`UTF8`
`iso_8859_2_to_windows_1250`	`LATIN2`	`WIN1250`
`iso_8859_3_to_mic`	`LATIN3`	`MULE_INTERNAL`
`iso_8859_3_to_utf8`	`LATIN3`	`UTF8`
`iso_8859_4_to_mic`	`LATIN4`	`MULE_INTERNAL`
`iso_8859_4_to_utf8`	`LATIN4`	`UTF8`
`iso_8859_5_to_koi8_r`	`ISO_8859_5`	`KOI8`
`iso_8859_5_to_mic`	`ISO_8859_5`	`MULE_INTERNAL`
`iso_8859_5_to_utf8`	`ISO_8859_5`	`UTF8`
`iso_8859_5_to_windows_1251`	`ISO_8859_5`	`WIN1251`
`iso_8859_5_to_windows_866`	`ISO_8859_5`	`WIN866`
`iso_8859_6_to_utf8`	`ISO_8859_6`	`UTF8`
`iso_8859_7_to_utf8`	`ISO_8859_7`	`UTF8`
`iso_8859_8_to_utf8`	`ISO_8859_8`	`UTF8`
`iso_8859_9_to_utf8`	`LATIN5`	`UTF8`
`johab_to_utf8`	`JOHAB`	`UTF8`
`koi8_r_to_iso_8859_5`	`KOI8`	`ISO_8859_5`
`koi8_r_to_mic`	`KOI8`	`MULE_INTERNAL`
`koi8_r_to_utf8`	`KOI8`	`UTF8`
`koi8_r_to_windows_1251`	`KOI8`	`WIN1251`
`koi8_r_to_windows_866`	`KOI8`	`WIN866`
`mic_to_ascii`	`MULE_INTERNAL`	`SQL_ASCII`
`mic_to_big5`	`MULE_INTERNAL`	`BIG5`
`mic_to_euc_cn`	`MULE_INTERNAL`	`EUC_CN`
`mic_to_euc_jp`	`MULE_INTERNAL`	`EUC_JP`
`mic_to_euc_kr`	`MULE_INTERNAL`	`EUC_KR`
`mic_to_euc_tw`	`MULE_INTERNAL`	`EUC_TW`
`mic_to_iso_8859_1`	`MULE_INTERNAL`	`LATIN1`
`mic_to_iso_8859_2`	`MULE_INTERNAL`	`LATIN2`
`mic_to_iso_8859_3`	`MULE_INTERNAL`	`LATIN3`
`mic_to_iso_8859_4`	`MULE_INTERNAL`	`LATIN4`
`mic_to_iso_8859_5`	`MULE_INTERNAL`	`ISO_8859_5`
`mic_to_koi8_r`	`MULE_INTERNAL`	`KOI8`
`mic_to_sjis`	`MULE_INTERNAL`	`SJIS`
`mic_to_windows_1250`	`MULE_INTERNAL`	`WIN1250`
`mic_to_windows_1251`	`MULE_INTERNAL`	`WIN1251`
`mic_to_windows_866`	`MULE_INTERNAL`	`WIN866`
`sjis_to_euc_jp`	`SJIS`	`EUC_JP`
`sjis_to_mic`	`SJIS`	`MULE_INTERNAL`
`sjis_to_utf8`	`SJIS`	`UTF8`
`tcvn_to_utf8`	`WIN1258`	`UTF8`
`uhc_to_utf8`	`UHC`	`UTF8`
`utf8_to_ascii`	`UTF8`	`SQL_ASCII`
`utf8_to_big5`	`UTF8`	`BIG5`
`utf8_to_euc_cn`	`UTF8`	`EUC_CN`
`utf8_to_euc_jp`	`UTF8`	`EUC_JP`
`utf8_to_euc_kr`	`UTF8`	`EUC_KR`
`utf8_to_euc_tw`	`UTF8`	`EUC_TW`
`utf8_to_gb18030`	`UTF8`	`GB18030`
`utf8_to_gbk`	`UTF8`	`GBK`
`utf8_to_iso_8859_1`	`UTF8`	`LATIN1`
`utf8_to_iso_8859_10`	`UTF8`	`LATIN6`
`utf8_to_iso_8859_13`	`UTF8`	`LATIN7`
`utf8_to_iso_8859_14`	`UTF8`	`LATIN8`
`utf8_to_iso_8859_15`	`UTF8`	`LATIN9`
`utf8_to_iso_8859_16`	`UTF8`	`LATIN10`
`utf8_to_iso_8859_2`	`UTF8`	`LATIN2`
`utf8_to_iso_8859_3`	`UTF8`	`LATIN3`
`utf8_to_iso_8859_4`	`UTF8`	`LATIN4`
`utf8_to_iso_8859_5`	`UTF8`	`ISO_8859_5`
`utf8_to_iso_8859_6`	`UTF8`	`ISO_8859_6`
`utf8_to_iso_8859_7`	`UTF8`	`ISO_8859_7`
`utf8_to_iso_8859_8`	`UTF8`	`ISO_8859_8`
`utf8_to_iso_8859_9`	`UTF8`	`LATIN5`
`utf8_to_johab`	`UTF8`	`JOHAB`
`utf8_to_koi8_r`	`UTF8`	`KOI8`
`utf8_to_sjis`	`UTF8`	`SJIS`
`utf8_to_tcvn`	`UTF8`	`WIN1258`
`utf8_to_uhc`	`UTF8`	`UHC`
`utf8_to_windows_1250`	`UTF8`	`WIN1250`
`utf8_to_windows_1251`	`UTF8`	`WIN1251`
`utf8_to_windows_1252`	`UTF8`	`WIN1252`
`utf8_to_windows_1253`	`UTF8`	`WIN1253`
`utf8_to_windows_1254`	`UTF8`	`WIN1254`
`utf8_to_windows_1255`	`UTF8`	`WIN1255`
`utf8_to_windows_1256`	`UTF8`	`WIN1256`
`utf8_to_windows_1257`	`UTF8`	`WIN1257`
`utf8_to_windows_866`	`UTF8`	`WIN866`
`utf8_to_windows_874`	`UTF8`	`WIN874`
`windows_1250_to_iso_8859_2`	`WIN1250`	`LATIN2`
`windows_1250_to_mic`	`WIN1250`	`MULE_INTERNAL`
`windows_1250_to_utf8`	`WIN1250`	`UTF8`
`windows_1251_to_iso_8859_5`	`WIN1251`	`ISO_8859_5`
`windows_1251_to_koi8_r`	`WIN1251`	`KOI8`
`windows_1251_to_mic`	`WIN1251`	`MULE_INTERNAL`
`windows_1251_to_utf8`	`WIN1251`	`UTF8`
`windows_1251_to_windows_866`	`WIN1251`	`WIN866`
`windows_1252_to_utf8`	`WIN1252`	`UTF8`
`windows_1256_to_utf8`	`WIN1256`	`UTF8`
`windows_866_to_iso_8859_5`	`WIN866`	`ISO_8859_5`
`windows_866_to_koi8_r`	`WIN866`	`KOI8`
`windows_866_to_mic`	`WIN866`	`MULE_INTERNAL`
`windows_866_to_utf8`	`WIN866`	`UTF8`
`windows_866_to_windows_1251`	`WIN866`	`WIN`
`windows_874_to_utf8`	`WIN874`	`UTF8`
【注意】a. 转换名遵循一个标准的命名模式：将源编码中的所有非字母数字字符用下划线替换，后面跟着 `_to_` ，然后后面再跟着经过同样处理的目标编码的名字。因此这些名字可能和客户的编码名字不同。

PostgreSql字符串函数和操作符的更多相关文章

[转] PostgreSQL学习手册(函数和操作符)
一.逻辑操作符: 常用的逻辑操作符有:AND.OR和NOT.其语义与其它编程语言中的逻辑操作符完全相同. 二.比较操作符: 下面是PostgreSQL中提供的比较操作符列表: 操作符描述 < ...
PostgreSQL学习手册(五) 函数和操作符
PostgreSQL学习手册(五) 函数和操作符一.逻辑操作符: 常用的逻辑操作符有:AND.OR和NOT.其语义与其它编程语言中的逻辑操作符完全相同. 二.比较操作符: 下面是Post ...
PostgreSQL 存储过程/函数
1.有用的链接 postgresql 常用小函数 Postgresql数据库的一些字符串操作函数 PostgreSQL function里面调用function PostgreSQL学习手册(函数和操 ...
MySQL最常用字符串函数
字符串函数是最常用的的一种函数,在一个具体应用中通常会综合几个甚至几类函数来实现相应的应用: 1.LOWER(column|str):将字符串参数值转换为全小写字母后返回 mysql> sel ...
MySQL常用字符串函数
字符串函数是最常用的的一种函数,在一个具体应用中通常会综合几个甚至几类函数来实现相应的应用: 1.LOWER(column|str):将字符串参数值转换为全小写字母后返回 mysql> sel ...
ORACLE常用数值函数、转换函数、字符串函数介绍
ORACLE常用数值函数.转换函数.字符串函数介绍. 数值函数: abs(m) m的绝对值 mod(m,n) m被n除后的余数 power(m,n) m的n次方 round(m[,n]) m四舍五入至 ...
PHP字符串——字符串函数
比较字符串PHP有两个操作符和6个函数用于字符串间相互比较. 精确比较你可以用==和===操作符来比较两个字符串是否相等.这两个操作符的不同在于它们如何处理非字符串数据类型的操作数.==操作符把非字符 ...
[转]MySQL常用字符串函数
本文转载自:http://www.cnblogs.com/geaozhang/ 是最常用的的一种函数,在一个具体应用中通常会综合几个甚至几类函数来实现相应的应用: 1.LOWER(column|str ...
sql常用格式化函数及字符串函数
一.常用格式化函数 1.日期转字符串 select to_char(current_timestamp, 'YYYY-MM-DD HH24:MI:SS') YYYY:年份 MM:月份号(01-12) ...

随机推荐

代码规范-IAR设置
1.在IAR内定义 char 2. 去掉相关的告警 3.LANGUAGE设置
IE10用video标签播放本地mp4文件失败的解决办法
1. 首先用“格式工厂”将要播放的视频文件按照“AVC高质量与大小”转换为要求格式的mp4文件: 2. 设置IIS7.5,添加mp4的MIME类型,步骤如下: 1.打开IIS管理器(运行inetmgr ...
iOS7.1Https企业证书发布方法
openssl使用的是macos系统自带的版本,关键点是不同直接使用ios设备打开https的链接,需要将证书发到系统的mail里,安装到设备, 如果命令执行不成功,用sudo执行. 1.生成服务器的 ...
录制游戏视频——fraps
http://pcedu.pconline.com.cn/341/3417224.html
[译] ASP.NET 生命周期 – ASP.NET 请求生命周期（二）
ASP.NET 请求生命周期全局应用类也可以用来跟踪每个独立请求的生命周期,包括请求从 ASP.NET 平台传递到 MVC 框架.ASP.NET 框架会创建一个定义在 Global.asax 文件中 ...
免费web直接打印的控件PAZU
PAZU 是4Fang 四方为配合"四方在线"软件于2004年开发的WEB打印控件,适用于各种WEB软件项目的打印.PAZU是客户端软件,使用于IE作为客户端的所有应用,与服务器端 ...
The 6th Zhejiang Provincial Collegiate Programming Contest->ProblemB：Light Bulb
http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemCode=3203 题意:求影子的最长长度L; 当灯,人头和墙角成一条直线时(假设此时人 ...
PHP MSSQL数据操作PDO API
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 3 ...
zoj 3365
题意给你一个序列改变尽可能少的数使其成为公差为一递增的等差数列可以将给你的序列减去一个等差数列即num[i] -= i,若得到的数全部相等, 则说明给你的序列本身就满足条件则只要寻求n ...
rsync介绍
老套的搬用一下rsync的介绍,rsync是Linux系统下的数据镜像备份工具,从软件的命名上就可以看出来了——remote sync.rsync支持大多数的类Unix系统,无论是Linux.Sola ...

PostgreSql字符串函数和操作符

PostgreSql字符串函数和操作符的更多相关文章

随机推荐

热门专题