KingbaseES错误分析 -- “requested character too large”
一、适用于:
本文档使用于KingbaseES所有版本。
二、问题现象:
使用从其他数据库迁移到KingbaseES数据库的自定义函数、存储过程、Package包..出现以下错误信息:
错误:所请求的字符太大
ERROR: requested character too large
三、问题原因:
1.报错环境的KingbaseES数据库字符集为GBK,目前不支持使用ASCII取中文值。
2.数据库自定义函数、存储过程、Package包里面有使用ASCII函数。
3.在GBK环境使用自定义函数、存储过程、Package包传入参数包含中文或者全角字符。
四、解决方法:
1.对传入参数的字符串进行过滤,只取数字或者英文字符:
参考以下函数进行改写处理:
CREATE OR REPLACE FUNCTION FUNC_GETLASTNUMBER2(STR TEXT) RETURNS TEXT AS $$
DECLARE I INT=0;
LENSTR INT=LENGTH(STR);
STR1 TEXT ;
STRRE TEXT ='';
STRREOR INTEGER =0;
BEGIN
WHILE I<=LENSTR LOOP
--STR1=SUBSTRING(STR,I,1); --原始函数使用substring,改为substrb就可以过滤掉中文或者全角字符
STR1=SUBSTRB(STR,I,1);
IF(ASCII(STR1)>=48 AND ASCII(STR1)<=57) THEN
IF(STRREOR=1) THEN
STRRE='';
STRREOR=0;
END IF;
STRRE=STRRE || STR1;
ELSE
STRREOR=1;---进入了非数字检索
-- SET STRRE=''
END IF;
I=I+1;
END LOOP;
RETURN(STRRE);
END;
$$LANGUAGE PLPGSQL;
SELECT * FROM func_getlastnumber2('00000000收拾.获取;?');
func_getlastnumber2
---------------------
000000000
(1 row)
注意:substr、substrb、substring函数的区别
以KingbaseES数据库UTF8编码为例(1个汉字占3个字节,GBK编码1个汉字占2个字节):
cmc=# select substr('KingbaseES数据库',11,3),substrb('KingbaseES数据库',11,3),substring('KingbaseES数据库',11,3);
substr | substrb | substring
--------+---------+-----------
数据库 | 数 | 数据库
#使用 substrb 截取长度为3的字符串时,只能截取到一个字符,而使用substr、substring可以截取到三个字符。
差异:
substr 按字符截取
substrb 按字节截取
substring 按字符截取
2.使用ASCII函数对传入的中文字符串全角字符转半角字符:
参考以下函数进行改写处理:
CREATE FUNCTION hex_to_dec(in_hex TEXT)
RETURNS INT
IMMUTABLE STRICT LANGUAGE sql AS
$body$
SELECT CAST(CAST(('x' || CAST($1 AS text)) AS bit(8)) AS INT);
$body$;
create or replace Function Trimall(v_Str Varchar2) Return String Is
--将全角字符转换为半角字符,统一输出格式
v_Retval Varchar2(4000) := '';
c Varchar2(4) := ''; --当前字节
Cc Varchar2(10) := ''; --当前双字节
c_Code Number(8); --当前字节ascii码(十进制)
Code1 Number;
Code2 Number;
n_Loop Number(4);
n_Len Number(8);
Begin
n_Loop := 1;
n_Len := Lengthb(v_Str);
While n_Loop <= n_Len loop
--c := Substrb(v_Str, n_Loop, 1);
c := sys.Substrb(v_Str, n_Loop, 1); --在有kdb_orafce插件的时候,指定sys.Substrb进行处理。
--c := encode(Substrb(v_Str, n_Loop, 1)::bytea,'hex'); --在有kdb_orafce插件的时候,可以用此函数处理。
Cc := Substrb(v_Str, n_Loop, 2);
--c := ' ';
c_Code := Ascii(c); --获取当前字节ascii码(十进制)
Code1 := hex_to_dec(Substr(replace(utl_raw.cast_to_raw(Cc),'\x',''), 1, 2));
Code2 := hex_to_dec(Substr(replace(utl_raw.cast_to_raw(Cc),'\x',''), 3, 2));
If c_Code = Code1 Then
--单字节字符
v_Retval := v_Retval || c;
n_Loop := n_Loop + 1;
Elsif Code1 = 163 Then
--双字节字符(常用全角字符)
v_Retval := v_Retval || Chr(Code2 - 128);
n_Loop := n_Loop + 2;
Elsif Code1 > 163 Then
--汉字
v_Retval := v_Retval || Cc;
n_Loop := n_Loop + 2;
Elsif Code1 = 161 And Code2 = 161 Then
--全角空格
v_Retval := v_Retval || ' ';
n_Loop := n_Loop + 2;
Else
--其他双字节字符
v_Retval := v_Retval || Cc;
n_Loop := n_Loop + 2;
End If;
End Loop;
Return v_Retval;
Exception
When Others Then
raise notice 'exception----%',sqlerrm;
return;
End;
select Trimall('住'宅类档案,中.获取;?') from dual;
trimall
-----------------------
住'宅类档案,中.获取;?
(1 row)
注意:在数据库有kdb_orafce扩展插件时
删除插件 drop extension kdb_orafce。
不能删除 kdb_orafce扩展插件时通过指定sys.substrb函数解决。
不能删除 kdb_orafce扩展插件时通过encode函数可以避免,但是使用此函数会导致ascii值不正确。
结合使用utl_raw程序包处理。需要安装create extension kdb_raw扩展插件。
五、关于ASCII码:
ASCII简介:
ASCII 码使用指定的 7 位或 8 位二进制数组合来表示 128 或 256 种可能的字符。标准 ASCII 码也叫基础ASCII码,使用 7 位二进制数来表示所有的大写和小写字母,数字 0 到 9、标点符号, 以及在美式英语中使用的特殊控制字符。
其中:
0~31及127(共33个)是控制字符或通信专用字符(其余为可显示字符)如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(响铃)等;通信专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;
ASCII值为8、9、10 和13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。
32~126(共95个)是字符(32是空格),其中48~57为0到9十个阿拉伯数字。
65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。
同时还要注意,在标准ASCII中,其最高位(b7)用作奇偶校验位。所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1;偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1。
后128个称为扩展ASCII码。许多基于x86的系统都支持使用扩展(或“高”)ASCII。扩展ASCII 码允许将每个字符的第8 位用于确定附加的128 个特殊符号字符、外来语字母和图形符号。
ASCII产生
在计算机中,所有的数据在存储和运算时都要使用二进制数表示(因为计算机用高电平和低电平分别表示1和0),例如,像a、b、c、d这样的52个字母(包括大写)、以及0、1等数字还有一些常用的符号(例如*、#、@等)在计算机中存储时也要使用二进制数来表示,而具体用哪些二进制数字表示哪个符号,当然每个人都可以约定自己的一套(这就叫编码),而大家如果要想互相通信而不造成混乱,那么大家就必须使用相同的编码规则,于是美国有关的标准化组织就出台了所谓的ASCII编码,统一规定了上述常用符号用哪些二进制数来表示。
美国标准信息交换代码是由美国国家标准学会(American National Standard Institute , ANSI )制定的,标准的单字节字符编码方案,用于基于文本的数据。起始于50年代后期,在1967年定案。它最初是美国国家标准,供不同计算机在相互通信时用作共同遵守的西文字符编码标准,它已被国际标准化组织(International Organization for Standardization, ISO)定为国际标准,称为ISO 646标准。适用于所有拉丁文字字母。
ASCII码算法:
A在ASCII中定义为01000001,也就是十进制65,有了这个标准后,当我们输入A时,计算机就可以通过ASCII码知道输入的字符的二进制编码是01000001。而没有这样的标准,我们就必须自己想办法告诉计算机我们输入了一个A;没有这样的标准,我们在别的机器上就需要重新编码以告诉计算机我们要输入A。ASCII码指的不是十进制,是二进制。只是用十进制表示习惯一点罢了,比如在ascii码中,A的二进制编码为01000001,如果用十进制表示是65,用十六进制表示就是41H。
在ASCII码表中,只包括了一些字符、数字、标点符号的信息表示,这主要是因为计算机是美国发明的,在英文下面,我们使用ASCII表示就足够了!但是在汉字输入下面,用ASCII码就不能表示了,而汉字只是中国的通用表示,所以如果我们要在计算机中输入汉字,就必须有一个像ascii码的标准来表示每一个汉字,这就是中国的汉字国标码,它定义了汉字在计算机中的一个表示标准。通过这个标准,但我们输入汉字的时候,我们的输入码就转换为区位码,通过唯一的区位码得到这个汉字的字形码并显示出来。
汉字编码:
0-127 是 7位ASCII 码的范围,是国际标准。
至于汉字,不同的字符集用的ascii 码的范围也不一样,常用的汉字字符集有GB2312-80,GBK,Big5,unicode 等。下面我重点说一说最常用的GB_2312 的字符集。
GB_2312 字符集是目前最常用的汉字编码标准,windows 95/98/2000 中使用的 GBK字符集 就包含了GB2312,或者说和GB2312 兼容,GB_2312 字符集包含了 6763个的 简体汉字,和682 个标准中文符号。在这个标准中,每个汉字用2个字节来表示,每个字节的ascii码为 161-254 (16 进制A1 - FE),第一个字节 对应于 区码的1-94 区,第二个字节 对应于位码的1-94 位。
161-254 其实很好记忆,在英文字符中,可打印的字符范围为33-126。将这对数加上128(或者说最高位置1),就可以得到汉字使用的字符的范围。
ASCII码大致可以分三部分:
1.ASCII不可打印控制字符:
ASCII表上的数字0–31分配给了控制字符,用于控制像打印机等一些外围设备。例如,12代表换页/新页功能。此命令指示打印机跳到下一页的开头。(参详ASCII码表中0-31、127)
ASCII code (Decimal) | ASCII code (Binary) | ASCII code (Octal) | ASCII code (Hex) | Char | Description |
---|---|---|---|---|---|
00 | 0 | 0 | 0 | NULL | Null character |
01 | 1 | 1 | 1 | SOH | Start of Header |
02 | 10 | 2 | 2 | STX | Start of Text |
03 | 11 | 3 | 3 | ETX | End of Text, hearts card suit |
04 | 100 | 4 | 4 | EOT | End of Transmission, diamonds card suit |
05 | 101 | 5 | 5 | ENQ | Enquiry, clubs card suit |
06 | 110 | 6 | 6 | ACK | Acknowledgement, spade card suit |
07 | 111 | 7 | 7 | BEL | Bell |
08 | 1000 | 10 | 8 | BS | Backspace |
09 | 1001 | 11 | 9 | HT | Horizontal Tab |
10 | 1010 | 12 | a | LF | Line feed |
11 | 1011 | 13 | b | VT | Vertical Tab, male symbol, symbol for Mars |
12 | 1100 | 14 | c | FF | Form feed, female symbol, symbol for Venus |
13 | 1101 | 15 | d | CR | Carriage return |
14 | 1110 | 16 | e | SO | Shift Out |
15 | 1111 | 17 | f | SI | Shift In |
16 | 10000 | 20 | 10 | DLE | Data link escape |
17 | 10001 | 21 | 11 | DC1 | Device control 1 |
18 | 10010 | 22 | 12 | DC2 | Device control 2 |
19 | 10011 | 23 | 13 | DC3 | Device control 3 |
20 | 10100 | 24 | 14 | DC4 | Device control 4 |
21 | 10101 | 25 | 15 | NAK | NAK Negative-acknowledge |
22 | 10110 | 26 | 16 | SYN | Synchronous idle |
23 | 10111 | 27 | 17 | ETB | End of trans. block |
24 | 11000 | 30 | 18 | CAN | Cancel |
25 | 11001 | 31 | 19 | EM | End of medium |
26 | 11010 | 32 | 1a | SUB | Substitute |
27 | 11011 | 33 | 1b | ESC | Escape |
28 | 11100 | 34 | 1c | FS | File separator |
29 | 11101 | 35 | 1d | GS | Group separator |
30 | 11110 | 36 | 1e | RS | Record separator |
31 | 11111 | 37 | 1f | US | Unit separator |
127 | 1111111 | 177 | 7f | DEL | Delete |
2.ASCII可打印字符:
数字 32–126 分配给了能在键盘上找到的字符,当您查看或打印文档时就会出现。数字127代表 DELETE 命令。
ASCII code (Decimal) | ASCII code (Binary) | ASCII code (Octal) | ASCII code (Hex) | Char | Description |
---|---|---|---|---|---|
32 | 100000 | 40 | 20 | space | Space |
33 | 100001 | 41 | 21 | ! | Exclamation mark |
34 | 100010 | 42 | 22 | " | Double quotes ; Quotation mark ; speech marks |
35 | 100011 | 43 | 23 | # | Number sign |
36 | 100100 | 44 | 24 | $ | Dollar sign |
37 | 100101 | 45 | 25 | % | Percent sign |
38 | 100110 | 46 | 26 | & | Ampersand |
39 | 100111 | 47 | 27 | ' | Single quote or Apostrophe |
40 | 101000 | 50 | 28 | ( | round brackets or parentheses, opening round bracket |
41 | 101001 | 51 | 29 | ) | parentheses or round brackets, closing parentheses |
42 | 101010 | 52 | 2a | * | Asterisk |
43 | 101011 | 53 | 2b | + | Plus sign |
44 | 101100 | 54 | 2c | , | Comma |
45 | 101101 | 55 | 2d | - | Hyphen, minus sign |
46 | 101110 | 56 | 2e | . | Dot, full stop |
47 | 101111 | 57 | 2f | / | Slash, forward slash, fraction bar, division slash |
48 | 110000 | 60 | 30 | 0 | number zero |
49 | 110001 | 61 | 31 | 1 | number one |
50 | 110010 | 62 | 32 | 2 | number two |
51 | 110011 | 63 | 33 | 3 | number three |
52 | 110100 | 64 | 34 | 4 | number four |
53 | 110101 | 65 | 35 | 5 | number five |
54 | 110110 | 66 | 36 | 6 | number six |
55 | 110111 | 67 | 37 | 7 | number seven |
56 | 111000 | 70 | 38 | 8 | number eight |
57 | 111001 | 71 | 39 | 9 | number nine |
58 | 111010 | 72 | 3a | : | Colon |
59 | 111011 | 73 | 3b | ; | Semicolon |
60 | 111100 | 74 | 3c | < | Less-than sign |
61 | 111101 | 75 | 3d | = | Equals sign |
62 | 111110 | 76 | 3e | > | Greater-than sign ; Inequality |
63 | 111111 | 77 | 3f | ? | Question mark |
64 | 1000000 | 100 | 40 | @ | At sign |
65 | 1000001 | 101 | 41 | A | Capital letter A |
66 | 1000010 | 102 | 42 | B | Capital letter B |
67 | 1000011 | 103 | 43 | C | Capital letter C |
68 | 1000100 | 104 | 44 | D | Capital letter D |
69 | 1000101 | 105 | 45 | E | Capital letter E |
70 | 1000110 | 106 | 46 | F | Capital letter F |
71 | 1000111 | 107 | 47 | G | Capital letter G |
72 | 1001000 | 110 | 48 | H | Capital letter H |
73 | 1001001 | 111 | 49 | I | Capital letter I |
74 | 1001010 | 112 | 4a | J | Capital letter J |
75 | 1001011 | 113 | 4b | K | Capital letter K |
76 | 1001100 | 114 | 4c | L | Capital letter L |
77 | 1001101 | 115 | 4d | M | Capital letter M |
78 | 1001110 | 116 | 4e | N | Capital letter N |
79 | 1001111 | 117 | 4f | O | Capital letter O |
80 | 1010000 | 120 | 50 | P | Capital letter P |
81 | 1010001 | 121 | 51 | Q | Capital letter Q |
82 | 1010010 | 122 | 52 | R | Capital letter R |
83 | 1010011 | 123 | 53 | S | Capital letter S |
84 | 1010100 | 124 | 54 | T | Capital letter T |
85 | 1010101 | 125 | 55 | U | Capital letter U |
86 | 1010110 | 126 | 56 | V | Capital letter V |
87 | 1010111 | 127 | 57 | W | Capital letter W |
88 | 1011000 | 130 | 58 | X | Capital letter X |
89 | 1011001 | 131 | 59 | Y | Capital letter Y |
90 | 1011010 | 132 | 5a | Z | Capital letter Z |
91 | 1011011 | 133 | 5b | [ | square brackets or box brackets, opening bracket |
92 | 1011100 | 134 | 5c | \ | Backslash, reverse slash |
93 | 1011101 | 135 | 5d | ] | box brackets or square brackets, closing bracket |
94 | 1011110 | 136 | 5e | ^ | Circumflex accent or Caret |
95 | 1011111 | 137 | 5f | _ | underscore, understrike, underbar or low line |
96 | 1100000 | 140 | 60 | ` | Grave accent |
97 | 1100001 | 141 | 61 | a | Lowercase letter a, minuscule a |
98 | 1100010 | 142 | 62 | b | Lowercase letter b, minuscule b |
99 | 1100011 | 143 | 63 | c | Lowercase letter c, minuscule c |
100 | 1100100 | 144 | 64 | d | Lowercase letter d, minuscule d |
101 | 1100101 | 145 | 65 | e | Lowercase letter e, minuscule e |
102 | 1100110 | 146 | 66 | f | Lowercase letter f, minuscule f |
103 | 1100111 | 147 | 67 | g | Lowercase letter g, minuscule g |
104 | 1101000 | 150 | 68 | h | Lowercase letter h, minuscule h |
105 | 1101001 | 151 | 69 | i | Lowercase letter i, minuscule i |
106 | 1101010 | 152 | 6a | j | Lowercase letter j, minuscule j |
107 | 1101011 | 153 | 6b | k | Lowercase letter k, minuscule k |
108 | 1101100 | 154 | 6c | l | Lowercase letter l, minuscule l |
109 | 1101101 | 155 | 6d | m | Lowercase letter m, minuscule m |
110 | 1101110 | 156 | 6e | n | Lowercase letter n, minuscule n |
111 | 1101111 | 157 | 6f | o | Lowercase letter o, minuscule o |
112 | 1110000 | 160 | 70 | p | Lowercase letter p, minuscule p |
113 | 1110001 | 161 | 71 | q | Lowercase letter q, minuscule q |
114 | 1110010 | 162 | 72 | r | Lowercase letter r, minuscule r |
115 | 1110011 | 163 | 73 | s | Lowercase letter s, minuscule s |
116 | 1110100 | 164 | 74 | t | Lowercase letter t, minuscule t |
117 | 1110101 | 165 | 75 | u | Lowercase letter u, minuscule u |
118 | 1110110 | 166 | 76 | v | Lowercase letter v, minuscule v |
119 | 1110111 | 167 | 77 | w | Lowercase letter w, minuscule w |
120 | 1111000 | 170 | 78 | x | Lowercase letter x, minuscule x |
121 | 1111001 | 171 | 79 | y | Lowercase letter y, minuscule y |
122 | 1111010 | 172 | 7a | z | Lowercase letter z, minuscule z |
123 | 1111011 | 173 | 7b | { | braces or curly brackets, opening braces |
124 | 1111100 | 174 | 7c | | | vertical-bar, vbar, vertical line or vertical slash |
125 | 1111101 | 175 | 7d | } | curly brackets or braces, closing curly brackets |
126 | 1111110 | 176 | 7e | ~ | Tilde ; swung dash |
3.扩展ASCII打印字符:
扩展的ASCII字符满足了对更多字符的需求。扩展的ASCII包含ASCII中已有的128个字符,又增加了128个字符,总共是256个。即使有了这些更多的字符,许多语言还是包含无法压缩到256个字符中的符号。因此出现了一些ASCII的变体来囊括地区性字符和符号。例如,许多软件程序把ASCII表(又称作ISO8859-1)用于北美、西欧、澳大利亚和非洲的语言。
ASCII code (Decimal) | ASCII code (Binary) | ASCII code (Octal) | ASCII code (Hex) | Char | Description |
---|---|---|---|---|---|
128 | 10000000 | 200 | 80 | Ç | Majuscule C-cedilla |
129 | 10000001 | 201 | 81 | ü | letter u with umlaut or diaeresis, u-umlaut |
130 | 10000010 | 202 | 82 | é | letter e with acute accent or e-acute |
131 | 10000011 | 203 | 83 | â | letter a with circumflex accent or a-circumflex |
132 | 10000100 | 204 | 84 | ä | letter a with umlaut or diaeresis, a-umlaut |
133 | 10000101 | 205 | 85 | à | letter a with grave accent |
134 | 10000110 | 206 | 86 | å | letter a with a ring |
135 | 10000111 | 207 | 87 | ç | Minuscule c-cedilla |
136 | 10001000 | 210 | 88 | ê | letter e with circumflex accent or e-circumflex |
137 | 10001001 | 211 | 89 | ë | letter e with umlaut or diaeresis ; e-umlauts |
138 | 10001010 | 212 | 8a | è | letter e with grave accent |
139 | 10001011 | 213 | 8b | ï | letter i with umlaut or diaeresis ; i-umlaut |
140 | 10001100 | 214 | 8c | î | letter i with circumflex accent or i-circumflex |
141 | 10001101 | 215 | 8d | ì | letter i with grave accent |
142 | 10001110 | 216 | 8e | Ä | letter A with umlaut or diaeresis ; A-umlaut |
143 | 10001111 | 217 | 8f | Å | Capital letter A with a ring |
144 | 10010000 | 220 | 90 | É | Capital letter E with acute accent or E-acute |
145 | 10010001 | 221 | 91 | æ | Latin diphthong ae in lowercase |
146 | 10010010 | 222 | 92 | Æ | Latin diphthong AE in uppercase |
147 | 10010011 | 223 | 93 | ô | letter o with circumflex accent or o-circumflex |
148 | 10010100 | 224 | 94 | ö | letter o with umlaut or diaeresis ; o-umlaut |
149 | 10010101 | 225 | 95 | ò | letter o with grave accent |
150 | 10010110 | 226 | 96 | û | letter u with circumflex accent or u-circumflex |
151 | 10010111 | 227 | 97 | ù | letter u with grave accent |
152 | 10011000 | 230 | 98 | ÿ | Lowercase letter y with diaeresis |
153 | 10011001 | 231 | 99 | Ö | Letter O with umlaut or diaeresis ; O-umlaut |
154 | 10011010 | 232 | 9a | Ü | Letter U with umlaut or diaeresis ; U-umlaut |
155 | 10011011 | 233 | 9b | ø | Lowercase slashed zero or empty set |
156 | 10011100 | 234 | 9c | £ | Pound sign ; symbol for the pound sterling |
157 | 10011101 | 235 | 9d | Ø | Uppercase slashed zero or empty set |
158 | 10011110 | 236 | 9e | × | Multiplication sign |
159 | 10011111 | 237 | 9f | ƒ | Function sign ; f with hook sign ; florin sign |
160 | 10100000 | 240 | a0 | á | Lowercase letter a with acute accent or a-acute |
161 | 10100001 | 241 | a1 | í | Lowercase letter i with acute accent or i-acute |
162 | 10100010 | 242 | a2 | ó | Lowercase letter o with acute accent or o-acute |
163 | 10100011 | 243 | a3 | ú | Lowercase letter u with acute accent or u-acute |
164 | 10100100 | 244 | a4 | ñ | eñe, enie, spanish letter enye, lowercase n with tilde |
165 | 10100101 | 245 | a5 | Ñ | Spanish letter enye, uppercase N with tilde, EÑE, enie |
166 | 10100110 | 246 | a6 | ª | feminine ordinal indicator |
167 | 10100111 | 247 | a7 | º | masculine ordinal indicator |
168 | 10101000 | 250 | a8 | ¿ | Inverted question marks |
169 | 10101001 | 251 | a9 | Registered trademark symbol | |
170 | 10101010 | 252 | aa | ¬ | Logical negation symbol |
171 | 10101011 | 253 | ab | ½ | One half |
172 | 10101100 | 254 | ac | ¼ | Quarter, one fourth |
173 | 10101101 | 255 | ad | ¡ | Inverted exclamation marks |
174 | 10101110 | 256 | ae | « | Angle quotes, guillemets, right-pointing quotation mark |
175 | 10101111 | 257 | af | » | Guillemets, angle quotes, left-pointing quotation marks |
176 | 10110000 | 260 | b0 | ░ | Graphic character, low density dotted |
177 | 10110001 | 261 | b1 | ▒ | Graphic character, medium density dotted |
178 | 10110010 | 262 | b2 | ▓ | Graphic character, high density dotted |
179 | 10110011 | 263 | b3 | │ | Box drawing character single vertical line |
180 | 10110100 | 264 | b4 | ┤ | Box drawing character single vertical and left line |
181 | 10110101 | 265 | b5 | Á | Capital letter A with acute accent or A-acute |
182 | 10110110 | 266 | b6 | Â | Letter A with circumflex accent or A-circumflex |
183 | 10110111 | 267 | b7 | À | Letter A with grave accent |
184 | 10111000 | 270 | b8 | Copyright symbol | |
185 | 10111001 | 271 | b9 | ╣ | Box drawing character double line vertical and left |
186 | 10111010 | 272 | ba | ║ | Box drawing character double vertical line |
187 | 10111011 | 273 | bb | ╗ | Box drawing character double line upper right corner |
188 | 10111100 | 274 | bc | ╝ | Box drawing character double line lower right corner |
189 | 10111101 | 275 | bd | ¢ | Cent symbol |
190 | 10111110 | 276 | be | ¥ | YEN and YUAN sign |
191 | 10111111 | 277 | bf | ┐ | Box drawing character single line upper right corner |
192 | 11000000 | 300 | c0 | └ | Box drawing character single line lower left corner |
193 | 11000001 | 301 | c1 | ┴ | Box drawing character single line horizontal and up |
194 | 11000010 | 302 | c2 | ┬ | Box drawing character single line horizontal down |
195 | 11000011 | 303 | c3 | ├ | Box drawing character single line vertical and right |
196 | 11000100 | 304 | c4 | ─ | Box drawing character single horizontal line |
197 | 11000101 | 305 | c5 | ┼ | Box drawing character single line horizontal vertical |
198 | 11000110 | 306 | c6 | ã | Lowercase letter a with tilde or a-tilde |
199 | 11000111 | 307 | c7 | Ã | Capital letter A with tilde or A-tilde |
200 | 11001000 | 310 | c8 | ╚ | Box drawing character double line lower left corner |
201 | 11001001 | 311 | c9 | ╔ | Box drawing character double line upper left corner |
202 | 11001010 | 312 | ca | ╩ | Box drawing character double line horizontal and up |
203 | 11001011 | 313 | cb | ╦ | Box drawing character double line horizontal down |
204 | 11001100 | 314 | cc | ╠ | Box drawing character double line vertical and right |
205 | 11001101 | 315 | cd | ═ | Box drawing character double horizontal line |
206 | 11001110 | 316 | ce | ╬ | Box drawing character double line horizontal vertical |
207 | 11001111 | 317 | cf | ¤ | Generic currency sign |
208 | 11010000 | 320 | d0 | ð | Lowercase letter eth |
209 | 11010001 | 321 | d1 | Ð | Capital letter Eth |
210 | 11010010 | 322 | d2 | Ê | Letter E with circumflex accent or E-circumflex |
211 | 11010011 | 323 | d3 | Ë | Letter E with umlaut or diaeresis, E-umlaut |
212 | 11010100 | 324 | d4 | È | Capital letter E with grave accent |
213 | 11010101 | 325 | d5 | ı | Lowercase dot less i |
214 | 11010110 | 326 | d6 | Í | Capital letter I with acute accent or I-acute |
215 | 11010111 | 327 | d7 | Î | Letter I with circumflex accent or I-circumflex |
216 | 11011000 | 330 | d8 | Ï | Letter I with umlaut or diaeresis ; I-umlaut |
217 | 11011001 | 331 | d9 | ┘ | Box drawing character single line lower right corner |
218 | 11011010 | 332 | da | ┌ | Box drawing character single line upper left corner |
219 | 11011011 | 333 | db | █ | Block, graphic character |
220 | 11011100 | 334 | dc | ▄ | Bottom half block |
221 | 11011101 | 335 | dd | ¦ | Vertical broken bar |
222 | 11011110 | 336 | de | Ì | Capital letter I with grave accent |
223 | 11011111 | 337 | df | ▀ | Top half block |
224 | 11100000 | 340 | e0 | Ó | Capital letter O with acute accent or O-acute |
225 | 11100001 | 341 | e1 | ß | Letter Eszett ; scharfes S or sharp S |
226 | 11100010 | 342 | e2 | Ô | Letter O with circumflex accent or O-circumflex |
227 | 11100011 | 343 | e3 | Ò | Capital letter O with grave accent |
228 | 11100100 | 344 | e4 | õ | Lowercase letter o with tilde or o-tilde |
229 | 11100101 | 345 | e5 | Õ | Capital letter O with tilde or O-tilde |
230 | 11100110 | 346 | e6 | µ | Lowercase letter Mu ; micro sign or micron |
231 | 11100111 | 347 | e7 | þ | Lowercase letter Thorn |
232 | 11101000 | 350 | e8 | Þ | Capital letter Thorn |
233 | 11101001 | 351 | e9 | Ú | Capital letter U with acute accent or U-acute |
234 | 11101010 | 352 | ea | Û | Letter U with circumflex accent or U-circumflex |
235 | 11101011 | 353 | eb | Ù | Capital letter U with grave accent |
236 | 11101100 | 354 | ec | ý | Lowercase letter y with acute accent |
237 | 11101101 | 355 | ed | Ý | Capital letter Y with acute accent |
238 | 11101110 | 356 | ee | ¯ | Macron symbol |
239 | 11101111 | 357 | ef | ´ | Acute accent |
240 | 11110000 | 360 | f0 | ≡ | Congruence relation symbol |
241 | 11110001 | 361 | f1 | ± | Plus-minus sign |
242 | 11110010 | 362 | f2 | ‗ | underline or underscore |
243 | 11110011 | 363 | f3 | ¾ | three quarters, three-fourths |
244 | 11110100 | 364 | f4 | ¶ | Paragraph sign or pilcrow ; end paragraph mark |
245 | 11110101 | 365 | f5 | § | Section sign |
246 | 11110110 | 366 | f6 | ÷ | The division sign ; Obelus |
247 | 11110111 | 367 | f7 | ¸ | cedilla |
248 | 11111000 | 370 | f8 | ° | Degree symbol |
249 | 11111001 | 371 | f9 | ¨ | Diaresis |
250 | 11111010 | 372 | fa | · | Interpunct or space dot |
251 | 11111011 | 373 | fb | ¹ | Superscript one, exponent 1, first power |
252 | 11111100 | 374 | fc | ³ | Superscript three, exponent 3, cube, third power |
253 | 11111101 | 375 | fd | ² | Superscript two, exponent 2, square, second power |
254 | 11111110 | 376 | fe | ■ | black square |
255 | 11111111 | 377 | ff | nbsp | Non-breaking space or no-break space |
KingbaseES错误分析 -- “requested character too large”的更多相关文章
- PHP出现iconv(): Detected an illegal character in input string
PHP传给JS字符串用ecsape转换加到url里,又用PHP接收,再用网上找的unscape函数转换一下,这样得到的字符串是UTF-8的,但我需要的是GB2312,于是用iconv转换 开始是这样用 ...
- Tips for newbie to read source code
This post is first posted on my WeChat public account: GeekArtT Reading source code is always one bi ...
- 解决file_get_contents遇到中文文件名无法打开问题
利用file_get_contents打开文件或采集远程服务器文件如果文名或url中碰到汉字中文那么会出现failed to open stream:Lnvalid argument in错误. ...
- PHP iconv()函数转字符编码的问题(转)
PHP iconv()函数转字符编码的问题(转) 载自:http://www.nowamagic.net/php/php_FunctionIconv.php 在php函数库有一个函数:iconv(), ...
- php的函数iconv在转"utf-8"到"gb2312"时会自动截断
最近在写网站后台时候,需要用到iconv函数把前端jquery Post来过的utf-8编码内容转成gb2312, 发现只有用iconv函数把内容的数据一转码数据就会无缘无故的少了一部分. 问了我 ...
- php中iconv函数使用方法
最近在做一个程序,需要用到iconv函数把抓取来过的utf-8编码的页面转成gb2312, 发现只有用iconv函数把抓取过来的数据一转码数据就会无缘无故的少一些. iconv函数库能够完成各种字符集 ...
- php生成CSV格式(转)
参考网址: php对csv文件的常用操作集合 http://blog.xhbin.com/archives/748 1,下载CSV格式文档 唯一需要特别注意的是编码. <? include_on ...
- php5函数库
* APC缓存 apc_add — 缓存一个变量到数据存储 * DateTime DateTime::addDateTime::diffDateTime::formatDateTime::modify ...
- (转)PHP下编码转换函数mb_convert_encoding与iconv的使用说明
之--http://www.jb51.net/article/21451.htm mb_convert_encoding这个函数是用来转换编码的.原来一直对程序编码这一概念不理解,不过现在好像有点开窍 ...
- PHP下编码转换函数mb_convert_encoding与iconv的使用说明
mb_convert_encoding这个函数是用来转换编码的. 不过英文一般不会存在编码问题,只有中文数据才会有这个问题.比如你用Zend Studio或Editplus写程序时,用的是gbk编码, ...
随机推荐
- fgrep命令
fgrep命令 当需要搜索包含很多正则表达式元字符的字符串时,例如$.^等,fgrep很有用,其通过指定搜索字符串包含固定字符,从而无需对每个字符进行转义用反斜杠,如果搜索的字符串包含换行符,则每行将 ...
- junit自定义测试方法执行顺序
平常我们写单元测试类,多个方法的执行顺序其实是没有特定顺序的.例如下面代码: package com.laoxu.gamedog; import org.junit.FixMethodOrder; i ...
- jenkins构建报错:[FATAL] Non-readable settings
问题描述 问题分析 在项目的配置中配置了使用本地maven 配置. 解决方案 改为系统默认配置即可.修改后如图:点Build---右边高级按钮
- D. Required Length
D. Required Length 题意:给你一个长度n,一个数x,x每个后续状态可以由前一个状态乘以前一个状态的某一位上的数字得到,问最少多少步,能把x变成一个n位数.如果不能变成n位数,输出-1 ...
- TCP/IP的确认号,序列号和超时重传的学习笔记
一:确认应答和序列号 在tcp中,发送端的数据到达主机时,接收端会返回一个已收到的通知.这个消息叫做确认应答(ACK). 当发送端发送数据后,会等待对端的确认应答.如果有确认应答,说明数据已经成功到达 ...
- zookeeper源码(09)follower处理客户端请求
在zookeeper中,follower也可以接收客户端连接,处理客户端请求,本文将分析follower处理客户端请求的流程: 读请求处理 写请求转发与响应 follower接收转发客户端请求 网络层 ...
- gitee配置SSH公钥
第一步,找个地方打开"git bash",然后输入生成ssh公钥的命令: ssh-keygen -t rsa -C 'your-email' 然后敲四次回车生成公钥: 第二步,输入 ...
- 统信UOS系统开发笔记(四):从Qt源码编译安装之编译安装QtCreator4.11.2,并配置编译测试Demo
前言 上一篇已经从Qt源码编译了Qt,那么Qt开发的IDE为QtCreator,本篇从源码编译安装QtCreator,并配置好构建套件,运行Demo并测试. 统信UOS系统版本 系统版本: ...
- live555开发笔记(一):live555介绍、windows上msvc2017编译和工程模板
前言 在pc上搭建流媒体服务器软件,打开视频接受推流,使用live555方案. live555介绍 Live555是一个为流媒体提供解决方案的跨平台的C++开源项目,它实现了标准流媒体传输 ...
- pyqt5中通过pycharm配置designer(win和mac都适用,修改下designer目录路径即可)
安装 pip install PyQt5 -i https://pypi.douban.com/simple pip install PyQt5-tools -i https://pypi.douba ...