7.7.1 Unicode Property

  每个 Unicode 字符都只能属于一个 Unicode Property。所有的 Unicode Property 共分为7大类,30小类。大类的名字只有1个字母,小类的名字则不知1个字母,开头字母与所在大类的名字相同,小类包含的字符都属于它所在的大类。

.tg {border-collapse:collapse;border-spacing:0;}
.tg td{font-family:Arial, sans-serif;font-size:14px;padding:10px 5px;border-style:solid;border-width:1px;overflow:hidden;word-break:normal;border-color:black;}
.tg th{font-family:Arial, sans-serif;font-size:14px;font-weight:normal;padding:10px 5px;border-style:solid;border-width:1px;overflow:hidden;word-break:normal;border-color:black;}
.tg .tg-s268{text-align:left}
.tg .tg-0lax{text-align:left;vertical-align:top}

Unicode Property 说明
\p{C} 不可见的控制字符和未使用的码值
\p{Cc} ASCII 编码中 0x00 到 0x1F 或 Latin-1 编码中 0x80 到 0x9F 的控
制字符
\p{Cf} 不可见的格式字符
\p{Co} 留作私用的码值
\p{Cs} UTF-16 编码中 surrogate pair 的一半
\p{Cn} 未指定的码值
\p{L} 各种语言中的字母
\p{Ll} 具有大写形式的字母的小写形式
\p{Lt} 只有在单词首位才大写的字符
\p{L&} 等于Ll、Lu、Lt的组合
\p{Lo} 没有大小写形态的字母
\p{Lu} 具有小写字母的字母的大写形式
\p{M} 用来与其他字符结合的字符(声调、元音变化音等)
">\p{Mc} 与其他字符组合,并且会占用空间的字符(常见于东亚语言)
\p{Me} 需要成对出现的字符,比如圆括号、方括号
\p{Mn} 用来与其他字符结合,但并不占用额外空间的字符
\p{N} 各种书写系统中的数字字符
\p{Nd} 各种书写系统中的 0~9 的字符
\p{Nl} 形如字符的数字,比如罗马数字
\p{No} 上标或者下标数字,或者是0~9之外的数字(不包括表一书写系
统中的数字)
\p{P} 各种标点符号
\p{Pd} 各种连字符号
\p{Ps} 成对但不同的符号的前半部分(包括英文括号、中文括号、书名号)
\p{Pe} 成对但不同的符号的后半部分(包括英文括号、中文括号、书名号)
\p{Pi} 成对但不同的符号的前半部分(比如单引号、双引号)
\p{Pf} 成对但不同的符号的后半部分(比如单引号、双引号)
\p{Pc} 类似下划线之类的标点字符
\p{Po} 除横线、括号、引号和连接符之外的任何标点符号
\p{S} 数字符号、货币符号
\p{Sm} 数字符号
\p{Sc} 货币符号
\p{Sk} 由多个字符构成的组合字符
\p{So} 数字符号、货币符号和组合字符之外的符号字符
\p{Z} 空白字符,或者不可见的字符
\p{Zs} 不可见但占用空间的空白字符
\p{Zl} 分行符 U+2028
\p{Zp} 分段符 U+2029

7.7.1 Unicode Block

  每个 Unicode Block 都对应一个连续的 Unicode 码值区间,U+0000 到U+FFFF 之间的字符一共划分为 105 个 Block。

  使用时应该注意,Java 使用的 Unicode Block 是\p{In...}形式的,比如InCJK_Unified_Ideographs;而 .NET 使用的 Unicode Block 是\p{Is...}形式的,同时不包含下划线,比如IsCJKUnifiedIdeographs







正则表达式——Unicode 属性列表的更多相关文章

  1. 正则表达式——Unicode 属性

      每一个 Unicode 字符,除了有 Code Point 与之对应外,还具体其他属性,在正则表达式中常用到三种 Unicode 属性: Unicode Property.Unicode Scri ...

  2. 正则表达式通过Unicode属性匹配

    原文链接:http://zochen.iteye.com/blog/690716 Unicode 编码并不只是为某个字符简单定义了一个编码,而且还将其进行了归类. \pP 其中的小写 p 是 prop ...

  3. 利用Unicode属性移除文本中的标点符号

    原文:http://bbs.csdn.net/topics/270033191   摘抄: str = str.replaceAll("[\\pP‘’“”]", "&qu ...

  4. Struts2 contentType属性列表

    Struts2 contentType属性列表 博客分类: Struts 2   'ez' => 'application/andrew-inset', 'hqx' => 'applica ...

  5. iOS 应用数据存储方式(XML属性列表-plist)

    iOS 应用数据存储方式(XML属性列表-plist) 一.ios应用常用的数据存储方式 1.plist(XML属性列表归档) 2.偏好设置 3.NSKeydeArchiver归档(存储自定义对象) ...

  6. iOS开发备忘录:属性列表文件数据持久化

    属性列表文件是一种XML文件,Foundation框架中的数组和字典等都可以于属性列表文件相互转换. NSArray类常用读写属性列表文件的方法: +arrayWithContentsOfFile:类 ...

  7. iOS-数据持久化-属性列表

    属性列表 属性列表文件是一种XML文件,Foundation框架中的数组和字典等都可以于属性列表文件相互转换. NSArray类常用读写属性列表文件的方法: +arrayWithContentsOfF ...

  8. Unicode字符列表(超完整)

    Unicode字符列表(超完整)Unicode, 字符, 列表代码 显示 描述U+0020  空格 U+0021 ! 叹号 U+0022 " 双引号 U+0023 # 井号 U+0024 $ ...

  9. iOS开发UI篇—ios应用数据存储方式(XML属性列表-plist)

    iOS开发UI篇—ios应用数据存储方式(XML属性列表-plist) 一.ios应用常用的数据存储方式 1.plist(XML属性列表归档) 2.偏好设置 3.NSKeydeArchiver归档(存 ...

随机推荐

  1. 2018牛客网暑期ACM多校训练营(第十场)A Rikka with Lowbit (树状数组)

    链接:https://ac.nowcoder.com/acm/contest/148/A 来源:牛客网 Rikka with Lowbit 时间限制:C/C++ 5秒,其他语言10秒 空间限制:C/C ...

  2. python 类的成员及继承

    1. @staticmethod 静态方法 静态方法不能访问实例变量和类变量,除了身处类里面,所以只能通过类调用以外,它其实和类没有什么关系.如果想要用它访问实例变量或类变量,需要把实例和类传递给函数 ...

  3. ZROI 19.08.08模拟赛

    传送门 写在前面:为了保护正睿题目版权,这里不放题面,只写题解. 首先恭喜swk今天翻车! "小心大样例演你."--天祺鸽鸽 果然swk今天被大样例演死了,天祺鸽鸽诚不欺我! A ...

  4. api权限管理系统与前后端分离实践

    https://segmentfault.com/a/1190000014368885

  5. 正则化方法L1 L2

    转载:http://blog.csdn.net/u012162613/article/details/44261657(请移步原文) 正则化方法:防止过拟合,提高泛化能力 在训练数据不够多时,或者ov ...

  6. Zabbix4.x安装部署

    zabbix监控的重要性就不用再赘述了.直接上干货. 1.环境背景: Linux:CentOS 7.x, Database:MySQL zabbix server 和 zabbix mysql 安装在 ...

  7. Python字典实现

    这篇文章描述了在Python中字典是如何实现的. 字典通过键(key)来索引,它可以被看做是关联数组.我们在一个字典中添加3个键/值对: >>> d = {'a': 1, 'b': ...

  8. arguments详解——函数内命名参数之映射

    首先,arguments对象是所有(非箭头)函数中都可用的局部变量.你可以使用arguments对象在函数中引用函数的参数.此对象包含传递给函数的每个参数,第一个参数在索引0处. arguments对 ...

  9. sqli-labs(26)

    0X01 测试闭合 单引号报错 双引号不报错 ’闭合 构造语句  过滤了空格和and ?id=' anandd 1=1%23 ?id='+anandd+1=1%23 百度一下 一去看源码 真的顶不住 ...

  10. [CSP-S模拟测试]:bird(线段树优化DP)

    题目传送门(内部题89) 输入格式 第一行两个数$n$和$k$,分别表示小鸟的只数和$R$装弹时间.接下来$n$行,每行两个数$l,r$表示$n$只小鸟初始时的头和尾的$x$坐标. 输出格式 输出一个 ...