Java 正则表达式实例操作

Regular Expression正则表达式，简称RegExp，常规通用的表达式，在多个开发语言中都有它的实现，可以通过正则表达式来快速的检索、匹配、查找、替换字符串中的文本。

简单实例

匹配网址

/*

 * File:RegExp.java

 * User:iChochy

 * URL:https://ichochy.com

 * Copyright (c) 2020

 * Date:2020/09/07 18:11:07

 */

package com.ichochy.example;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class RegExp {

    public static void main(String[] args) {

        String input = "https://ichochy.com";

        //正则表达式，(.+)代表一个或多个字符

        String regex = "https://.+.com";

        Boolean flag = Pattern.matches(regex,input);

        System.out.println(flag);  //全文匹配返回：true

    }

}

Matches 方法

Matcher.matches方法，为整块全匹配，字符串完全匹配返回true。

/*

 * File:RegExp.java

 * User:iChochy

 * URL:https://ichochy.com

 * Copyright (c) 2020

 * Date:2020/09/07 18:11:07

 */

package com.ichochy.example;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class RegExp {

    public static void main(String[] args) {

        String input = "https://ichochy.com";

        //正则表达式，(.+)代表一个或多个字符

        String regex = "https://.+.com";

        Pattern pattern = Pattern.compile(regex);//编译表达式

        Matcher matcher = pattern.matcher(input);//匹配表达式

        System.out.println(matcher.matches());//全文匹配返回：true

    }

}

Find 方法

Matcher.find方法，为查找模式匹配，匹配到就返回true。

/*

 * File:RegExp.java

 * User:iChochy

 * URL:https://ichochy.com

 * Copyright (c) 2020

 * Date:2020/09/07 18:11:07

 */

package com.ichochy.example;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class RegExp {

    public static void main(String[] args) {

        String input = "我的网站是：https://ichochy.com，你知道吗？";

        //正则表达式，(.+)代表一个或多个字符

        String regex = "https://.+.com";

        Pattern pattern = Pattern.compile(regex);//编译表达式

        Matcher matcher = pattern.matcher(input);//匹配表达式

        System.out.println(matcher.find());//查找匹配返回：true

        System.out.println(matcher.matches());//全文匹配返回：false

        System.out.println(matcher.find());//再次查找匹配返回：false

        matcher.reset();//重置匹配器

        System.out.println(matcher.find());//重置查找返回：true

    }

}

find方法多次调用，出现结果不相同的问题：

This method starts at the beginning of this matcher's region, or, if a previous invocation of the method was successful and the matcher has not since been reset, at the first character not matched by the previous match.

Matcher.find方法第一次查找匹配成功后，如果Matcher没有重置(Matcher.reset())，则从上一次匹配成功位置的后面开始查找，所以会出现，再次匹配不成功，返回false。

Group 分组

正则表达式通过括号分组进行匹配，matcher.group(int group)：通过组序号获取匹配信息

/*

 * File:RegExp.java

 * User:iChochy

 * URL:https://ichochy.com

 * Copyright (c) 2020

 * Date:2020/09/07 18:11:07

 */

package com.ichochy.example;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class RegExp {

    public static void main(String[] args) {

        String input = "我的网站是：https://ichochy.com，你知道吗？";

        String regex = "(https://)(.+)(.com)";//分组表达式

        Pattern pattern = Pattern.compile(regex);

        Matcher matcher = pattern.matcher(input);

        if(matcher.find()){//查找匹配成功

            //匹配的信息：https://ichochy.com

            System.out.println(matcher.group().toString());

            //groupCount 组数

            for (int i = 0; i < matcher.groupCount(); i++) {

                //每组匹配的信息，注意：序号是从 1 开始

                System.out.println(matcher.group(i+1));

            }

        }

    }

}

正则表达式规则

字符

构造	匹配
x	字符 x
\	反斜线字符
\0n	带有八进制值 0 的字符 n (0 <= n <= 7)
\0nn	带有八进制值 0 的字符 nn (0 <= n <= 7)
\0mnn	带有八进制值 0 的字符 mnn（0 <= m <= 3、0 <= n <= 7）
\xhh	带有十六进制值 0x 的字符 hh
\uhhhh	带有十六进制值 0x 的字符 hhhh
\t	制表符('\u0009')
\n	新行（换行）符 ('\u000A')
\r	回车符 ('\u000D')
\f	换页符 ('\u000C')
\a	报警 (bell) 符 ('\u0007')
\e	转义符 ('\u001B')
\cx	对应于 x 的控制符

字符类

构造	匹配
[abc]	a、b 或 c（简单类）
[^abc]	任何字符，除了 a、b 或 c（否定）
[a-zA-Z]	a 到 z 或 A 到 Z，两头的字母包括在内（范围）
[a-d[m-p]]	a 到 d 或 m 到 p：[a-dm-p]（并集）
[a-z&&[def]]	d、e 或 f（交集）
[a-z&&[^bc]]	a 到 z，除了 b 和 c：[ad-z]（减去）
[a-z&&[^m-p]]	a 到 z，而非 m 到 p：[a-lq-z]（减去）

预定义字符类

构造	匹配
.	任何字符（与行结束符可能匹配也可能不匹配）
\d	数字：[0-9]
\D	非数字： [^0-9]
\s	空白字符：[ \t\n\x0B\f\r]
\S	非空白字符：[^\s]
\w	单词字符：[a-zA-Z_0-9]
\W	非单词字符：[^\w]

POSIX 字符类（仅 US-ASCII）

构造	匹配
\p{Lower}	小写字母字符：[a-z]
\p{Upper}	大写字母字符：[A-Z]
\p{ASCII}	所有 ASCII：[\x00-\x7F]
\p{Alpha}	字母字符：[\p{Lower}\p{Upper}]
\p{Digit}	十进制数字：[0-9]
\p{Alnum}	字母数字字符：[\p{Alpha}\p{Digit}]
\p{Punct}	标点符号：!"#$%&'()*+,-./:;<=>?@[]^_`{
\p{Graph}	可见字符：[\p{Alnum}\p{Punct}]
\p{Print}	可打印字符：[\p{Graph}\x20]
\p{Blank}	空格或制表符：[ \t]
\p{Cntrl}	控制字符：[\x00-\x1F\x7F]
\p{XDigit}	十六进制数字：[0-9a-fA-F]
\p{Space}	空白字符：[ \t\n\x0B\f\r]

java.lang.Character 类（简单的 java 字符类型）

构造	匹配
\p{javaLowerCase}	等效于 java.lang.Character.isLowerCase()
\p{javaUpperCase}	等效于 java.lang.Character.isUpperCase()
\p{javaWhitespace}	等效于 java.lang.Character.isWhitespace()
\p{javaMirrored}	等效于 java.lang.Character.isMirrored()

Unicode 块和类别的类

构造	匹配
\p{InGreek}	Greek 块（简单块）中的字符
\p{Lu}	大写字母（简单类别）
\p{Sc}	货币符号
\P{InGreek}	所有字符，Greek 块中的除外（否定）
[\p{L}&&[^\p{Lu}]]	所有字母，大写字母除外（减去）

边界匹配器

构造	匹配
^	行的开头
$	行的结尾
\b	单词边界
\B	非单词边界
\A	输入的开头
\G	上一个匹配的结尾
\Z	输入的结尾，仅用于最后的结束符（如果有的话）
\z	输入的结尾

Greedy 数量词

构造	匹配
X?	X，一次或一次也没有
X*	X，零次或多次
X+	X，一次或多次
X{n}	X，恰好 n 次
X{n,}	X，至少 n 次
X{n,m}	X，至少 n 次，但是不超过 m 次

Reluctant 数量词

构造	匹配
X??	X，一次或一次也没有
X*?	X，零次或多次
X+?	X，一次或多次
X{n}?	X，恰好 n 次
X{n,}?	X，至少 n 次
X{n,m}?	X，至少 n 次，但是不超过 m 次

Possessive 数量词

构造	匹配
X?+	X，一次或一次也没有
X*+	X，零次或多次
X++	X，一次或多次
X{n}+	X，恰好 n 次
X{n,}+	X，至少 n 次
X{n,m}+	X，至少 n 次，但是不超过 m 次

Logical 运算符

构造	匹配
XY	X 后跟 Y
X	Y
(X)	X，作为捕获组

Back 引用

构造	匹配
\n	任何匹配的 nth 捕获组

引用

构造	匹配
\	Nothing，但是引用以下字符
\Q	Nothing，但是引用所有字符，直到 \E
\E	Nothing，但是结束从 \Q 开始的引用

特殊构造（非捕获）

构造	匹配
(?:X)	X，作为非捕获组
(?idmsux-idmsux)	Nothing，但是将匹配标志i d m s u x on - off
(?idmsux-idmsux:X)	X，作为带有给定标志 i d m s u x on - off
(?=X)	X，通过零宽度的正 lookahead
(?!X)	X，通过零宽度的负 lookahead
(?<=X)	X，通过零宽度的正 lookbehind
(?<!X)	X，通过零宽度的负 lookbehind
(?>X)	X，作为独立的非捕获组

总结

可以看到，通过灵活的规则，设计出你想的表达式，来匹配复杂的字符串，从而快速便捷的操作。

源文：https://ichochy.com/posts/20200828/

Java 正则表达式实例操作的更多相关文章

Java正则表达式实例详解
创建正则表达式你可以从比较简单的东西入手学习正则表达式.要想全面地掌握怎样构建正则表达式,可以去看JDK 文档的java.util.regex 的Pattern 类的文档. 字符 B 字符B \xh ...
Java - 正则表达式常用操作
验证简单验证 String regex = "\\d{4}-\\d{2}-\\d{2}"; String input = "2016-01-01"; asse ...
JAVA正则表达式matcher.find()和 matcher.matches()的区别
1.find()方法是部分匹配,是查找输入串中与模式匹配的子串,如果该匹配的串有组还可以使用group()函数.matches()是全部匹配,是将整个输入串与模式匹配,如果要验证一个输入的数据是否为数 ...
java正则表达式语法详解及其使用代码实例
原文地址译者序(下载代码) 正则表达式善于处理文本,对匹配.搜索和替换等操作都有意想不到的作用.正因如此,正则表达式现在是作为程序员七种基本技能之一*,因此学习和使用它在工作中都能达到很高的效率. ...
Java经典实例：正则表达式，替换匹配的文本
import java.util.regex.Matcher; import java.util.regex.Pattern; /** * Created by Frank * 替换匹配的文本 */ ...
Java正则表达式基础知识及实例说明
众所周知,在程序开发中,难免会遇到需要匹配.查找.替换.判断字符串的情况发生,而这些情况有时又比较复杂,如果用纯编码方式解决,往往会浪费程序员的时间及精力.因此,学习及使用正则表达式,便成了解决这一矛 ...
Java正则表达式入门——转自RUNOOB.COM
Java 正则表达式正则表达式定义了字符串的模式. 正则表达式可以用来搜索.编辑或处理文本. 正则表达式并不仅限于某一种语言,但是在每种语言中有细微的差别. Java正则表达式和Perl的是最为相似 ...
Java 正则表达式详解
Java 提供了功能强大的正则表达式API,在java.util.regex 包下.本教程介绍如何使用正则表达式API. 正则表达式一个正则表达式是一个用于文本搜索的文本模式.换句话说,在文本中搜索 ...
JAVA正则表达式：Pattern类与Matcher类详解(转)
java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包.它包括两个类:Pattern和Matcher Pattern 一个Pattern是一个正则表达式经编译后的表 ...

随机推荐

高仿京东到家APP引导页炫酷动画效果
前言京东到家APP的引导页做的可圈可点,插画+动效,简明生动地说明了APP最吸引用户的几个亮点(商品多,价格低,配送快...).本文主要分析拆解这些动画效果,并完成一个高仿Demo,完整的Demo代 ...
在docker容器中使用cplex-python37
技术背景线性规划是常见的问题求解形式,可以直接跟实际问题进行对接,包括目标函数的建模和各种约束条件的限制等,最后对参数进行各种变更,以找到满足约束条件情况下可以达到的最优解.Cplex是一个由IBM ...
Java中的集合List - 入门篇
前言大家好啊,我是汤圆,今天给大家带来的是<Java中的集合List - 入门篇>,希望对大家有帮助,谢谢简介说实话,Java中的集合有很多种,但是这里作为入门级别,先简单介绍第一种 ...
java例题_24 逆向输入数字
1 /*24 [程序 24 根据输入求输出] 2 题目:给一个不多于 5 位的正整数,要求:一.求它是几位数,二.逆序打印出各位数字. 3 */ 4 5 /*分析 6 * 首先从键盘得到一个正整数,不 ...
Android Studio 上传本地项目到 GitHub 上
•准备工作注册 GitHub 账号 [GitHub官网] [视频教程] 安装 Git [官方链接] [极速下载链接] 创建本地代码仓库在桌面上,鼠标右击,选择 Git Bash Here : 接 ...
普通 Javaweb项目模板的搭建
普通 Javaweb项目模板的搭建 1. 创建一个web项目模板的maven项目 2.配置 Tomcat 服务器 3.先测试一下该空项目 4.注入 maven 依赖 5.创建项目的包结构 6.编写基础 ...
java面试-synchronized与lock有什么区别？
1.原始构成: synchronized是关键字,属于JVM层面,底层是由一对monitorenter和monitorexit指令实现的. ReentrantLock是一个具体类,是API层面的锁. ...
BUAAOO第二单元代码分析
第一次作业设计思路与感想第一次作业是要求有捎带的电梯实现, 第一次作业是花费的时间比较长的一次,花费了很多的时间去思考架构的问题.起初是想要搞三个线程的:输入线程,调度器线程和电梯线程,想要搞一个 ...
MyBatis笔记（七）
1. 简介什么是缓存? 存在内存中的临时数据将用户经常查询的数据存放在缓存(内存)中,用户取查询就不用从磁盘上(关系型数据库数据文件)查询,从缓存中查询,从而提高查询效率,解决了高并发系统的性能问 ...
Windows命令行学习（系统信息收集）
echo off :关闭回显 echo on :开启回显 net user :显示主机的电脑用户 ipconfig /displaydns:后面的 /displaydns是显示当前电脑所缓存的dns信 ...