java.util.regex包下的Pattern类和Matcher类的使用总结
一.介绍
Java正则表达式通过java.util.regex包下的Pattern类与Matcher类实现
1.Pattern类用于创建一个正则表达式,也可以说创建一个匹配模式,它的构造方法是私有的,不可以直接创建,但可以通过Pattern.complie(String regex)简单工厂方法创建一个正则表达式.
2.Matcher类的构造方法也是私有的,不能随意创建,只能通过Pattern.matcher(CharSequence input)方法得到该类的实例.Pattern类只能做一些简单的匹配操作,
要想得到更强更便捷的正则匹配操作,那就需要将Pattern与Matcher一起合作.Matcher类提供了对正则表达式的分组支持,以及对正则表达式的多次匹配支持.
二.Pattern类
1.Pattern.compile(),Pattern.pattern()
Pattern类用于创建一个正则表达式,也可以说创建一个匹配模式,它的构造方法是私有的,不可以直接创建,但可以通过Pattern.complie(String regex)简单工厂方法创建一个正则表达式,将给定的正则表达式编译到模式中.
pattern() 返回正则表达式的字符串形式,其实就是返回Pattern.complile(String regex)的regex参数
/**
* Pattern类用于创建一个正则表达式,也可以说创建一个匹配模式,它的构造方法是私有的,不可以直接创建,
* 但可以通过Pattern.complie(String regex)简单工厂方法创建一个正则表达式,将给定的正则表达式编译到模式中,
* pattern() 返回正则表达式的字符串形式,其实就是返回Pattern.complile(String regex)的regex参数
*/
@Test
public void test3(){
Pattern p=Pattern.compile("\\w+");
String str = p.pattern();
System.out.println(str);//返回 \w+
}
2.Pattern.split()
Pattern有一个split(CharSequence input)方法,用于分隔字符串,并返回一个String[],String.split(String regex)就是通过Pattern.split(CharSequence input)来实现的.
/**
* Pattern有一个split(CharSequence input)方法,用于分隔字符串,并返回一个String[],
* String.split(String regex)就是通过Pattern.split(CharSequence input)来实现的.
*/
@Test
public void test4(){
Pattern p=Pattern.compile("\\d+");
String[] str=p.split("我的QQ是:456456我的电话是:0532214我的邮箱是:aaa@aaa.com");
for (String string : str) {
System.out.println(string);
/*
打印结果:
我的QQ是:
我的电话是:
我的邮箱是:aaa@aaa.com
*/
}
}
3.Pattern.matches()
Pattern.matches(String regex,CharSequence input)是一个静态方法,用于快速匹配字符串,该方法适合用于只匹配一次,且匹配全部字符串.
@Test
public void test5(){
System.out.println(Pattern.matches("\\d+","2223"));//返回true
System.out.println(Pattern.matches("\\d+","2223aa"));//返回false,需要匹配到所有字符串才能返回true,这里aa不能匹配到
System.out.println(Pattern.matches("\\d+","22bb23"));//返回false,需要匹配到所有字符串才能返回true,这里bb不能匹配到
}
三.Matcher类
Matcher类的构造方法也是私有的,不能随意创建,只能通过Pattern.matcher(CharSequence input)方法得到该类的实例.Pattern类只能做一些简单的匹配操作,要想得到更强更便捷的正则匹配操作,那就需要将Pattern与Matcher一起合作.
Matcher类提供了对正则表达式的分组支持,以及对正则表达式的多次匹配支持.
1.Pattern.matcher()
@Test
public void test6(){
Pattern p=Pattern.compile("\\d+");
Matcher m=p.matcher("22bb23");
m.pattern();//返回p 也就是返回该Matcher对象是由哪个Pattern对象的创建的
}
2.Matcher.matches()
Matcher类提供三个匹配操作方法,三个方法均返回boolean类型,当匹配到时返回true,没匹配到则返回false,matches()对整个字符串进行匹配,只有整个字符串都匹配了才返回true
/**
* Matcher类提供三个匹配操作方法,三个方法均返回boolean类型,当匹配到时返回true,没匹配到则返回false
* matches()对整个字符串进行匹配,只有整个字符串都匹配了才返回true
*/
@Test
public void test7(){
Pattern p=Pattern.compile("\\d+");
Matcher m=p.matcher("22bb23");
System.out.println( m.matches() );//返回false,因为bb不能被\d+匹配,导致整个字符串匹配未成功. Matcher m2=p.matcher("2223");
System.out.println( m2.matches() );//返回true,因为\d+匹配到了整个字符串
}
我们现在回头看一下Pattern.matches(String regex,CharSequence input),它与Pattern.compile(regex).matcher(input).matches() 等价!
3.Matcher.lookingAt()
lookingAt()对前面的字符串进行匹配,只有匹配到的字符串在最前面才返回true
/**
* lookingAt()对前面的字符串进行匹配,只有匹配到的字符串在最前面才返回true
*/
@Test
public void test8(){
Pattern p=Pattern.compile("\\d+");
Matcher m=p.matcher("22bb23");
System.out.println( m.lookingAt() );//返回true,因为\d+匹配到了前面的22 Matcher m2=p.matcher("aa2223");
System.out.println( m2.lookingAt() );//返回false,因为\d+不能匹配前面的aa
}
4.Matcher.find()
find()对字符串进行匹配,匹配到的字符串可以在任何位置.
/**
* find()对字符串进行匹配,匹配到的字符串可以在任何位置.
*/
@Test
public void test9(){
Pattern p=Pattern.compile("\\d+");
Matcher m=p.matcher("22bb23");
System.out.println( m.find() );//返回true Matcher m2=p.matcher("aa2223");
System.out.println( m2.find() );//返回true Matcher m3=p.matcher("aa2223bb");
System.out.println( m3.find() );//返回true Matcher m4=p.matcher("aabb");
System.out.println( m4.find() );//返回false
}
5.Matcher.start(),Matcher.end(),Matcher.group()
@Test
public void test10(){
Pattern p=Pattern.compile("\\d+");
Matcher matcher = p.matcher("aaa2223bb");
System.out.println( matcher.find() );//返回ture 匹配2223
System.out.println( matcher.start() );//返回3
System.out.println( matcher.end() );//返回7,返回的是2223后的索引号
System.out.println( matcher.group() ); //返回2223
System.out.println("============="); Matcher matcher2=p.matcher("2223bb");
System.out.println( matcher2.lookingAt() ); //返回true 匹配2223
System.out.println( matcher2.start() ); //返回0,由于lookingAt()只能匹配前面的字符串,所以当使用lookingAt()匹配时,start()方法总是返回0
System.out.println( matcher2.end() ); //返回4
System.out.println( matcher2.group() ); //返回2223
}
6.Matcher.start(i),Matcher.end(i),Matcher.group(i)
start(),end(),group()均有一个重载方法它们是start(int i),end(int i),group(int i)专用于分组操作,Mathcer类还有一个groupCount()用于返回有多少组.
/**
*说了这么多,相信大家都明白了以上几个方法的使用,该说说正则表达式的分组在java中是怎么使用的.
*start(),end(),group()均有一个重载方法它们是start(int i),end(int i),group(int i)专用于分组操作,Mathcer类还有一个groupCount()用于返回有多少组.
*/ @Test
public void test11(){
Pattern p=Pattern.compile("([a-z]+)(\\d+)");
Matcher m=p.matcher("aaa2223bb");
m.find(); //匹配aaa2223
m.groupCount(); //返回2,因为有2组
m.start(1); //返回0 返回第一组匹配到的子字符串在字符串中的索引号
m.start(2); //返回3
m.end(1); //返回3 返回第一组匹配到的子字符串的最后一个字符在字符串中的索引位置.
m.end(2); //返回7
m.group(1); //返回aaa,返回第一组匹配到的子字符串
m.group(2); //返回2223,返回第二组匹配到的子字符串
}
四.较高级的正则匹配操作 (主要是Matcher.group() 的使用)
1.
/**
* 现在我们使用一下稍微高级点的正则匹配操作,例如有一段文本,里面有很多数字,
* 而且这些数字是分开的,我们现在要将文本中所有数字都取出来,利用java的正则操作是那么的简单.
*/
@Test
public void test12(){
Pattern p=Pattern.compile("\\d+");
Matcher m=p.matcher("我的QQ是:456456 我的电话是:0532214 我的邮箱是:aaa123@aaa.com");
while(m.find()) {
System.out.println(m.group());
/*
打印输出
456456
0532214
123
*/
}
}
2.
/**
* 现在大家应该知道,每次执行匹配操作后start(),end(),group()三个方法的值都会改变,
* 改变成匹配到的子字符串的信息,以及它们的重载方法,也会改变成相应的信息.
* 注意:只有当匹配操作成功,才可以使用start(),end(),group()三个方法,否则会抛出java.lang.IllegalStateException,
* 也就是当matches(),lookingAt(),find()其中任意一个方法返回true时,才可以使用.
*/
@Test
public void test13(){
Pattern p=Pattern.compile("\\d+");
Matcher m=p.matcher("我的QQ是:456456 我的电话是:0532214 我的邮箱是:aaa123@aaa.com");
while(m.find()) {
System.out.println(m.group());
System.out.print("start:"+m.start());
System.out.println(" end:"+m.end());
/*
打印输出
456456
start:6 end:12
0532214
start:19 end:26
123
start:36 end:39
*/
}
}
3.见另一篇博客http://www.cnblogs.com/DreamDrive/p/7594259.html
@Test
public void test1() {
Pattern pattern = Pattern.compile("页面下载失败\\.url:\\[http://[a-z0-9]+\\.(.+)/.+\\]\\.当前时间戳:\\[([0-9]+)\\]");
Matcher matcher = pattern.matcher("页面下载失败.url:[http://item.jd.com/15626278.html].当前时间戳:[1471415298943]");
if(matcher.find()){
String top_domain = matcher.group(1);
String curr_time = matcher.group(2);
System.out.println(top_domain+"--"+"--"+curr_time);//jd.com----1471415298943
}
} @Test
public void test2(){
String url = "https://item.jd.com/698763154.html";
Pattern pattern = Pattern.compile("https://item.jd.com/([0-9]+).html");
Matcher matcher = pattern.matcher(url);
if(matcher.find()){
System.out.println(matcher.group(1));//
System.out.println(matcher.group(0));//https://item.jd.com/698763154.html
}
}
java.util.regex包下的Pattern类和Matcher类的使用总结的更多相关文章
- java.util.regex包下的Pattern和Matcher详解(正则匹配)
java正则表达式通过java.util.regex包下的Pattern类与Matcher类实现(建议在阅读本文时,打开java API文档,当介绍到哪个方法时,查看java API中的方法说明,效果 ...
- java.util.concurrent包下集合类的特点与适用场景
java.util.concurrent包,此包下的集合都不允许添加null元素 序号 接口 类 特性 适用场景 1 Queue.Collection ArrayBlockingQueue 有界.阻塞 ...
- Function接口 – Java8中java.util.function包下的函数式接口
Introduction to Functional Interfaces – A concept recreated in Java 8 Any java developer around the ...
- Java并发编程之java.util.concurrent包下常见类的使用
一,Condition 一个场景,两个线程数数,同时启动两个线程,线程A数1.2.3,然后线程B数4.5.6,最后线程A数7.8.9,程序结束,这涉及到线程之间的通信. public class Co ...
- Java中java.util.concurrent包下的4中线程池代码示例
先来看下ThreadPool的类结构 其中红色框住的是常用的接口和类(图片来自:https://blog.csdn.net/panweiwei1994/article/details/78617117 ...
- java.util.concurrent包下并发锁的特点与适用场景
序号 类 备注 核心代码 适用场景 1 synchronized 同步锁 并发锁加在方法级别上,如果是单例class对象,则只能允许一个线程进入public synchronized void doX ...
- JAVA正则表达式:Pattern类与Matcher类详解(转)
java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包.它包括两个类:Pattern和Matcher Pattern 一个Pattern是一个正则表达式经编译后的表 ...
- JAVA正则表达式:Pattern类与Matcher类详解
java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包.它包括两个类:Pattern和Matcher Pattern 一个Pattern是一个正则表达式经编译后的表 ...
- Java正则表达式:Pattern类和Matcher类
一.捕获组的概念 捕获组可以通过从左到右计算其开括号来编号,编号是从1 开始的.例如,在表达式 ((A)(B(C)))中,存在四个这样的组: 1 ((A)(B(C))) 2 (A) 3 ...
随机推荐
- Spring+MVC Controller层接收App端请求的中文参数乱码问题。
在正文之前,说明下Filter的作用: 过滤器顾名思义就是进行过滤的,可以实现代码的定向执行和预处理.通俗点说法filter相当于加油站,request是条路,response是条路,目的地是serv ...
- EmWin 接触---基础函数
创建对话框,需求两个基本要素:资源表和对话框过程.对话框可以基于阻塞(使用 GUI_ExecDialogBox())或非阻塞(使用 GUI_CreateDialogBox())方式创建.以下为例: G ...
- linux端口详解大全
0|无效端口,通常用于分析操作系统 1|传输控制协议端口服务多路开关选择器 2|管理实用程序 3|压缩进程 5|远程作业登录 7|回显 9|丢弃 11|在线用户 13|时间 17|每日引用 18|消息 ...
- 【Selenium】【BugList6】调用IE,未启用保护模式,报:selenium.common.exceptions.WebDriverException: Message: Unexpected error launching Internet Explorer. Protected Mode settings are not the same for all zones.
>>> driver = webdriver.Ie() 解决方法: 1.打开Ie浏览器 , 工具 ->Internet选项 ->安全 2.去掉4个区域的安全保护模式
- Ubuntu修改系统时间
在新版的ubuntu中,使用timedatectl 替换了ntpdate来进行时间管理. 1.查看当前时间状态 查看当前时间状态 timedatectl status : res@ubuntu:~$ ...
- 解决ssh连接慢,挂起在SSH2_MSG_SERVICE_ACCEPT信息之后很久的问题
问题现象:无论是ssh 还是 scp 都会连接很久才提示输认证信息(注意:是连接慢) 如本机IP:192.168.18.208 (Hostname: ThinkPad) 目标主机:192.168.18 ...
- intent和手势探测
一.三种启动方法 setComponent ComponentName comp = new ComponentName( this, SecondActivity.class); Intent in ...
- [swarthmore cs75] Compiler 3 – Cobra
课程回顾 Swarthmore学院16年开的编译系统课,总共10次大作业.本随笔记录了相关的课堂笔记以及第5次大作业. 增加了bool数据表示和比较运算符的支持,具体语法参考下图: 第一种int和bo ...
- prim算法和克鲁斯卡尔算法
Prim 设图G=(V,E)是一个具有n个顶点的连通网,其生成树的顶点集合为U.首先把v0放入U,再在所有的u∈U,v∈V-U的边(u,v)∈E中找一条最小权值的边,加入生成树,并把该边的v加入U集合 ...
- numpy 与 matplotlib 的应用
numpy 与 matplotlib 的应用 一.库函数介绍 1. numpy库 NumPy(Numeric Python)提供了一个N维的数组类型ndarray,Numpy底层使用C语言编写,内部解 ...