Matcher类:(转)

Matcher类:
使用Matcher类,最重要的一个概念必须清楚:组(Group),在正则表达式中 ()定义了一个组,由于一个正则表达式可以包含很多的组,所以下面先说说怎么划分组的, 以及这些组和组的下标怎么对应的.
下面我们看看一个小例子,来说明这个问题

\w(\d\d)(\w+)

这个正则表达式有三个组: 整个\w(\d\d)(\w+) 是第0组 group(0) (\d\d)是第1组 group(1) (\w+)是第2组 group(2)
我们看看和正则表达式匹配的一个字符串x99SuperJava，
group(0)是匹配整个表达式的字符串的那部分x99SuperJava group(1)是第1组(\d\d)匹配的部分:99
group(2)是第二组(\w+)匹配的那部分SuperJava

下面我们写一个程序来验证一下：

package edu.jlu.fuliang;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class RegexTest {

	public static void main(String[] args) {

		String regex = "\\w(\\d\\d)(\\w+)";

		String candidate = "x99SuperJava";

		Pattern p = Pattern.compile(regex);

		Matcher matcher = p.matcher(candidate);

		if(matcher.find()){

			int gc = matcher.groupCount();

			for(int i = 0; i <= gc; i++)

				System.out.println("group " + i + " :" + matcher.group(i));

		}

	}

}

输出结果:

引用

group 099SuperJava group 1 :99 group 2 :SuperJava

下面我们看看Matcher类提供的方法： public Pattern pattern() 这个方法返回了，创建Matcher的那个pattern对象。
下面我们看看一个小例子来说明这个结果

import java.util.regex.*;

public class MatcherPatternExample{

  public static void main(String args[]){

      test();

  }

  public static void test(){

     Pattern p = Pattern.compile("\\d");

     Matcher m1 = p.matcher("55");

     Matcher m2 = p.matcher("fdshfdgdfh");

     System.out.println(m1.pattern() == m2.pattern());

     //return true

  }

}

public Matcher reset() 这个方法将Matcher的状态重新设置为最初的状态。
public Matcher reset(CharSequence input)
重新设置Matcher的状态，并且将候选字符序列设置为input后进行Matcher, 这个方法和重新创建一个Matcher一样，只是这样可以重用以前的对象。
public int start()
这个方法返回了，Matcher所匹配的字符串在整个字符串的的开始下标：下面我们看看一个小例子

public class MatcherStartExample{

  public static void main(String args[]){

      test();

  }

  public static void test(){

     //create a Matcher and use the Matcher.start() method

     String candidateString = "My name is Bond. James Bond.";

     String matchHelper[] =

      {"          ^","                      ^"};

     Pattern p = Pattern.compile("Bond");

     Matcher matcher = p.matcher(candidateString);

     //Find the starting point of the first 'Bond'

      matcher.find();

      int startIndex = matcher.start();

      System.out.println(candidateString);

      System.out.println(matchHelper[0] + startIndex);

     //Find the starting point of the second 'Bond'

      matcher.find();

      int nextIndex = matcher.start();

      System.out.println(candidateString);

      System.out.println(matchHelper[1] + nextIndex);

}

输出结果： My name is Bond. James Bond. ^11 My name is Bond. James Bond. ^23
public int start(int group) 这个方法可以指定你感兴趣的sub group,然后返回sup group匹配的开始位置。
public int end()
这个和start()对应，返回在以前的匹配操作期间，由给定组所捕获子序列的最后字符之后的偏移量。
其实start和end经常是一起配合使用来返回匹配的子字符串。
public int end(int group) 和public int start(int group)对应，返回在sup group匹配的子字符串最后一个字符在整个字符串下标加一
public String group()
返回由以前匹配操作所匹配的输入子序列。
这个方法提供了强大而方便的工具，他可以等同使用start和end,然后对字符串作substring(start,end)操作。
看看下面一个小例子：

import java.util.regex.*;

public class MatcherGroupExample{

  public static void main(String args[]){

      test();

  }

  public static void test(){

      //create a Pattern

      Pattern p = Pattern.compile("Bond");

      //create a Matcher and use the Matcher.group() method

      String candidateString = "My name is Bond. James Bond.";

      Matcher matcher = p.matcher(candidateString);

      //extract the group

      matcher.find();

      System.out.println(matcher.group());

  }

}

public String group(int group)
这个方法提供了强大而方便的工具，可以得到指定的group所匹配的输入字符串因为这两个方法经常使用，同样我们看一个小例子：

import java.util.regex.*;

public class MatcherGroupParamExample{

  public static void main(String args[]){

      test();

  }

  public static void test(){

     //create a Pattern

      Pattern p = Pattern.compile("B(ond)");

     //create a Matcher and use the Matcher.group(int) method

     String candidateString = "My name is Bond. James Bond.";

     //create a helpful index for the sake of output

     Matcher matcher = p.matcher(candidateString);

     //Find group number 0 of the first find

      matcher.find();

      String group_0 = matcher.group(0);

      String group_1 = matcher.group(1);

      System.out.println("Group 0 " + group_0);

      System.out.println("Group 1 " + group_1);

      System.out.println(candidateString);

     //Find group number 1 of the second find

      matcher.find();

      group_0 = matcher.group(0);

      group_1 = matcher.group(1);

      System.out.println("Group 0 " + group_0);

      System.out.println("Group 1 " + group_1);

      System.out.println(candidateString);

  }

}

 public int groupCount()

这个方法返回了，正则表达式的匹配的组数。  

public boolean matches()

尝试将整个区域与模式匹配。这个要求整个输入字符串都要和正则表达式匹配。

和find不同， find是会在整个输入字符串查找匹配的子字符串。

public boolean find()

find会在整个输入中寻找是否有匹配的子字符串，一般我们使用find的流程：

 while(matcher.find()){

    //在匹配的区域，使用group,replace等进行查看和替换操作

 }

public boolean find(int start) 从输入字符串指定的start位置开始查找。
public boolean lookingAt()
基本上是matches更松约束的一个方法，尝试将从区域开头开始的输入序列与该模式匹配
public Matcher appendReplacement (StringBuffer sb, String replacement) 你想把My name is Bond. James Bond. I would like a martini中的Bond换成Smith

StringBuffer sb = new StringBuffer();

String replacement = "Smith";

Pattern pattern = Pattern.compile("Bond");

Matcher matcher =pattern.matcher("My name is Bond. James Bond. I would like a martini.");

while(matcher.find()){

  matcher.appendReplacement(sb,replacement);//结果是My name is Smith. James Smith

}

Matcher对象会维护追加的位置，所以我们才能不断地使用appendReplacement来替换所有的匹配。
public StringBuffer appendTail(StringBuffer sb)
这个方法简单的把为匹配的结尾追加到StringBuffer中。在上一个例子的最后再加上一句： matcher.appendTail(sb);
结果就会成为My name is Smith. James Smith. I would like a martini.
public String replaceAll(String replacement)
这个是一个更方便的方法，如果我们想替换所有的匹配的话，我们可以简单的使用replaceAll就ok了。是：

while(matcher.find()){

  matcher.appendReplacement(sb,replacement);//结果是My name is Smith. James Smith

}

matcher.appendTail(sb);

的更便捷的方法。

public String replaceFirst(String replacement)

这个与replaceAll想对应很容易理解，就是只替换第一个匹配的。

Matcher类:(转)的更多相关文章

JAVA正则表达式：Pattern类与Matcher类详解(转)
java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包.它包括两个类:Pattern和Matcher Pattern 一个Pattern是一个正则表达式经编译后的表 ...
Java中正则Matcher类的matches()、lookAt()和find()的区别
在Matcher类中有matches.lookingAt和find都是匹配目标的方法,但容易混淆,整理它们的区别如下: matches:整个匹配,只有整个字符序列完全匹配成功,才返回True,否则返回 ...
正则表达式：Pattern类与Matcher类详解
一.捕获组的概念捕获组可以通过从左到右计算其开括号来编号,编号是从1 开始的.例如,在表达式((A)(B(C)))中,存在四个这样的组: 1 ((A)(B(C))) 2 (A) 3 ...
JAVA正则表达式：Pattern类与Matcher类详解
java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包.它包括两个类:Pattern和Matcher Pattern 一个Pattern是一个正则表达式经编译后的表 ...
java14-4 Pattern和Matcher类的使用
获取功能 Pattern和Matcher类的使用模式和匹配器的基本使用顺序 import java.util.regex.Matcher; import java.util.regex.Pat ...
Java中正则Matcher类的matches()、lookAt()和find()的区别<转>
在Matcher类中有matches.lookingAt和find都是匹配目标的方法,但容易混淆,整理它们的区别如下: matches:整个匹配,只有整个字符序列完全匹配成功,才返回True,否则返回 ...
Java正则表达式：Pattern类和Matcher类
一.捕获组的概念捕获组可以通过从左到右计算其开括号来编号,编号是从1 开始的.例如,在表达式 ((A)(B(C)))中,存在四个这样的组: 1 ((A)(B(C))) 2 (A) 3 ...
[转] JAVA正则表达式：Pattern类与Matcher类详解(转)
java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包.它包括两个类:Pattern和 Matcher Pattern 一个Pattern是一个正则表达式经编译后的 ...
正则表达式中Pattern类、Matcher类和matches()方法简析
1.简介: java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包. 它包括两个类:Pattern和Matcher . Pattern: 一个Pattern是一 ...

随机推荐

关于Android构建
“IDE都是给小白程序员的,大牛级别的程序员一定是命令行控,终端控,你看大牛都是使用vim,emacs 就一切搞定” 这话说的虽然有些绝对,但是也不无道理,做开发这行要想效率高,自动化还真是缺少不了命 ...
小题精炼-----初试C语言
毫无疑问, 这个又是给新入门学C语言的小鲜肉准备的! 题解: 1. 直接两个循环就ok啦! 当初讲课的时候几乎讲过原题啦. 2. 直接 100的三次方就是1000000啦, 所以直接对某数的三次方开方 ...
Json-lib使用转载
1.从Object到String 要先用Object对象构造一个JSONObject或者JSONArray对象,然后调用它的toString()方法即可 (1)示例一 1 Book book=new ...
(三)uboot源码分析
一.九鼎官方uboot和三星原版uboot对比(1)以九鼎官方的uboot为蓝本来学习的,以三星官方的这份为对照.(2)不同版本的uboot或者同一版本不同人移植的uboot,可能目录结构和文件内容都 ...
可重入锁 & 自旋锁 & Java里的AtomicReference和CAS操作 & Linux mutex不可重入
之前还是写过蛮多的关于锁的文章的: http://www.cnblogs.com/charlesblc/p/5994162.html <[转载]Java中的锁机制 synchronized &a ...
Java Ant build.xml详解
1,什么是antant是构建工具2,什么是构建概念到处可查到,形象来说,你要把代码从某个地方拿来,编译,再拷贝到某个地方去等等操作,当然不仅与此,但是主要用来干这个3,ant的好处跨平台 --因为 ...
C++—函数探幽
一.内联函数 1.内联函数的机制内联函数是C++为提高程序运行速度而做的一项改进. 函数调用机制:常规函数调用使程序使程序跳到被掉函数的地址,并在函数结束时返回. 内联函数的机制:内联函数的代码与其 ...
Request 接收参数乱码原理解析
起因: 今天早上被同事问了一个问题:说接收到的参数是乱码,让我帮着解决一下. 实际情景: 同事负责的平台是Ext.js框架搭建的,web.config配置文件里配置了全局为“GB2312”编码: &l ...
graph-tool文档（一）- 快速开始使用Graph-tool - 1.创建和操纵图
目录: 快速开始使用graph-tool 创建和操纵图 -- 遍历顶点和边 ----- 遍历所有顶点或边 ----- 遍历一个顶点的neighbourhood 名词解释: instante:实例 di ...
unity3d WorldComposer1 卫星地图生成地形
http://blog.csdn.net/myarrow/article/details/42709113 1. 简介 1.1 TerrainComposer(TC) 一个Unity扩展工具,可用于创 ...

Matcher类:(转)

Matcher类:(转)的更多相关文章

随机推荐

热门专题