Match类解析

Matcher类:
使用Matcher类,最重要的一个概念必须清楚:组(Group),在正则表达式中
()定义了一个组,由于一个正则表达式可以包含很多的组,所以下面先说说怎么划分组的,
以及这些组和组的下标怎么对应的.
下面我们看看一个小例子,来说明这个问题

引用

\w(\d\d)(\w+)

这个正则表达式有三个组:
整个\w(\d\d)(\w+) 是第0组 group(0)
(\d\d)是第1组 group(1)
(\w+)是第2组 group(2)
我们看看和正则表达式匹配的一个字符串x99SuperJava，
group(0)永远都是匹配整个表达式的字符串的那部分x99SuperJava
group(1)是第1组(\d\d)匹配的部分:99
group(2)是第二组(\w+)匹配的那部分SuperJava
下面我们写一个程序来验证一下：

package edu.jlu.fuliang;  

import java.util.regex.Matcher;

import java.util.regex.Pattern;  

public class RegexTest {

    public static void main(String[] args) {

        String regex = "\\w(\\d\\d)(\\w+)";

        String candidate = "x99SuperJava";  

        Pattern p = Pattern.compile(regex);

        Matcher matcher = p.matcher(candidate);

        if(matcher.find()){

            int gc = matcher.groupCount();

            for(int i = 0; i <= gc; i++)

                System.out.println("group " + i + " :" + matcher.group(i));

        }

    }

}

输出结果:

引用

group 0:99SuperJava
group 1 :99
group 2 :SuperJava

下面我们看看Matcher类提供的方法：
public Pattern pattern()
这个方法返回了，创建Matcher的那个pattern对象。
下面我们看看一个小例子来说明这个结果

import java.util.regex.*;  

public class MatcherPatternExample{

  public static void main(String args[]){

      test();

  }  

  public static void test(){

     Pattern p = Pattern.compile("\\d");

     Matcher m1 = p.matcher("55");

     Matcher m2 = p.matcher("fdshfdgdfh");  

     System.out.println(m1.pattern() == m2.pattern());

     //return true

  }

}

public Matcher reset()
这个方法将Matcher的状态重新设置为最初的状态。
public Matcher reset(CharSequence input)
重新设置Matcher的状态，并且将候选字符序列设置为input后进行Matcher,
这个方法和重新创建一个Matcher一样，只是这样可以重用以前的对象。
public int start()
这个方法返回了，Matcher所匹配的字符串在整个字符串的的开始下标：
下面我们看看一个小例子

public class MatcherStartExample{

  public static void main(String args[]){

      test();

  }

  public static void test(){

     //create a Matcher and use the Matcher.start() method

     String candidateString = "My name is Bond. James Bond.";

     String matchHelper[] =

      {"          ^","                      ^"};

     Pattern p = Pattern.compile("Bond");

     Matcher matcher = p.matcher(candidateString);  

     //Find the starting point of the first 'Bond'

      matcher.find();

      int startIndex = matcher.start();

      System.out.println(candidateString);

      System.out.println(matchHelper[0] + startIndex);  

     //Find the starting point of the second 'Bond'

      matcher.find();

      int nextIndex = matcher.start();

      System.out.println(candidateString);

      System.out.println(matchHelper[1] + nextIndex);

}

输出结果：
My name is Bond. James Bond.
^11
My name is Bond. James Bond.
^23
public int start(int group)
这个方法可以指定你感兴趣的sub group,然后返回sup group匹配的开始位置。
public int end()
这个和start()对应，返回在以前的匹配操作期间，由给定组所捕获子序列的最后字符之后的偏移量。
其实start和end经常是一起配合使用来返回匹配的子字符串。
public int end(int group)
和public int start(int group)对应，返回在sup group匹配的子字符串最后一个字符在整个字符串下标加一
public String group()
返回由以前匹配操作所匹配的输入子序列。
这个方法提供了强大而方便的工具，他可以等同使用start和end,然后对字符串作substring(start,end)操作。
看看下面一个小例子：

import java.util.regex.*;  

public class MatcherGroupExample{

  public static void main(String args[]){

      test();

  }

  public static void test(){

      //create a Pattern

      Pattern p = Pattern.compile("Bond");  

      //create a Matcher and use the Matcher.group() method

      String candidateString = "My name is Bond. James Bond.";

      Matcher matcher = p.matcher(candidateString);

      //extract the group

      matcher.find();

      System.out.println(matcher.group());

  }

}

public String group(int group)
这个方法提供了强大而方便的工具，可以得到指定的group所匹配的输入字符串
应为这两个方法经常使用，同样我们看一个小例子

import java.util.regex.*;  

public class MatcherGroupParamExample{

  public static void main(String args[]){

      test();

  }

  public static void test(){

     //create a Pattern

      Pattern p = Pattern.compile("B(ond)");  

     //create a Matcher and use the Matcher.group(int) method

     String candidateString = "My name is Bond. James Bond.";

     //create a helpful index for the sake of output

     Matcher matcher = p.matcher(candidateString);

     //Find group number 0 of the first find

      matcher.find();

      String group_0 = matcher.group(0);

      String group_1 = matcher.group(1);

      System.out.println("Group 0 " + group_0);

      System.out.println("Group 1 " + group_1);

      System.out.println(candidateString);  

     //Find group number 1 of the second find

      matcher.find();

      group_0 = matcher.group(0);

      group_1 = matcher.group(1);

      System.out.println("Group 0 " + group_0);

      System.out.println("Group 1 " + group_1);

      System.out.println(candidateString);

  }

}

public int groupCount()
这个方法返回了，正则表达式的匹配的组数。
public boolean matches()
尝试将整个区域与模式匹配。这个要求整个输入字符串都要和正则表达式匹配。
和find不同， find是会在整个输入字符串查找匹配的子字符串。
public boolean find()
find会在整个输入中寻找是否有匹配的子字符串，一般我们使用find的流程：

while(matcher.find()){

   //在匹配的区域，使用group,replace等进行查看和替换操作

}

public boolean find(int start)
从输入字符串指定的start位置开始查找。
public boolean lookingAt()
基本上是matches更松约束的一个方法，尝试将从区域开头开始的输入序列与该模式匹配
public Matcher appendReplacement (StringBuffer sb, String replacement)
你想把My name is Bond. James Bond. I would like a martini中的Bond换成Smith

StringBuffer sb = new StringBuffer();

String replacement = "Smith";

Pattern pattern = Pattern.compile("Bond");

Matcher matcher =pattern.matcher("My name is Bond. James Bond. I would like a martini.");

while(matcher.find()){

  matcher.appendReplacement(sb,replacement);//结果是My name is Smith. James Smith

}

Matcher对象会维护追加的位置，所以我们才能不断地使用appendReplacement来替换所有的匹配。
public StringBuffer appendTail(StringBuffer sb)
这个方法简单的把为匹配的结尾追加到StringBuffer中。在上一个例子的最后再加上一句：
matcher.appendTail(sb);
结果就会成为My name is Smith. James Smith. I would like a martini.
public String replaceAll(String replacement)
这个是一个更方便的方法，如果我们想替换所有的匹配的话，我们可以简单的使用replaceAll就ok了。

while(matcher.find()){

  matcher.appendReplacement(sb,replacement);//结果是My name is Smith. James Smith

}

matcher.appendTail(sb);

更便捷的方法:

public String replaceFirst(String replacement)

这个与replaceAll想对应很容易理解，就是只替换第一个匹配的。

Match类解析的更多相关文章

Spark 资源调度包 stage 类解析
spark 资源调度包 Stage(阶段) 类解析 Stage 概念 Spark 任务会根据 RDD 之间的依赖关系, 形成一个DAG有向无环图, DAG会被提交给DAGScheduler, DAGS ...
Bootstrap 类解析
Bootstrap 类解析元素 Bootstrap 类定义 <div> container 内容容器 <table> table 表格 <table> tabl ...
C#正则表达式编程（三）：Match类和Group类用法
前面两篇讲述了正则表达式的基础和一些简单的例子,这篇将稍微深入一点探讨一下正则表达式分组,在.NET中正则表达式分组是用Match类来代表的.首先先看一段代码: /// <summary> ...
Match类
Regex在匹配的时候,常常会返回一个Match类的对象,今天就来看看怎么玩这个对象. 一.属性 Captures 按从里到外.从左到右的顺序获取由捕获组匹配的所有捕获的集合(如果正则表达式用 Reg ...
【Owin 学习系列】2. Owin Startup 类解析
Owin Startup 类解析每个 Owin 程序都有 startup 类,在这个 startup 类里面你可以指定应用程序管道模型中的组件.你可以通过不同的方式来连接你的 startup 类和运 ...
Thrift compiler代码生成类解析
代码生成类解析: Thrift--facebook RPC框架,介绍就不说了,百度,google一大把,使用也不介绍,直接上结构和分析吧. Hello.thrift文件内容如下: namespace ...
SpringBoot入门（三）——入口类解析
本文来自网易云社区上一篇介绍了起步依赖,这篇我们先来看下SpringBoot项目是如何启动的. 入口类再次观察工程的Maven配置文件,可以看到工程的默认打包方式是jar格式的. <pack ...
【Spring注解驱动开发】AOP核心类解析，这是最全的一篇了！！
写在前面昨天二狗子让我给他讲@EnableAspectJAutoProxy注解,讲到AnnotationAwareAspectJAutoProxyCreator类的源码时,二狗子消化不了了.这不,今 ...
Log4j源码解析--核心类解析
原文出处:http://www.blogjava.net/DLevin/archive/2012/06/28/381667.html.感谢上善若水的无私分享. 在简单的介绍了Log4J各个模块类的作用 ...

随机推荐

HUST 1602 Substring
水题. #include<cstdio> #include<cstring> #include<cmath> #include<string> #inc ...
ucos调度器详解
这一片谈谈关于ucos调度器的相关知识. ucos的调度器的实现主要靠一个函数OS_Sched 该函数将调度器的行为分为了两个部分,第一是调度部分,第二是任务切换部分,如下 void OS_Sche ...
Unity3D ——强大的跨平台3D游戏开发工具（一）
众所周知,Unity3D是一个能够实现轻松创作的多平台的游戏开发工具,是一个全面整合的专业游戏引擎.在现有的版本中,其强大的游戏制作功能已经达到让人瞠目结舌的地步.尤其是它在3.0版本里面制作的那款 ...
java基础——1.内部类
内部类创建从外部类的非静态方法之外(?=静态方法)的任意位置创建某个内部类的对象,要加入外部类的名字,OuterClassName.InnerClassName public class Parce ...
UVa 793 - Network Connections
题目大意:给出计算机之间的连接配置,询问某两台计算机是否相连.判断两个点是否在同一个连通分量里,用并查集处理. #include <cstdio> #define MAXN 1000000 ...
Struts2命令空间小结
sturts2命名空间小结,以tomcat为服务器 1. 命名空间配置为“/” <package name="default" namespace="/" ...
Python3基础 filter与lambda表达式配合筛选出1-100之间的奇数
镇场诗: 诚听如来语,顿舍世间名与利.愿做地藏徒,广演是经阎浮提. 愿尽吾所学,成就一良心博客.愿诸后来人,重现智慧清净体.-------------------------------------- ...
C++指针与const
在C++中,const修饰符一般用于修饰常量.常量在定义的时候必须初始化,而且值一旦定义之后就不能修改,这样就能保证常量的值在程序运行过程中不会发生变换. 1.指向const对象的指针指向const ...
HDU-5123-who is the best?
题目链接 http://acm.hdu.edu.cn/showproblem.php?pid=5123 水题一个,直接hash: 代码 #include<stdio.h>#include& ...
Eclipse设置Tab键为空格！
http://z-hua.iteye.com/blog/1056713 今天设置Eclipse中按Tab键为4个空格,这里标记下! Window-->Preferences-->Java- ...

Match类解析

Match类解析的更多相关文章

随机推荐

热门专题