在java中使用正则表达式注意的地方
1、 对^与$的理解
通常我们会通过类似Matcher matcher = Pattern.compile(regex).matcher(string);的代码去拿到一个Matcher对象。
这种情况下regex中的^与$匹配的是整个待匹配串string的开头与结尾。
而要使^与$去匹配每一行的开始与结尾,则要使用Pattern.MULTILINE。即:Matcher matcher = Pattern.compile(regex, Pattern.MULTILINE).matcher(string);
看下面的几个例子:
String inputStr = "stg换行前\r\n换stg行后";
System.out.println("-----------------");
System.out.println(inputStr);
System.out.println("-----------------");
Matcher matcher = Pattern.compile(".*stg.*").matcher(inputStr);
while(matcher.find()){
System.out.println("start-" + matcher.start());
System.out.println("end-" + matcher.end());
System.out.println("matches-" + matcher.group());
}
匹配结果:
-----------------
stg换行前
换stg行后
-----------------
start-0
end-6
matches-stg换行前
start-8
end-14
matches-换stg行后
如果我们将正则换成"^.*stg.*",则只能匹配到一次:
String inputStr = "stg换行前\r\n换stg行后";
System.out.println("-----------------");
System.out.println(inputStr);
System.out.println("-----------------");
Matcher matcher = Pattern.compile("^.*stg.*").matcher(inputStr);
while(matcher.find()){
System.out.println("start-" + matcher.start());
System.out.println("end-" + matcher.end());
System.out.println("matches-" + matcher.group());
}
匹配结果:
-----------------
stg换行前
换stg行后
-----------------
start-0
end-6
matches-stg换行前
如果将正则换成".*stg.*$",也只能得到一次匹配:
String inputStr = "stg换行前\r\n换stg行后";
System.out.println("-----------------");
System.out.println(inputStr);
System.out.println("-----------------");
Matcher matcher = Pattern.compile(".*stg.*$").matcher(inputStr);
while(matcher.find()){
System.out.println("start-" + matcher.start());
System.out.println("end-" + matcher.end());
System.out.println("matches-" + matcher.group());
}
匹配结果:
-----------------
stg换行前
换stg行后
-----------------
start-8
end-14
matches-换stg行后
如果我们将正则换成:"^.*stg.*$",将得不到任何匹配。因为.(点)匹配不到换行符(.匹配的是除换行符以外的任意字符)。
String inputStr = "stg换行前\r\n换stg行后";
System.out.println("-----------------");
System.out.println(inputStr);
System.out.println("-----------------");
Matcher matcher = Pattern.compile("^.*stg.*$").matcher(inputStr);
while(matcher.find()){
System.out.println("start-" + matcher.start());
System.out.println("end-" + matcher.end());
System.out.println("matches-" + matcher.group());
}
匹配结果:
-----------------
stg换行前
换stg行后
-----------------
如果要让^与$匹配每行的开始与结束,则要将代码改成:Pattern.compile("^.*stg.*$", Pattern.MULTILINE).matcher(inputStr);
String inputStr = "stg换行前\r\n换stg行后";
System.out.println("-----------------");
System.out.println(inputStr);
System.out.println("-----------------");
Matcher matcher = Pattern.compile("^.*stg.*$", Pattern.MULTILINE).matcher(inputStr);
while(matcher.find()){
System.out.println("start-" + matcher.start());
System.out.println("end-" + matcher.end());
System.out.println("matches-" + matcher.group());
}
匹配结果:
-----------------
stg换行前
换stg行后
-----------------
start-0
end-6
matches-stg换行前
start-8
end-14
matches-换stg行后
2、注意eclipse里的换行是 \R ,而不是我们常规使用的 \r 。
例:
(<dubbo:)(reference|service)((.|\R)*?)(com\.ihome\.trust)((.|\R)*?)(/>)
$1$2$3$5$6 version="0.0.1" $8
如果想系统的学习正则表达式,请移步我的 正则表达式从入门到高手 的视频课程:
http://edu.51cto.com/sd/59587
在java中使用正则表达式注意的地方的更多相关文章
- JAVA中的正则表达式--待续
1.关于“\”,在JAVA中的正则表达式中的不同: 在其他语言中"\\"表示为:我想要在正则表达式中插入一个普通的反斜杠: 在Java中“\\”表示为:我想要插入一个正则表达式反斜 ...
- 9.JAVA中的正则表达式
一.JAVA中的正则表达式 1.概念:以某种特定的方式描述字符串 1.Java中正则表达式的规则 ? #{0,1}-?有一个-或者没有 \\ #表示一个" ...
- java中使用正则表达式匹配字符串
在Java中使用正则表达式去匹配相应的字符串: String importFileRole = "(import)\\s*[a-zA-Z0-9_<>.]+\\;";// ...
- (转)Java中使用正则表达式的一个简单例子及常用正则分享
转自:http://www.jb51.net/article/67724.htm 这篇文章主要介绍了Java中使用正则表达式的一个简单例子及常用正则分享,本文用一个验证Email的例子讲解JAVA中如 ...
- 【java 正则表达式】记录所有在java中使用正则表达式的情况
本篇记录在java中邂逅正则表达式的所有美丽瞬间.因为在java和js中正则表达式的语法并不一致. 1.匹配字符串中有出现[2.1开头或者&2.1或者&3.1等的] Pattern m ...
- 译:Java 中的正则表达式性能概述
原文链接:https://www.baeldung.com/java-regex-performance 作者: baeldung 译者:Darren Luo 1. 概述 在本快速教程中,我们将展示模 ...
- java 中使用正则表达式操作字符串
import java.awt.Toolkit; import java.awt.datatransfer.Clipboard; import java.awt.datatransfer.DataFl ...
- java中的正则表达式捕获组与引用的概念
今天群里有个人问,怎样用增则表达式匹配三角形的三边,其实只是要匹配三个数字而已,如 301 402 503 开始认为很简单,我就写了一个 "(([1-9]\\d?)\\s){2}$2&q ...
- Java中书写要注意的地方
Java的命名规则:以字母.下划线(_)或$符号开头,其后跟任意数目的字母.数字.下划线和$符号. 注意: 数字不能作为标识符的开头: 除了下划线与$符号以外,其余的符号不能使用: 不能使用关键字作 ...
随机推荐
- dede模板完全控制攻略
1.使用php代码 @me代表了当前字段的值 {dede:tagname runphp='yes'} @me = "123456";//如果使用了自定义函数 则@me得到的是函数返 ...
- 在windows系统上安装caffe
下载编译 0.确认电脑上有VS2013 0.确认显卡GPU Compute Capability>=3.0 1.安装CUDA7.5 2.下载cuDNN v4,添加到CUDA7.5 3.根据htt ...
- Python--类定义
转自:http://kanwoerzi.iteye.com/blog/1304466 Python笔记——类定义 一.类定义: class <类名>: <语句> 类实例化后,可 ...
- PHP实现动态规划背包问题
有一堆货物,有各种大小和价值不等的多个物品,而你只有固定大小的背包,拿走哪些能保证你的背包带走的价值最多 动态规划就是可以记录前一次递归过程中计算出的最大值,在之后的递归期间使用,以免重复计算. &l ...
- Apache Shiro 手册
(一)Shiro架构介绍 一.什么是Shiro Apache Shiro是一个强大易用的Java安全框架,提供了认证.授权.加密和会话管理等功能: 认证 - 用户身份识别,常被称为用户"登录 ...
- sklearn基础知识-准备阶段
6.标签特征二元化 处理分类变量还有另一种方法,不需要通过OneHotEncoder,我们可以用LabelBinarizer. 这是一个阈值与分类变量组合的方法. In [1]: from sklea ...
- Dynamics CRM 2011 JScript
if (!this.JSON) { this.JSON = {}; } (function () { function f(n) { return n < 10 ? '0' + n : n; } ...
- web.xml文件中配置<mime-mapping>下载文件类型
TOMCAT在默认情况下下载.rar的文件是把文件当作text打开,以至于IE打开RAR文件为乱码,如果遇到这种情况时不必认为是浏览器的问题,大多数浏览器应该不会死皮赖脸地把二进制文件当作文本打开,一 ...
- 会话控制:SESSION,COOKIE
1.http协议: HTTP—超文本传输协议,在TCP协议(长连接.像一个硬件)基础上; 特点:短连接,无状态协议,没法记录本次连接的状态;适用于静态页面的访问,对于后期某些页面是需要浏览器预知客户信 ...
- oracle分析函数 之分组累加求和
select s.slice_date_to ,s.made_id ,sum(s.steup_count)over(partition by s.made_id order by s.slice_da ...