正则表达式提取String子串
最近遇到了一个字符串处理的功能,忽然发现了正则表达式的强大,深深的被她的迷人魅力所吸引,以前只是听说,今天亲眼所见,亲身经历,真的彻底折服。
言归正传:java中String类里面封装了很多字符串处理的方法,替换、查找、包含等,但是我今天遇到了一个功能竟然没有封装,就是查找出字符串内所有匹配正则表达式的字符串数组,(源字符串“2012-08-12 水电费 2012-12 abcde 2012-08-23”,正则表达式:“\\d{4}[ /-]{1}\\d{2}([ /-]{1}\\d{2})?”,我所需要的就是{“2012-08-12”,“2012-12”,“2012-08-23”}),这该怎么实现呢?
为了实现我的目的,我也煞费周折啊。认真研究了Pattern和Matcher两个类,幸好是,要不然我也就体会不到这种柳暗花明的感觉了,也感受不到正则的魅力了。其实String自身携带的方法已够应付绝大多数的应用了,Pattern中的方法基本在String中都有体现,即单独使用Pattern的时候相对就少了一点,Matcher也就使用了find() 和group()就可以实现我上面提出的功能了。
具体实现:
String str="2012-08-12 2012-12 abcde 2012-08-23 ";
String regex = "\\d{4}[ /-]{1}\\d{2}([ /-]{1}\\d{2})?"; //正则表达式
Pattern pattern = Pattern.compile(regex);
Matcher m = pattern.matcher(str);
List<String> matchRegexList = new ArrayList<String>();
while(m.find()){
matchRegexList.add(m.group());
}
下面是整个字符串通过正则表达式进行拆分后(包含拆分符,String.split()返回的不包含正则表达式的值,要不然我也不用费那么大劲了)的数组:
String str="2012-08-12 2012-12 abcde 2012-08-23 ";
String regex = "\\d{4}[ /-]{1}\\d{2}([ /-]{1}\\d{2})?"; //正则表达式
Pattern pattern = Pattern.compile(regex);
Matcher m = pattern.matcher(str);
List<String> matchRegexList = new ArrayList<String>();
while(m.find()){
matchRegexList.add(m.group());
}
System.out.println(m.groupCount());
String[] result = pattern.split(str); //使用正则表达式,分割字符串
List<String> allSplitList = new ArrayList<String>();
int len = matchRegexList.size() > result.length ? matchRegexList.size():result.length;
for(int i=0; i<len; i++){
if(i<result.length){
allSplitList.add(result[i]);
}
if(i<matchRegexList.size()){
allSplitList.add(matchRegexList.get(i));
}
}
for (int i = 0; i < allSplitList.size(); i++) { //获取源字符串中匹配正则表达的字符串
System.out.println("-"+allSplitList.get(i)+"-");
}
正则表达式提取String子串的更多相关文章
- Java正则表达式提取String字符串中的IP地址
/** * 正则提前字符串中的IP地址 * @param ipString * @return */ public static List<String> getIps(String ip ...
- 正则表达式提取string 中的表名
简单版本: Regex reg = new Regex(@"(?i)\bfrom\b(?![^\[\]]*\])\s+(\[[^\[\]]+\]|\S+)"); MatchColl ...
- asp.net正则表达式提取网页网址、标题、图片实例以及过滤所有HTML标签实例
无论你用什么语言,正则表达式的处理方法都是非常灵活.高效的,尤其是对某些字符串的抓取.过滤方面,更显其优势. 正则表达式的写法通常比较简单,几行短代码便能轻松完成看似很复杂的事情,更值得称赞的是,它的 ...
- c# 使用正则表达式 提取章节小说正文全本篇
这一节主要内容是使用正则表达式提取网站的正文,主要面向于小说章节网站.其中涉及到一些其他知识点,比如异步读取.异步流写入等,代码中都会有详细的注解.现在流行的网络文学都是每日一更或几更,没有一个统一的 ...
- java 正则表达式提取html纯文本
本文来自我的个人博客: java 正则表达式提取html纯文本 做内容的大家都知道,从html中直接提取纯文本是一个非常大的问题.现将我做的正则匹配贴上: import java.util.regex ...
- java正则表达式提取地址中的ip和端口号
由于我需要用到java正则表达式提取地址中的ip和端口号,所以我就写了一个demo,测试一下,下面是demo public class Test0810_1 { public static void ...
- regular expression (如何用Sed和正则表达式提取子字符串)
echo "mv u3_yunying.war u3_yunying.war_`date +%Y%m%d%H%M`" | sed "s/\(mv\) \(\w*.wa ...
- Qt正则表达式提取数据
这几天在上嵌入式课程设计,需要用到Qt,这个是信号与槽的,寒假的时候也简单学习了一些,但是没有怎么深入,又回过来看了看Qt,发现Qt的ui界面配置与Android的好像,当然Qt也可以拿来开发Andr ...
- JS支持正则表达式的 String 对象的方法
注意:本文中所有方法的 RegExp 类型的参数,其实都支持传入 String 类型的参数,JS会直接进行字符串匹配. (相当于用一个简单的非全局正则表达式进行匹配,但字符串并没有转换成 RegExp ...
随机推荐
- Ubuntu下的软件一般安装在哪个文件夹里
一般安装在/usr下,里面很多文件夹,根据文件的类型,分门别类,不是一个软件一个文件夹.以前老版本的Linux习惯放在/usr/local目录下. 部分软件放在/opt下,则是一个软件统一在一个文件夹 ...
- Centos: Screen tips
Install yum install screen Useful screen commands List a particular users screen sessions: screen -l ...
- 基于Linux下的UDP编程
一. Linux下UDP编程框架 使用UDP进行程序设计可以分为客户端和服务器端两部分. 1.服务器端程序包括: Ø 建立套接字 Ø 将套接字地址结构进行绑定 Ø 读写数据 Ø 关闭套接字 2 ...
- SQL 为SQL Server服务指定的凭据无效怎么办
如下所示,在安装SQL Server2008的时候,我随便输入了了账户名和密码,点击下一步没用 正确做法是:点击账户名右边的小三角,从下拉列表随便选一个("对所有SQL Server服务 ...
- [C++]_[获取Utf8字符串的字符个数和子字符串]
场景: 1.有时候须要统计utf8字符串的个数,单纯统计字节个数是不行的. 2.有时候也须要获取从某个位置開始的n个连续字符用于显示或计算. static int GetUtf8LetterNumbe ...
- Android-spinner
Android-spinner 一 Adapter概念 spinner:下拉栏里面的TextView 指定系统spinner:在xml文件中面的spinner中的属性android:entries=& ...
- 第十四周(OOP版电子词典)
/* *copyright(c) 2015,烟台大学计算机学院 *All rights reserved. *文件名:第十四周(OOP版电子词典) *作者:王忠 *完毕日期:2015.6.10 *版本 ...
- Consider using EXISTS instead of IN
redgate给出的提示 https://documentation.red-gate.com/codeanalysis/performance-rules/pe019 In theory, EXIS ...
- highcharts注意事项
var json = [ {"id":"1","tagName":"apple"}, {"id":& ...
- B1090 [SCOI2003]字符串折叠 区间dp
又一道区间dp,和上一篇类似,但是比他简单,这个只有两种转移方法,不是很复杂.直接判断是否为重复的串就行. 题干: Description 折叠的定义如下: . 一个字符串可以看成它自身的折叠.记作S ...