正则表达式基础以及Java中使用正则查找

定义： 正则表达式是一些用来匹配和处理文本的字符串

正则的基础（先大致了解下）

1. 正则表达式的作用

查找特定的信息（搜索）
替换一些文本（替换）

2. 正则基础知识

1. 元字符

. 匹配除换行符（\n）以外的任何单个字符
w 匹配字母、数字、下划线、汉字
s 匹配任意空白字符（包括空格、制表符、换页符等）
d 匹配数字，匹配单词的开始或结束
^ 匹配字符串的开始
$ 匹配字符串的结束

例子：

#匹配abc开头的字符串

^abd

#匹配8位数字的QQ号

^dddddddd$

#匹配以153开头的11位数字手机号

^153dddddddd$

2. 重复限定符

* 重复0次或更多次
+ 重复1次或更多次
? 重复0次或1次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次

#匹配8位数字QQ号

^d{8}$

#匹配153开头11位手机号

^(153)d{8}$

#匹配身份证号第7到14位（出生日期）

^d{7,14}$  

#匹配以a开头的，0个或者多个以b结尾的字符串

^ab*$

3. 分组

#匹配字符串中包含0到多个ab开头

^(ab)*$

4. 条件或

正则用【|】表示或，当满足分支里任何一种条件时，就会匹配成功

#匹配手机号中联通的手机（联通号段130/131/132等）

^(130|131|132)d{8}$

5. 区间

正则提供‘[]’表示区间条件

[0-9] 限定0到9
[a-z] 限定a-z
[165] 限定某些数字

Java中使用正则表达式

这里会说一个例子：在一段txt文档中找出所有的网址

Java与正则

1. 这里有一段100000000（自己数，我也不知道几个0）行的文本，如图

2. 高手写好的匹配url的正则`(https?|ftp|file)://[-A-Za-z0-9+&@#/%?=~_|!:,.;]+[-A-Za-z0-9+&@#/%=~_|]`当然还有n多种方式

3. Java代码献上

正则表达式匹配使用方式

/**

 * 参数1 regex:我们的正则字符串

 * 参数2 就是一大段文本，这里用data表示

 */

private String filterSpecialStr(String regex, String data) {

    //sb存放正则匹配的结果

    StringBuffer sb = new StringBuffer();

    //编译正则字符串

    Pattern p = Pattern.compile(regex);

    //利用正则去匹配

    Matcher matcher = p.matcher(data);

    //如果找到了我们正则里要的东西

    while (matcher.find()) {

        //保存到sb中，"\r\n"表示找到一个放一行，就是换行

        sb.append(matcher.group() + "\r\n");

    }

    return sb.toString();

}

4. 这里增加两个文件的读写

Java读取文本文件

private String readFile(String pathName) {

    //读取到的文件内容放到这个sb里

    StringBuffer sb = new StringBuffer();

    //The Java 7 try-with-resources syntax (Automatic Resource Management) is nice （这种写法是Java7的一种语法，自动管理资源，不理解自行百度）

    try (BufferedReader br = new BufferedReader(new FileReader(pathName))) {

        String line;

        while ((line = br.readLine()) != null) {

            sb.append(line + "\r\n");

        }

        System.out.println("读取文件完成");

    } catch (IOException e) {

        e.printStackTrace();

    }

    return sb.toString();

    }

Java写入文本文件

private void writeFile(String pathName, String data) {

    try {

        //文件不存在的话新建，存在覆盖

        File file = new File(pathName);

        file.createNewFile();

        //The Java 7 try-with-resources syntax (Automatic Resource Management) is nice

        try (BufferedWriter bw = new BufferedWriter(new FileWriter(file))) {

            bw.write(data);

            bw.flush();

            System.out.println("文件写入完成");

        } catch (IOException e) {

            e.printStackTrace();

        }

    } catch (IOException e) {

        e.printStackTrace();

    }

}

5. 执行结果

测试代码

把文档.txt读取到Java中，然后处理完，最后写到我指定的文件中

public static void main(String[] args) {

    //0. 准备好正则

    String regex = "(https?|ftp|file)://[-A-Za-z0-9+&@#/%?=~_|!:,.;]+[-A-Za-z0-9+&@#/%=~_|]";

    //1. 读取文档

    String data = readFile("F:\\test\\文档.txt");

    //2. 正则查找

    String needData = filterSpecialStr(regex, data);

    //3. 写到某个文件中

    writeFile("F:\\test\\needData.txt", needData);

}

结果

备注：这里看到有位大神讲正则的，真好：点我去参观QAQ

Java提取文本文档中的所有网址（小案例介绍正则基础知识）的更多相关文章

Java 写一段字符到指定的文本文档中，如果该文本文档不存在，则创建该文本文档
写一段字符到指定的文本文档中,如果该文本文档不存在,则创建该文本文档 import java.io.File; import java.io.FileNotFoundException; import ...
编写Java程序，读取文本文档的内容，去除文本中包含的“广告”字样，把更改后的内容保存到一个新的文本文档中
查看本章节查看作业目录需求说明: 读取文本文档的内容,去除文本中包含的"广告"字样,把更改后的内容保存到一个新的文本文档中实现思路: 在main() 方法中,使用 new F ...
oracle数据库中将clob字段内容利用java提取出至文本文档中
代码段: 1.执行clob转String public static String ClobToString(Clob sc) throws SQLException, IOException { S ...
文本文档中各字母出现次数汇总（java)
package 字母频率统计; import java.io.*; public class Inputfile { public static void main(String args[]) { ...
Java 单字节、多字节读取文本文档中的内容
文本文档位于工程下. 鼠标右击工程,选择“new - File”,即可创建. 文本文档的格式:GBK 单字节读取 import java.io.File; import java.io.FileInp ...
使用 AWK 去掉文本文档中的空白行
在 Linux 操作系统中,可以使用 AWK 命令高效地处理文本文档.AWK 命令通过执行使用 AWK 语言编写的脚本程序,处理文本文档.AWK 脚本程序是由模式(patterns)与相关操作(cor ...
过滤文本文档中的数据并插入Cassandra数据库
代码如下: package com.locationdataprocess; import java.io.BufferedReader; import java.io.File; import ja ...
python 读取文本文档中的数据
import os dir = input('Please input the file dir:')#提示输入文件路径 while not os.path.exists(dir):#判断文件是否存在 ...
jenkins job构建后汇总结果到同一个文本文档中去
jenkins 构建后,执行下shell脚本,把结果汇总到同一个文件中,这样多个job构建后的结果可以在一个文件中展示 result_all_dir="/app/jenkins_result ...

随机推荐

Python自动化学习--Webdriver中的常用方法
from selenium import webdriver driver = webdriver.Chrome() driver.get("https://www.baidu.com/&q ...
【转】linux lost+found文件夹
lost+found这个目录一般情况下是空的,当系统非法关机后,如果你丢失了一些文件,在这里能找回来用来存放fsck过程中部分修复的文件的如果你运行fsck命令(文件系统检查和修复命令),它也许会 ...
java 类记载器
转载: https://blog.csdn.net/javazejian/article/details/73413292
前端之JavaScript：JS之DOM对象二
继续JS之DOM对象二前面在JS之DOM中我们知道了属性操作,下面我们来了解一下节点操作.很重要!! 一.节点操作创建节点:var ele_a = document.createElement(' ...
VUE+Ionic，项目搭建&打包成APK
安装Vue&创建Vue工程 1.安装Vue CLI: npm install -g vue-cli 2.创建新的Vue项目,创建最后一步会提醒是否使用npm install 自动安装,如果选择 ...
springboot自定义异常数据
一.源码分析自定义异常数据之前我们先看看一下源码上述代码意思是如果你没有提供就使用springboot提供的类这是springboot提供的异常属性类,我们想要自 ...
python+requests接口自动化框架
为什么要做接口自动化框架 1.业务与配置的分离 2.数据与程序的分离:数据的变更不影响程序 3.有日志功能,实现无人值守 4.自动发送测试报告 5.不懂编程的测试人员也可以进行测试正常接口测试的流程 ...
[BZOJ3236][AHOI2013]作业：树套树/莫队+分块
分析第一问随便搞,直接说第二问. 令原数列为$seq$,$pre_i$为$seq_i$这个值上一个出现的位置,于是可以简化询问条件为: $l \leq i \leq r$ \(a \ ...
SpringCloud 教程（二）服务链路追踪(Spring Cloud Sleuth)
一.简介 Add sleuth to the classpath of a Spring Boot application (see below for Maven and Gradle exampl ...
idea生成get/set方法
如图:

Java提取文本文档中的所有网址（小案例介绍正则基础知识）

正则表达式基础以及Java中使用正则查找

正则的基础（先大致了解下）

1. 正则表达式的作用

2. 正则基础知识

1. 元字符

2. 重复限定符

3. 分组

4. 条件或

5. 区间

Java中使用正则表达式

Java与正则

1. 这里有一段100000000（自己数，我也不知道几个0）行的文本，如图

2. 高手写好的匹配url的正则(https?|ftp|file)://[-A-Za-z0-9+&@#/%?=~_|!:,.;]+[-A-Za-z0-9+&@#/%=~_|]当然还有n多种方式

3. Java代码献上

4. 这里增加两个文件的读写

5. 执行结果

备注：这里看到有位大神讲正则的，真好：点我去参观QAQ

Java提取文本文档中的所有网址（小案例介绍正则基础知识）的更多相关文章

随机推荐

热门专题

2. 高手写好的匹配url的正则`(https?|ftp|file)://[-A-Za-z0-9+&@#/%?=~_|!:,.;]+[-A-Za-z0-9+&@#/%=~_|]`当然还有n多种方式