正则表达式

正则表达式的概念

正则表达式(Regular Expression ,在代码中常简写为regex)

正则表达式是一个字符串,使用单个字符串来描述、用来定义匹配规则,匹配一系列符合某个句法规则的字符串。在开发中,正则表达式通常被用来检索、替换那些符合某个规则的文本


正则表达式的匹配规则

参照帮助文档,在Pattern类中有正则表达式的的规则定义,正则表达式中明确区分大小写字母。我们来学习语法规则

正则表达式的语法规则


  • 字符: x
  • 含义: 代表的是字符x
  • 例如: 匹配规则为"a",那么需要匹配的字符串内容就是"a"

  • 字符: \\
  • 含义: 代表的是反斜线字符'\'
  • 例如: 匹配规则为"\\",那么需要匹配的字符串内容就是“\”

  • 字符: \t
  • 含义: 制表符
  • 例如: 匹配规则为"\t",那么对应的效果就是产生一个制表符的空间

  • 字符:\n
  • 含义:换行符
  • 例如:匹配规则为"\n",那么对应的效果就是换行,光标在原有位置的下一行

  • 字符:\r
  • 含义:回车符
  • 例如:匹配规则为"\r" ,那么对应的效果就是回车后的效果,光标来到下一行行首

  • 字符类:[abc]
  • 含义:代表的是字符a、b 或 c
  • 例如:匹配规则为"[abc]" ,那么需要匹配的内容就是字符a,或者字符b,或字符c的一个

  • 字符类:[^abc]
  • 含义:代表的是除了 a、b 或 c以外的任何字符
  • 例如:匹配规则为"[^abc]",那么需要匹配的内容就是不是字符a,或者不是字符b,或不是字符c的任意一个字符

  • 字符类:[a-zA-Z]
  • 含义:代表的是a 到 z 或 A 到 Z,两头的字母包括在内
  • 例如:匹配规则为"[a-zA-Z]",那么需要匹配的是一个大写或者小写字母

  • 字符类:[0-9]
  • 含义:代表的是 0到9数字,两头的数字包括在内
  • 例如:匹配规则为"[0-9]",那么需要匹配的是一个数字

  • 字符类:[a-zA-Z_0-9]
  • 含义:代表的字母或者数字或者下划线(即单词字符)
  • 例如:匹配规则为" [a-zA-Z_0-9] ",那么需要匹配的是一个字母或者是一个数字或一个下滑线

  • 预定义字符类:.
  • 含义:代表的是任何字符
  • 例如:匹配规则为" . ",那么需要匹配的是一个任意字符。如果,就想使用 . 的话,使用匹配规则"\."来实现

  • 预定义字符类:\d
  • 含义:代表的是 0到9数字,两头的数字包括在内,相当于[0-9]
  • 例如:匹配规则为"\d ",那么需要匹配的是一个数字

  • 预定义字符类:\w
  • 含义:代表的字母或者数字或者下划线(即单词字符),相当于[a-zA-Z_0-9]
  • 例如:匹配规则为"\w ",,那么需要匹配的是一个字母或者是一个数字或一个下滑线

  • 边界匹配器:^
  • 含义:代表的是行的开头
  • 例如:匹配规则为[1][0-9]$ ,那么需要匹配的内容从[abc]这个位置开始, 相当于左双引号

  • 边界匹配器:$
  • 含义:代表的是行的结尾
  • 例如:匹配规则为[2][0-9]$ ,那么需要匹配的内容以[0-9]这个结束, 相当于右双引号

  • 边界匹配器:\b
  • 含义:代表的是单词边界
  • 例如:匹配规则为"\b[abc]\b" ,那么代表的是字母a或b或c的左右两边需要的是非单词字符([a-zA-Z_0-9])

  • 数量词:X?
  • 含义:代表的是X出现一次或一次也没有
  • 例如:匹配规则为"a?",那么需要匹配的内容是一个字符a,或者一个a都没有

  • 数量词:X*
  • 含义:代表的是X出现零次或多次
  • 例如:匹配规则为"a*" ,那么需要匹配的内容是多个字符a,或者一个a都没有

  • 数量词:X+
  • 含义:代表的是X出现一次或多次
  • 例如:匹配规则为"a+",那么需要匹配的内容是多个字符a,或者一个a

  • 数量词:X{n}
  • 含义:代表的是X出现恰好 n 次
  • 例如:匹配规则为"a{5}",那么需要匹配的内容是5个字符a

  • 数量词:X{n,}
  • 含义:代表的是X出现至少 n 次
  • 例如:匹配规则为"a{5, }",那么需要匹配的内容是最少有5个字符a

  • 数量词:X{n,m}
  • 含义:代表的是X出现至少 n 次,但是不超过 m 次
  • 例如:匹配规则为"a{5,8}",那么需要匹配的内容是有5个字符a 到 8个字符a之间

正则表达式规则匹配练习

请写出满足如下匹配规则的字符串:

    规则:"[0-9]{6,12}"
该规则需要匹配的内容是:长度为6位到12位的数字。
如:使用数据"123456789"进行匹配结果为true;
使用数据"12345"进行匹配结果为false。 规则:"1[34578][0-9]{9}"
该规则需要匹配的内容是:11位的手机号码,第1位为1,第2位为3、4、5、7、8中的一个,后面9位为
0到9之间的任意数字。
如:使用数据"12345678901"进行匹配结果为false;
使用数据"13312345678"进行匹配结果为true。 规则:"a*b"
该规则需要匹配的内容是:在多个a或零个a后面有个b;b必须为最后一个字符。
如:使用数据"aaaaab"进行匹配结果为true;
使用数据"abc"进行匹配结果为false

字符串类中涉及正则表达式的常用方法

  • public boolean matches(String regex) //判断字符串是否匹配给定的规则
    举例:校验qq号码.
1: 要求必须是5-15位数字
2: 0不能开头
代码演示:
String qq = "604154942";
String regex = "[1-9][0-9]{4,14}";
boolean flag2 = qq.matches(regex); 举例:校验手机号码
1:要求为11位数字
2:第1位为1,第2位为3、4、5、7、8中的一个,后面9位为0到9之间的任意数字。
代码演示:
String phone = "18800022116";
String regex = "1[34578][0-9]{9}";
boolean flag = phone.matches(regex);
  • public String[] split(String regex) //根据给定正则表达式的匹配规则,拆分此字符串
    举例:分割出字符串中的的数字
代码演示:
String s = "18-22-40-65";
String regex = "-";
String[] result = s.split(regex);
代码演示:
String s = "18 22 40 65";
String regex = " ";
String[] result = s.split(regex);
  • public String replaceAll(String regex,String replacement) //将符合规则的字符串内容,全部替换为新字符串
    举例:把文字中的数字替换成*
代码演示:
String s = "Hello12345World6789012";
String regex = "[0-9]";
String result = s.replaceAll(regex, "*");

正则表达式练习

  • 匹配正确的数字
    匹配规则:
匹配正整数:”\\d+”
匹配正小数:”\\d+\\.\\d+”
匹配负整数:”-\\d+”
匹配负小数:”-\\d+\\.\\d+”
匹配保留两位小数的正数:”\\d+\\.\\d{2}”
匹配保留1-3位小数的正数:”\\d+\\.\\d{1,3}”
  • 匹配合法的邮箱
    匹配规则:
”[a-zA-Z_0-9]+@[a-zA-Z_0-9]+(\\.[a-zA-Z_0-9]+)+”
”\\w+@\\w+(\\.\\w+)+”
  • 获取IP地址(192.168.1.100)中的每段数字
    ”\\.”

Date

Date类的概述

类 Date 表示特定的瞬间,精确到毫秒。 继续查阅Date类的描述,发现Date拥有多个构造函数,只是部分已经过时,但是其中有未过时的构造函数可以把毫秒值转成日期对象

    //创建日期对象,把当前的毫秒值转成日期对象
Date date = new Date(1607616000000L);
System.out.println(date);
//打印结果:Fri Dec 11 00:00:00 CST 2020

可是将毫秒值转成日期后,输出的格式不利于我们阅读,继续查阅API,Date中有getYear、getMouth等方法,可以他们已经过时,继续往下查阅,看到了toString方法

点开toString()方法查阅,原来上面打印的date对象就是默认调用了这个toString方法,并且在这个方法下面还有让我们参见toLocaleString方法,点进去,这个方法又过时了,从 JDK 1.1 开始,由 DateFormat.format(Date date) 取代。 既然这个方法被DateFormat.format(Date date) 取代,那么就要去查阅DateFormat类

Date类常用方法

  • 把日期对象转换成对应的时间毫秒值

DateFormat

DateFormat 类概述

DateFormat 是日期/时间格式化子类的抽象类,它以与语言无关的方式格式化并解析日期或时间。日期/时间格式化子类(如 SimpleDateFormat类)允许进行格式化(也就是日期 -> 文本)、解析(文本-> 日期)和标准化

我们通过这个类可以帮我们完成日期和文本之间的转换

继续阅读API,DateFormat 可帮助进行格式化并解析任何语言环境的日期。对于月、星期,甚至日历格式(阴历和阳历),其代码可完全与语言环境的约定无关

日期格式

要格式化一个当前语言环境下的日期也就是日期 -> 文本),要通过下面的方法来完成。DateFormat是抽象类,我们需要使用其子类SimpleDateFormat来创建对象

  • 构造方法

  • DateFormat类方法

    代码演示:
//创建日期格式化对象,在获取格式化对象时可以指定风格
DateFormat df= new SimpleDateFormat("yyyy-MM-dd");//对日期进行格式化
Date date = new Date(1607616000000L);
String str_time = df.format(date);
System.out.println(str_time);//2020年12月11日
  • ateFormat类的作用:即可以将一个Date对象转换为一个符合指定格式的字符串,也可以将一个符合指定格式的字符串转为一个Date对象

  • 指定格式的具体规则我们可参照SimpleDateFormat类的说明,这里做简单介绍,规则是在一个字符串中,会将以下字母替换成对应时间组成部分,剩余内容原样输出

  • 当出现y时,会将y替换成年

  • 当出现M时,会将M替换成月

  • 当出现d时,会将d替换成日

  • 当出现H时,会将H替换成时

  • 当出现m时,会将m替换成分

  • 当出现s时,会将s替换成秒


DateFormat类常用方法

  • format方法,用来将Date对象转换成String
  • parse方法,用来将String转换成Date(转换时,该String要符合指定格式,否则不能转换)。
    代码演示:
练习一:把Date对象转换成String
Date date = new Date(1607616000000L);//Fri Dec 11 00:00:00 CST 2020
DateFormat df = new SimpleDateFormat(“yyyy年MM月dd日”);
String str = df.format(date);
//str中的内容为2020年12月11日 练习二:把String转换成Date对象
String str = ”2020年12月11日”;
DateFormat df = new SimpleDateFormat(“yyyy年MM月dd日”);
Date date = df.parse( str );
//Date对象中的内容为Fri Dec 11 00:00:00 CST 2020

Calendar

Calendar类概念

Calendar是日历类,在Date后出现,替换掉了许多Date的方法。该类将所有可能用到的时间信息封装为静态成员变量,方便获取

Calendar为抽象类,由于语言敏感性,Calendar类在创建对象时并非直接创建,而是通过静态方法创建,将语言敏感内容处理好,再返回子类对象

  • Calendar 类静态方法

  • Calendar c = Calendar.getInstance(); //返回当前时间

Calendar 类常用方法

  • public static Calendar getInstance() //获取日期对象

  • public int get(int field) //获取时间字段值,字段参见帮助文档

    • YEAR 年
    • MONTH月,从0开始算起,最大11; 0代表1月,11代表12月
    • DATE 天
    • HOUR 时
    • MINUTE 分
    • SECOND 秒
        代码演示:
    Calendar c = Calendar.getInstance();
    int year = c.get(Calendar.YEAR);
  • public void add(int field , int amount) // 指定字段增加某值

    代码演示:
Calendar c = Calendar.getInstance();
//修改当前时间为3天后
c.add(Calendar.DATE, 3);
//修改当前时间为5小时后
c.add(Calendar.HOUR, 5);
  • public final void set(int field,int value)//设置指定字段的值
    代码演示:
Calendar c = Calendar.getInstance();
//设置时间为2020年5月20日
c.set(Calendar.YEAR, 2020);
c.set(Calendar.MONTH, 4);
c.set(Calendar.DATE, 20);
  • public final Date getTime() //获取该日历对象转成的日期对象
    代码演示:
Calendar c = Calendar.getInstance();
Date d = c.getTime();

注意

西方星期的开始为周日,中国为周一。 在Calendar类中,月份的表示是以0-11代表1-12月。 日期是有大小关系的,时间靠后,时间越大


日期相关类练习

  • 求出自己已经出生多少天

    • 思路:

      • 1.获取当前时间对应的天数
      • 2.获取自己出生日期对应的天数
      • 3.两个时间相减(当前时间天数 – 出生日期天数)
          public static void main(String[] args){
      Calendar c = Calendar.getInstance();
      c.set(2017, 6, 31);// 2017 - 7 - 31
      long i1 = c.getTimeInMillis();
      System.out.println(i1); Calendar c2 = Calendar.getInstance();
      long i2 = c2.getTimeInMillis(); System.out.println((i2-i1)*1.0/(1000*60*60*24));
      }
  • 求出今天距离2020年1月1日还有多少天

    • 思路

      • 1.获取当前时间对应的天数
      • 2.获取2020年1月1日对应的天数
      • 3.两个时间相减(2020年1月1日的天数 –当前时间天数)
          public static void main(String[] args){
      Calendar c = Calendar.getInstance();
      c.set(2017, 6, 31);// 2017 - 7 - 31
      long i1 = c.getTimeInMillis();
      System.out.println(i1); Calendar c2 = Calendar.getInstance();
      long i2 = c2.getTimeInMillis(); System.out.println((i2-i1)*1.0/(1000*60*60*24));
      }

总结

  • 正则表达式:用来定义匹配规则,匹配一系列符合某个句法规则的字符串。

  • 正则表达式的匹配规则 请参见1.2 正则表达式的匹配规则 正则表达式的常用方法:

    • public boolean matches(String regex) //判断字符串是否匹配给定的规则
    • public String[] split(String regex) //根据给定正则表达式的匹配规则,拆分此字符串
    • public String replaceAll(String regex,String replacement) //将符合规则的字符串内容,全部替换为新字符串
  • Date: 日期/时间类

构造方法:

  • Date()// 系统当前日期时间
  • public Date(long date) 得到一个1970年1月1日 0点这个时间基础上,加上参数date 毫秒值对应的日期时间
    • 方法:

      • public long getTime() 获取日期所对应的毫秒值
  • DateFormat:是日期/时间格式化子类的抽象类, 使用其子类SimpleDateFormat 实例化

    • 构造方法:

      • public SimpleDateFormat() 默认的格式化操作
      • public SimpleDateFormat(String pattern) 按照指定的格式,进行日期格式化
        • 日期和时间模式
        • y 年
        • M 年中的月份
        • d 月份中的天数
        • H 一天中的小时数(0-23)
        • m 小时中的分钟数
        • s 分钟中的秒数
        • S 毫秒数
    • 方法:
      • public final String format(Date date) 把日期 格式化成字符串
      • public Date parse(String source) 把日期字符串 转换成 日期对象
  • Calendar:日历类,可获取日期中指定字段的值

    • 方法:

      • public static Calendar getInstance() //获取日期对象
      • public int get(int field) //获取时间字段值
      • public void add(int field,int amount) //指定字段增加某值
      • public final void set(int field,int value)//设置指定字段的值
      • public final Date getTime() //获取该日历对象转成的日期对象

常用API2 正则表达式的更多相关文章

  1. 常用JS正则表达式

    常用JS正则表达式 收集一些常用的JavaScript正则表达式匹配规则,比如匹配电话号码.Email.中文字符.身份证号.邮编.QQ号.过滤空白行.匹配特定数字等.觉得这玩意是很有用的,只不过自己水 ...

  2. PHP常用验证正则表达式

    PHP常用验证正则表达式 数字.手机号.QQ号.Url地址合法性校验 1.验证是否为整数 1 function isNumber($val) 2 { 3 if(ereg("^[0-9]+$& ...

  3. 常用的正则表达式归纳—JavaScript正则表达式

    来源:http://www.ido321.com/856.html 1.正则优先级 首先看一下正则表达式的优先级,下表从最高优先级到最低优先级列出各种正则表达式操作符的优先权顺序: 2.常用的正则表达 ...

  4. C#开发学习——常用的正则表达式

    对于想学习正则表达式的童鞋,一些基础的语法啥的,可以参考 http://www.cnblogs.com/China3S/archive/2013/11/30/3451971.html 下边是一些我们常 ...

  5. Java中常用的正则表达式

    常用的正则表达式 匹配中文字符的正则表达式: [\u4e00-\u9fa5] 匹配双字节字符(包括汉字在内):[^\x00-\xff] 匹配空行的正则表达式:\n[\s| ]*\r 匹配HTML标记的 ...

  6. 常用js正则表达式大全

    常用js正则表达式大全.一.校验数字的js正则表达式 1 数字:^[0-9]*$ 2 n位的数字:^\d{n}$ 3 至少n位的数字:^\d{n,}$ 4 m-n位的数字:^\d{m,n}$ 5 零和 ...

  7. php中常用的正则表达式函数

    php中常用的正则表达式函数 * preg_match() * preg_match_all() * preg_replace() * preg_filter() * preg_grep() * pr ...

  8. input pattern中常用的正则表达式

    常用的正则表达式 pattern的用法,只是列出来一些常用的正则: 信用卡 [0-9]{13,16} 银联卡 ^62[0-5]\d{13,16}$ Visa: ^4[0-9]{12}(?:[0-9]{ ...

  9. [ActionScript 3.0] 常用的正则表达式

    as 3.0常用的正则表达式: /* * 去除字符串前面的空格和跳格符 */ var src:String=" Hello! "; trace(src); //原文本 trace( ...

随机推荐

  1. Matplotlib-多图合并显示

    Subplot 多合一显示 均匀图中图 不均匀图中图 # 均匀图中图 # matplotlib 是可以组合许多的小图, 放在一张大图里面显示的. 使用到的方法叫作 subplot. # 使用impor ...

  2. card布局解决复杂操作的布局问题

    一直不是很待见直接使用card布局,直到对于一些稍微复杂点的业务, 通过border布局和弹窗体的方式解决特别费劲之后,才想起了card布局, 发现card布局真是一个很好的解决办法. 那个使用起来很 ...

  3. c# WinForm 文本输入对话框

    这种功能为什么不向MessageBox一样自带,还得自己写~~ 代码: public InputBox(string label) { InitializeComponent(); label1.Te ...

  4. centos下删除MYSQL 和重新安装MYSQL

    centos下彻底删除MYSQL 和重新安装MYSQL 因centos系统自带的mysql版本比较低5.1,所以想卸载重新安装较新版本,下面是过程 1 删除Mysql yum remove mysql ...

  5. c# linq 汇总

    例子:List<string> list = new List<string>(); list.Add("1 a");list.Add("2 b& ...

  6. 用Nginx+Lua+Redis给百度鹰眼API服务搭建缓存服务中间件(记录过程)

    一.环境安装部分 Centos7,Nginx1.14,Redis5.0,luajit-2.1,ngx_devel_kit-0.3.1rc1,lua-nginx-module-0.10.14. 下载安装 ...

  7. 吴裕雄 python 机器学习——线性回归模型

    import numpy as np from sklearn import datasets,linear_model from sklearn.model_selection import tra ...

  8. PYTHON基础-入门

    变量名可以是数字,字母,下划线,字母不能开头.

  9. 关于ASP.NET 服务器报错 Server Error in '/' Application Runtime Error 错误及解决方法

    今天遇到一个错误 程序在服务器上运行时报错 先贴上错误代码 自己也在网上找了一些解决方法,把错误定位到服务器的配置文件也就是Web.config的问题, 于是在system.web节点下 加上cust ...

  10. Java框架spring 学习笔记(十):bean管理(注解和配置文件混合使用)

    配置文件和注解混合使用 创建对象操作使用配置文件方式实现 注入属性的操作使用注解方式实现 编写BookDao.java和OrderDao.java文件 BookDao.java package com ...