Python正则表达式初识(五)】的更多相关文章

今天分享正则表达式最后一个特殊字符“\d”,具体的教程如下. 1.特殊字符“\d”十分常用,其代表的意思是数字.代码演示如下图所示. 其中“+”的意思是表示连续,在这里代表的意思是连续的数字.但是输出只有“4”这个字符,原因是贪婪模式所致,在上一篇文章中也有提及. 2.如果想要匹配“2004”,则需要加个特殊字符“?”,如下图所示. 此时是非贪婪模式,匹配从前往后进行,且匹配连续的数字,所以得到的输出结果是“2004”. 3.还有一只常见的使用方式是使用大括号来指定匹配数字的长度,如下图所示,指…
前几天给大家分享了Python正则表达式初识(一),介绍了正则表达式中的三个特殊字符“^”.“.”和“*”,感兴趣的伙伴可以戳进去看看,今天小编继续给大家分享Python正则表达式相关特殊字符知识点. 1.特殊字符“$”代表的意思是结尾字符.举个栗子,正则表达式“3$”,表示匹配以3为结尾的字符串.代码演示如下图所示. 正则表达式匹配模式“.*3$”代表以3结尾的任意字符的字符串,很显然匹配的结果和原始字符串是一致的,所以有返回结果.2.如果将正则表达式匹配模式改为“.*4$”,则表示以4结尾的…
正则表达式的内容很丰富,今天小编继续给大家分享Python正则表达式的基础知识.今天要给大家的讲的特殊字符是竖线“|”.竖线“|”实质上是一个或的关系. 1.直接上代码演示,比方说我们需要匹配一个字符串“dcpeng123”,匹配模式为 “(dcpeng|dcpeng123)”,记得匹配模式中要有括号,否则后面的group方法会报错. 如上图所示,匹配模式“(dcpeng|dcpeng123)”的意思是只要匹配“dcpeng”或者“dcpeng123”中的任意一个,就说明提取成功.“|”实质上是…
继续分享Python正则表达式的基础知识,今天给大家分享的特殊字符是[\u4E00-\u9FA5],这个特殊字符最好能够记下来,如果记不得的话通过百度也是可以一下子查到的. 该特殊字符是固定的写法,其代表的意思是汉字.换句话说,只要字符中是汉字,就可以通过该字符进行匹配,该特殊字符也是用中括号括起来的.具体的代码演示如下.1.原始字符串是“加油”,两个汉字,然后将匹配模式直接为[\u4E00-\u9FA5],如下图所 可以看到此时的输出结果仅仅出现了一个“加”字,因为该匹配模式默认是匹配一个字符…
继续分享Python正则表达式的基础知识,今天给大家分享的特殊字符是“\w”和“\W”,具体的教程如下. 1.“\w”代表的意思是该字符为任意字符,但是和特殊字符“.”的意思不同.“\w”代表的字符主要包括26个大写字母A到Z,即[A-Z].26个小写字母a到z,即[a-z].10个阿拉伯数字0到9,即[0-9]和下划线“_”.总结起来就是,“\w”代表的意思是[A-Za-z0-9_]中任意一个字符.“.” 代表的意思是任意字符,其范围比“\w”代表的意思要广. 下面是具体的代码演示,如下图所示…
继续分享Python正则表达式的基础知识,今天给大家分享的特殊字符是“\s”.“\S”,具体的教程如下. 1.“\s”代表的意思是匹配空格,匹配模式“加\s油”代表的是字符“加”和“油”之间有空格的意思,如下图所示. 可以看到原始字符串中“加”和“油”之间有空格,与匹配条件相符合,所以匹配成功. 2.为了加强理解,现在将原始字符串改为“加加油”,字符中间不为空格,保持匹配模式不变,如下图所示. 可以看到无任何输出,说明匹配不成功. 3.如果“加”和“油”之间有多个空格的话,则只需要在匹配模式中将…
继续分享Python正则表达式基础,今天给大家分享的正则表达式特殊符号是“[]”.中括号十分实用,其有特殊含义,其代表的意思是中括号中的字符只要满足其中任意一个就可以.其用法一共有三种,分别对其进行具体的代码演示,在最后进行总结,具体的教程如下. 1.如下图所示,匹配模式为[abcd],在这里正则表达式代表的意思是字符串第一个字符是abcd四个字符中的任意一个,然后后面的字符是“cpeng123”,如果满足匹配条件,则输出结果,如果不满足,则不显示任何结果,如下图所示. 很显然原始字符串的第一个…
今天继续给大家分享Python正则表达式基础知识,主要给大家介绍一下特殊字符“{}”的用法,具体的教程如下. 特殊字符“{}”实质上也是一个限定词的用法,其限定前面字符所出现的次数,其常用的模式有三种,分别是“{数字}”.“{数字,}”和“{数字1, 数字2}”.举个例子,如“{1}”.“{1,}”和“{1, 3}”.到这里可能大家还不是很清楚,下面依次通过实例来演示一下,加深对特殊字符“{}”的理解. 1.如下图所示,限定字符p前面的字符出现1次,则根据贪婪匹配模式,pap成功匹配到. 2.如…
前几天给大家分享了Python正则表达式基础(一)和Python正则表达式基础(二),感兴趣的小伙伴可以点击进去学习,今天继续给大家分享Python正则表达式基础. 1.正则表达式特殊字符“+”,其代表的意思“+”号前面的任意字符必须至少出现一次,才能匹配成功.如下图所示,如果没有加特殊字符“+”,则按照前面介绍的贪婪模式从右边进行匹配,输出的结果为“pp”. 2.现在将匹配模式由之前的“.*(p.*p).*”改为“.*(p.+p).*”,即将特殊字符“*”改为特殊字符“+”,用特殊字符“+”来…
首先跟大家简单唠叨两句为什么要学习正则表达式,为什么在网络爬虫的时候离不开正则表达式.正则表达式在处理字符串的时候扮演着非常重要的角色,在网络爬虫的时候也十分常用,大家可以把它学的简单一些,但是不能不学. 尽管网络爬虫相关库给我们提供了丰富的库如css.bs4.lxml等等,让我们可以通过选择器去匹配字符串,但是在HTML中数据往往存在标签之中.通过选择器确实可以匹配到标签的内容,但是有时候标签中存在的许多内容是冗余的,而我们只需要匹配其中部分内容即可(如匹配数字.时间等),如下图所示.通过选择…