python3 正则匹配[^abc]和(?!abc)的区别（把多个字符作为一个整体匹配排除）

目的：把数字后面不为abc的字符串找出来

如1ab符合要求，2abc不符合要求

 str = '1ab'

 out = re.match(r'\d+(?!abc)',str)

 str1 = '1abc'

 out1 = re.match(r'\d+(?!abc)',str1)

 print('out:',out)

 print('out1:',out1)

 #

 #out: <_sre.SRE_Match object; span=(0, 1), match='1'>

 #out1: None

 #

如果把(?!abc)改为[^abc]，效果如下：

 str = '1ab'

 out3 = re.match(r'\d+[^abc]',str)

 str1 = '1abc'

 out4 = re.match(r'\d+[^abc]',str1)

 print('out:',out3)

 print('out1:',out4)

 #

 #out3: None

 #out4: None

总结：

(?!abc)是把abc当做一个整体进行匹配，字符串中不存在abc才能成功，abc作为一个整体进行匹配

[^abc]只要字符串中存在a/b/c中的任一个即匹配不成功，字符串中不能出现a/b/c中的任一个

------------------------------------------------------------------

更新：

之前没有注意到(?!abc)方式匹配字符串不消耗字符串内容这句话，导致如果字符串中间排除一个子字符串时会出现错误。

更新关于这部分的理解

(?=...) # 匹配字符串，且紧挨着匹配的字符串之后的字符等于...，才算匹配成功，且不消耗字符串内容

(?!...) # 匹配字符串，且紧挨着匹配的字符串之后的字符不等于...，才算匹配成功，且不消耗字符串内容

(?<=...) # 匹配字符串，且紧挨着匹配的字符串之前的字符等于...，才算匹配成功，且不消耗字符串内容

(?<!...) # 匹配字符串，且紧挨着匹配的字符串之前的字符不等于...，才算匹配成功，且不消耗字符串内容

具体理解：

以(?=...)为例

 reg = re.compile('A(?=BC)')

 reg.search('ABC')

 reg.search('ABCDE')

 # 输出：

 # <_sre.SRE_Match object; span=(0, 1), match='A'>

 # <_sre.SRE_Match object; span=(0, 1), match='A'>

 reg_1 = re.compile('A(?=BC)D')

 print(reg_1.search('ABCD'))

 # 输出

 # None

　reg = re.compile('A(?=BC)')

reg.search('ABC')

　在这种情况下,匹配一个字符,这个字符包含'A',且'A'后面的字符为'BC',字符串'ABCD'符合规律

　但是,

reg_1 = re.compile('A(?=BC)D')

reg_1.search('ABCD')

就会出现问题,因为(?=...)括号内的表达式不消耗字符,也就是说匹配完字符串中的'A'之后,会判断A之后的字符是否是'BC',匹配成功后正则表达式会继续匹配字符串中'A'之后的字符是否是'D'
但是,在字符串中'A'之后是'B'就会出现匹配失败,返回None.
https://blog.csdn.net/lxcnn/article/details/4304651 在这个链接中,解释比较清楚.
在正则匹配过程中,各个子表达式会依次取得控制权,对字符串进行匹配.
比如例子中的

reg_1 = re.compile('A(?=BC)D')

1.'A(?=BC)D' 中,表达式'A'首先取得控制权,从字符串'ABCD'的开始位置('A'之前)进行匹配;

　　匹配成功,控制权交给下一个正则子表达式(?=BC),匹配位置移动到字符串'ABCD'中的'A'之后('B'之前)

2.正则子表达式(?=BC)取得控制权,对当前匹配位置的右侧字符进行匹配,判断是否等于(?=BC)中的'BC'(即'A'后的'BC');

　 匹配成功,控制权交给下一个正则子表达式'D',但是,因为(?=...)表达式不消耗字符,也就是说这个表达式是零宽度的,因此匹配位置不会往后移动.匹配位置依然在'A'之后.
3.正则子表达式'D'取得控制权,对当前位置('A'之后'B'之前)的右侧字符进行匹配,判断'A'之后的字符是否等于'D'.
　　字符串'ABCD'中,'A'之后为'B',匹配失败
4.进行下一轮匹配,又回到表达式'A'取得控制权,开始匹配位置不再是字符串首位置,此时从字符串'ABCD'中的'A'之后'B'之前的位置开始匹配,重复1~3步骤,不断移动匹配位置进匹配

整个正则表达式匹配过程明了了.

不消耗字符串的意思就是这个子表达式为零宽度的,在匹配结束后不会向后移动匹配位置

python3 正则匹配[^abc]和(?!abc)的区别（把多个字符作为一个整体匹配排除）的更多相关文章

正则匹配中 ^ $ 和 \b 的区别
正则匹配中 ^ $ 和 \b 的区别 ^和$分别代表字符串的开始和结束,因此^\d$只能匹配包含一个数字的字符串\b代表单词边界,其前后必须是不同类型的字符,可以组成单词的字符为一种类型,不可 ...
Python3正则匹配re.split，re.finditer及re.findall函数用法详解
这篇文章主要介绍了Python3正则匹配re.split,re.finditer及re.findall函数用法,结合实例形式详细分析了正则匹配re.split,re.finditer及re.finda ...
转转转---js正则表达exec与match的区别说明
正则表达式对象有两个定义方式:: 1.第一种定义: new RegExp(pattern, attributes);如var reg = new RegExp("abc",&quo ...
【转载】python3.0与2.x之间的区别
python3.0与2.x之间的区别: 1.性能 Py3.0运行pystone benchmark的速度比Py2.5慢30%.Guido认为Py3.0有极大的优化空间,在字符串和整形操作上可以取得很好 ...
python3.0与2.x之间的区别
python3.0与2.x之间的区别: 1.性能 Py3.0运行pystone benchmark的速度比Py2.5慢30%.Guido认为Py3.0有极大的优化空间,在字符串和整形操作上可以取得很好 ...
js进阶正则表达式10-分组-多行匹配-正则对象的属性（小括号作用：分组，将小括号里面的东西看成一个整体，因为量词只对前一个字符有效）（多行匹配：m）（属性使用：reg.global）
js进阶正则表达式10-分组-多行匹配-正则对象的属性(小括号作用:分组,将小括号里面的东西看成一个整体,因为量词只对前一个字符有效)(多行匹配:m)(属性使用:reg.global) 一.总结 1. ...
Python3正则去掉HTML标签
Python3正则去掉HTML标签 1.引用一段代码 import re html = '<pre class="line mt-10 q-content" accuse=& ...
servlet匹配路径时/和/*的区别（转）
本文转自https://blog.csdn.net/rongxiang111/article/details/53008829 一.<url-pattern>/</url-patte ...
jquery[siblings]取得一个包含匹配的元素集合中每一个元素的所有唯一同辈元素的元素集合
取得一个包含匹配的元素集合中每一个元素的所有唯一同辈元素的元素集合,用于筛选同辈元素的表达式 $("#pageList").click(function(){ $(this).pa ...

随机推荐

JavaScript杂谈(第六天)
js中可以使用Function创建函数 var func=new Function(); 这个对象可以将字符串转换为函数 var func=new Function("console.wri ...
Spring框架基础解析
Spring是一个轻量级的.非侵入式的容器框架:对Bean对象的生命周期进行管理. Spring框架的核心:IOC(控制反转).DI(依赖注入).AOP(面向切面编程). (1) IOC:控制反转. ...
详解在Linux下实现(彩色)进度条程序，并通过makefile进行编译.
彩色进度条的实现与makefile编译: 创建一个process文件,在里面编写实现进度条的代码 1.在编写代码的时候我们首先要区分两个转义字符:\n \r \n:表示换行,换到下一行,并位于起 ...
flutter Row 垂直或水平放置多个widget
使用行(Row)水平排列widget,使用列(Column)垂直排列widget.在行或列中嵌套行或列实现复杂的布局.如下图所示: 此布局按行排列.该行包含两个子布局,左侧一列和右侧的图片对于行(R ...
spring 普通类注入为null，通过自定义SpringUtils解决
package com.jathams.spring; import org.springframework.beans.BeansException; import org.springframew ...
Flask之安装与HelloWorld
安装Flask 首先我们来安装Flask.最简单的办法就是使用pip. pip install flask 然后打开一个Python文件(app.py),输入下面的内容并运行该文件.然后访问local ...
C# 将DataTable转换成list (--分页--) 【Skip--Take】
将DataTable转换成list 及数据分页: /// <summary> /// 酒店评论列表-分页 /// </summary> /// <param name=& ...
layui：数据表格如何合并单元格
layui.use('table', function () { var table = layui.table; table.render({ elem: '#applyTab' , url: '$ ...
使用OwnCloud搭建自己的云盘
使用OwnCloud搭建自己的云盘 1.用途 ownCloud是一款开源的私有云框架,可以通过它实现个人网盘的功能,ownCloud提供了各个平台的文件同步客户端,因此搭建好ownCloud之后即可使 ...
swoole之代码热更新实现转自https://blog.csdn.net/nep_tune/article/details/81329918
随着swoole的版本迭代更新,已经足够稳定了,在阿里,腾讯,yy等各大公司都有着使用,也有很多游戏圈里的朋友也在使用,这些朋友经常会提到一个问题,每次代码更新还需要停止服务,然后重新启动,来达到更新 ...

python3 正则匹配[^abc]和(?!abc)的区别（把多个字符作为一个整体匹配排除）

python3 正则匹配[^abc]和(?!abc)的区别（把多个字符作为一个整体匹配排除）的更多相关文章

随机推荐

热门专题