前面介绍了常用的字符组,但是在某些文档中,你可能会发现类似[:digit:].[:lower:]之类的字符组,看起来不难理解(digit就是"数字",lower就是"小写"),但又很奇怪,它们就是POSIX字符组(POSIX Character Class).因为某些语言的文档中出现了这些字符组,为避免困惑,这里有必要做个简要介绍.如果只使用常用的编程语言,可以忽略文档中的POSIX字符组,也可以忽略本节:如果想了解POSIX字符组,或者需要在Linux/UNIX下…
1.正则表达式:目的是为了爬虫,是爬虫利器. 正则表达式是用来做字符串匹配的,比如检测是不是电话.是不是email.是不是ip地址之类的 2.JSON:外部数据交流的主流格式. 3.正则表达式的使用 re python 内置的模块,可以进行正则匹配 re.findall(pattern,source)pattern:正则匹配规则-也叫郑泽表达式source:需要查找的目标源 import re a = "C0C++7Java8C#Python6JavaScript" res = re.…
VIM 用正则表达式 批量替换文本,多行删除,复制,移动 在VIM中 用正则表达式 批量替换文本,多行删除,复制,移动 :n1,n2 m n3 移动n1-n2行(包括n1,n2)到n3行之下: :n1,n2 co n3 复制n1-n2行(包括n1,n2)到n3行之下: :n1,n2 d 删除n1-n2行(包括n1,n2)行: vi替换使用规则: :g/s1/s/s2/s3/g 第一个g表示对每一个包括s1的行都进行替换,第二个g表示对每一行包括s1的行所有的s2都用s…