Day6_正则表达式
用作匹配数据的方法:
print(re.findall('\w','yangshuai 123 asd \n \t'))
#w:匹配字母数字下划线
print(re.findall('\W','yangshuai 123 asd | \n \t'))
#W:匹配非字母数字下划线
print(re.findall('\s','yangshuai 123 asd \n \t'))
#s:匹配任意空白字符,等价于[\t\n\r]
print(re.findall('\S','yangshuai 123 asd \n \t'))
#S:匹配任意非空字符
print(re.findall('\d','yangshuai 123 asd \n \t'))
#d:匹配任意数字
print(re.findall('\D','yangshuai 123 asd \n \t'))
#D:匹配任意非数字
print(re.findall('y','yangshuai 123 yasd \n \t'))
#匹配任意单个字符
print(re.findall('^y','yangshuai 123 yasd \n \t'))
#只匹配开头的单个值
print(re.findall('y\Z','yangshuai 123 yasd \n \t'))
#匹配结尾的单个值
# . [] [^]
.: 本身代表任意一个字符
print(re.findall('a.c','a a1c a*c abc a c aaaaac aacc'))
#[]内部可以有多个字符,但是本身只匹配字符中的一个
print(re.findall('a[1 2 3]c','a a1c a*c abc a c aaaaac aacc'))
#匹配+-*/ 的时候最好加上转移符号\ ,例如\+\-\*\/
转义:
print(re.findall(r'a\\c','a a1c a*c abc a\c aaaaac aacc'))
#这里的话如果不加r,匹配一个\需要加入4个\\\\
#如果这里加r,匹配一个\需要加入两个\\
#? * + {}
#? 左边的哪一个字符有0个或者1个
print(re.findall('ab?','a ab abb abbb abbbb bbbb'))
#* 左边的字符有0个或者无穷个
print(re.findall('ab*','a ab abb abbb abbbb bbbb'))
#+左边的哪一个字符有1个或者无穷个
print(re.findall('ab+','a ab abb abbb abbbb bbbb'))
#{n,m}左边的字符有n-m次
print(re.findall('ab{3}','a ab abb abbb abbbb bbbb'))
.* .*?
.* :贪婪匹配
print(re.findall('a.*c','a ab abb abbb abbbb bbbb'))
.*? :非贪婪匹配
print(re.findall('a.*?c','a123c456c'))
| :#当匹配左边不成功的情况下,会匹配右边的情况
print(re.findall('company|companies','sadsdsd fasffa company companies'))
() :分组,只显示()内的内容
print(re.findall('ab+','ababababab123'))
print(re.findall('ab+123','ababababab123'))
print(re.findall('(a)b','ababababab123'))
?: :取得是匹配成功后所有的内容
print('(?:ab)','ababababab123')
#re的其他方法:
findall:找出所有的匹配的值
search:从开头开始匹配,当匹配成功了就不往后继续了。
用法:print(re.search('ab','abababab123').group)
必须加上.group,不加上group的话是一段内存地址。
match: 从头去找,匹配的第一个值不是寻找的内容,然后就直接略过
用法:print(re.match('ab','abababab123').group)
split: 以想要的内容作为切分
用法:print(re.split('b','abcde'))
sub:将匹配到的内容替换为指定的内容
subn:将匹配到的内容替换为指定的内容,替换几次
print(re.sub('alex','SB','alex make love alex alex'))
#将所匹配的内容全部替换
print(re.subn('alex','SB','alex make love alex alex',1))
#将所匹配到的内容替换几次
也可以这样用,按段匹配数据,然后做位置置换。
print(re.sub('(\w+)( .* )(\w+)',r'\3\2\1','alex make love'))
Day6_正则表达式的更多相关文章
- JS正则表达式常用总结
正则表达式的创建 JS正则表达式的创建有两种方式: new RegExp() 和 直接字面量. //使用RegExp对象创建 var regObj = new RegExp("(^\\s+) ...
- Python高手之路【五】python基础之正则表达式
下图列出了Python支持的正则表达式元字符和语法: 字符点:匹配任意一个字符 import re st = 'python' result = re.findall('p.t',st) print( ...
- C# 正则表达式大全
文章导读 正则表达式的本质是使用一系列特殊字符模式,来表示某一类字符串.正则表达式无疑是处理文本最有力的工具,而.NET提供的Regex类实现了验证正则表达式的方法.Regex 类表示不可变(只读)的 ...
- C#基础篇 - 正则表达式入门
1.基本概念 正则表达式(Regular Expression)就是用事先定义好的一些特定字符(元字符)或普通字符.及这些字符的组合,组成一个“规则字符串”,这个“规则字符串”用来判断我们给定的字符串 ...
- JavaScript正则表达式,你真的知道?
一.前言 粗浅的编写正则表达式,是造成性能瓶颈的主要原因.如下: var reg1 = /(A+A+)+B/; var reg2 = /AA+B/; 上述两个正则表达式,匹配效果是一样的,但是,效率就 ...
- Python 正则表达式入门(中级篇)
Python 正则表达式入门(中级篇) 初级篇链接:http://www.cnblogs.com/chuxiuhong/p/5885073.html 上一篇我们说在这一篇里,我们会介绍子表达式,向前向 ...
- 【JS基础】正则表达式
正则表达式的() [] {}有不同的意思. () 是为了提取匹配的字符串.表达式中有几个()就有几个相应的匹配字符串. (\s*)表示连续空格的字符串. []是定义匹配的字符范围.比如 [a-zA-Z ...
- JavaScript 正则表达式语法
定义 JavaScript定义正则表达式有两种方法. 1.RegExp构造函数 var pattern = new RegExp("[bc]at","i"); ...
- [jquery]jquery正则表达式验证(手机号、身份证号、中文名称)
数字判断方法:isNaN()函数 test()方法 判断字符串中是否匹配到正则表达式内容,返回的是boolean值 ( true / false ) // 验证中文名称 function isChin ...
随机推荐
- Swift中实现Observable机制
猴子原创,欢迎转载.转载请注明: 转载自Cocos2Der-CSDN,谢谢! 原文地址: http://blog.csdn.net/cocos2der/article/details/51917539 ...
- 编译Android 4.4.2源码
在之前的文章中,和大家分享了在天朝下下载android 4.4.2源码的过程(详见下载android4.4.2源码全过程(附已下载的源码)),现在写下编译的笔记. 虽然在android doc中,有提 ...
- Java-IO之FileDescriptor
FileDescriptor是文件描述符,可以被用来表示开放文件,开放套接字等,FileDescriptor可以被看成某个文件,但无法对该文件进行操作,需要新创建FileDescriptor对应的Fi ...
- 怎样写一个与Windows10 IE11兼容的标准BHO?
p.MsoNormal,li.MsoNormal,div.MsoNormal { margin: 0cm; margin-bottom: .0001pt; text-align: justify; f ...
- Mysql中limit的用法详解
Mysql中limit的用法详解 在我们使用查询语句的时候,经常要返回前几条或者中间某几行数据,为我们提供了limit这样一个功能. SELECT * FROM table LIMIT [offset ...
- NSData 与 struct 以及XML的转换。
在做OC与C++ 混编的时候,我们可能会用到struct 与NSData的相互转换.在这里做一个记录 1.struct转换为NSData 例如如下的struct: struct tagPackageH ...
- Leetcode_27_Remove Element
本文是在学习中的总结,欢迎转载但请注明出处:http://blog.csdn.net/pistolove/article/details/41577997 Remove Element Given a ...
- LCS问题(最长公共子序列)-动态规划实现
问题描述: 问题] 求两字符序列的最长公共字符子序列 注意: 并不要求子串(字符串一)的字符必须连续出现在字符串二中. 思路分析: 最优子结构和重叠子问题的性质都具有,所以要采取动态规划的算法 最长公 ...
- 跨平台移动APP开发进阶(四)AngularJS简介
AngularJS 是一个为动态WEB应用设计的结构框架.它能让你使用HTML作为模板语言,通过扩展HTML的语法,让你能更清楚.简洁地构建你的应用组件. 它的创新点在于,利用 数据绑定 和 依赖注入 ...
- 【一天一道LeetCode】#59. Spiral Matrix II
一天一道LeetCode系列 (一)题目 Given an integer n, generate a square matrix filled with elements from 1 to n2 ...