re模块相关
一.正则表达式中的转义:
"\" 表示转义符
[()+*?/$.] 在字符组中一些特殊的字符会现出原形
所有的\w \d \s (\n,\t) \W \D \S 都表示它原本的意义
[-]只要卸载字符组的首位的时候表示普通的减号
python中的转移符
'\n': '\' 赋予这个n一个特殊的意义,表示一个换行符
r:表示取消转义
二.re模块
1.findall: re.findall('正则表达式','字符串')
输出是一个列表里装着正则表达式切出来的一个个字符串
例:
import re
ret = re.findall('\d+','545ds5444dsd545d')
print(ret) =>['', '', '']
2.search: re.search('正则表达式','字符串')
输出的是正则表达式切除来的第一个符合条件的字符串
例:
#通过正则表达式拿第一个符合条件的值
ret1 = re.search('\d+','545dsd99sd545d')
print(ret1.group()) =>545 #通过.group 拿序号里面的值
ret1 = re.search('(\d)(\d)(\d)','545dsd99sd545d')
print(ret1.group()) =>545
print(ret1.group(1)) => 5
print(ret1.group(2)) => 4
print(ret1.group(3))=> 5
3.match: re.match('正则表达式','字符串')
和search类似,都是根据正则表达式返回第一个符合条件的字符串,但match只只针对第一个的数据类型必须和正则表达式相同,如果不容则报错
例:
ret2 = re.match('\d+','545dsd99sd545d')
print(ret2.group()) =>545 ret2 = re.match('\d+','aa545dsd99sd545d')
print(ret2.group())=>AttributeError: 'NoneType' object has no attribute 'group'
4.sub/subn: re.sub('正则表达式','要替换的内容','执行的字符串')
输出的是一个字符串
例:
ret = re.sub('\d+','H','replace789nbc2xcz392zx')
print(ret) => replaceHnbcHxczHzx ret = re.subn('\d+','H','replace789nbc2xcz392zx')
print(ret) => ('replaceHnbcHxczHzx', 3) #subn 会返回替换次数
5.split: re.split('正则表达式','字符串')
输出的是一个列表中装着以正则表达式定义切割的多个字符串
如果正则表达式用括号括起来,则输出的是一个列表中装着所有内容(包括要切掉的)
例:
ret = re.split('\d+','alex83egon20taibai40')
print(ret) =>['alex', 'egon', 'taibai', ''] ret = re.split('(\d+)','alex83egon20taibai40')
print(ret) =>['alex', '', 'egon', '', 'taibai', '', '']
6.compile (会节省时间,适用于爬虫和自动化开发)
只有在多次使用某一个相同的正则表达式的时候,这个compile才会提高程序的效率
例:
re.findall('-0\.\d+|-[1-9]+(\.\d+)?','alex83egon20taibai40')
# --> python解释器能理解的代码 --> 执行代码
ret = re.compile('-0\.\d+|-[1-9]\d+(\.\d+)?')
res = ret.search('alex83egon-20taibai-40')
print(res.group())
7.finditer (会节省内存)
例:
print(re.findall('\d','sjkhkdy982ufejwsh02yu93jfpwcmc'))
ret = re.finditer('\d','sjkhkdy982ufejwsh02yu93jfpwcmc')
for r in ret:
print(r.group())
8.分组命名
例:
ret = re.search("<(?P<name>\w+)>\w+</(?P=name)>","<h1>hello</h1>")
print(ret.group('name'))=>h1 可以分组命名之后按名字拿值
ret = re.search('<(?P<a>\w+)>(?P<b>\w+)</(?P<c>\w+)>','<a>wahaha</b>')
print(ret.group('c')) => b
re模块相关的更多相关文章
- Unity3d 音效模块相关
关于Unity的音效方面,主要关注以下3个类: Audio Clip : audio data,导入到unity中的音频文件都是audio clip. Audio Sources : 挂载这audio ...
- Nginx日志和http模块相关变量
$arg_PARAMETER #HTTP 请求中某个参数的值,如/index.php?site=www.ttlsa.com,可以用$arg_site 取得 www.ttlsa.com 这个值. $ar ...
- MM-采购模块相关业务
采购模块主要业务流程: 1.收集采购需求(采购申请单),系统采购申请单单据可以由需求部门手工产生,也可以由系统的MRP(物料需求计划)来产生. 2,货源确定,用来确定所申请的物料,通过何种方式向供应商 ...
- 【iCore2 模块相关资料】iM_LAN 100M 以太网模块UDP例程
============================== 技术论坛:http://www.eeschool.org 博客地址:http://xiaomagee.cnblogs.com 官方网店:h ...
- nginx反向代理proxy模块相关参数
http_proxy_module Proxy_pass proxy_pass指令属于ngx_http_proxy_module模块,此模块可以将请求转发到另一台服务器:官方说明:http://ngi ...
- 【iCore2 模块相关资料】发布模块DEMO 代码包,目前支持 iM_TFT30、 iM_LAN和 iM_RGB 三个模块
iCore2 模块底板 和部分模块发布了,所以我们做了一个 DEMO 代码包,此代码包现在有以下功能: 1.支持 iM_TFT30 3寸触摸液晶模块(硬件已发布): 2.支持 iM_LAN 100M以 ...
- Python小知识点(4)--模块相关
1.模块: 定义:用来从逻辑上组织python代码(变量,函数,类,逻辑:实现一个功能),本质就是以.py结尾的python文件(文件名:test.py,对应的模块名:test). 包:用来从逻辑上组 ...
- H3C光模块相关命令和检测方法
<Sysname> dis transceiver interface GigabitEthernet 1/0/28 查看 GigabitEthernet1/0/28 transcei ...
- python基本模块相关信息
系统相关的信息模块: import sys sys.argv 是一个 list,包含所有的命令行参数. sys.stdout sys.stdin sys.stderr 分别表示标准输入输出,错误输出的 ...
- ansible操作模块相关
1. 查看模块可用参数命令 ansible-doc -s module_name
随机推荐
- Luogu P3496 [POI2010]GIL-Guilds(贪心+搜索)
P3496 [POI2010]GIL-Guilds 题意 给一张无向图,要求你用黑(\(K\))白(\(S\))灰(\(N\))给点染色,且满足对于任意一个黑点,至少有一个白点和他相邻:对于任意一个白 ...
- Codeigniter 数据库操作事务情况下获取不到last_insert_id()
开发中,数据库Insert使用了事务,如果 $this->db->insert_id() 放在 $this->db->trans_complete(); 这句语句之后,$thi ...
- extern “C”的用法
引言 由于不同的代码互相调用起来很容易出错,甚至同一种代码但由不同的编译器编译,为实现C++代码调用其他C语言代码,会在C语言代码的部分加上extern "C",表明这段代码需要按 ...
- (转载)My97 datepicker使用指南
这里先显示大家都可以看到的My97DatePicker的用法: WdatePicker日历控件使用方法(http://www.cnblogs.com/yuhanzhong/archive/2011/0 ...
- 在三维场景中加载shp(skyline)
在场景中添加shp图层有两个方法: (1)直接调用Command命令,SGWorld.Command.Execute(1013,5);这样的话,和在场景中的工程树中右键添加特征图层的过程是一样的.有个 ...
- 在Linux下使用gcc运行C语言程序
Linux下使用最广泛的C/C++编译器是GCC,大多数的Linux发行版本都默认安装,不管是开发人员还是初学者,一般都将GCC作为Linux下首选的编译工具.本教程毫不犹豫地使用GCC来编译C程序. ...
- IO流17 --- 对象流操作自定义对象 --- 技术搬运工(尚硅谷)
序列化 @Test public void test14() throws IOException { ObjectOutputStream oos = new ObjectOutputStream( ...
- KeyOnlyFilter(2)
主要用来过滤剩下行键计数一类 KeyOnlyFilter 官方API解释如下: A filter that will only return the key component of each KV ...
- Go之路之go语言结构
Go Hello World 实例 package main //定义了包名,必须在源文件中非注释的第一行指名这个文件属于哪个包,每个Go应用程序都包含一个名为main的包 import " ...
- Django项目:CRM(客户关系管理系统)--19--11PerfectCRM实现King_admin分页显示条数
登陆密码设置参考 http://www.cnblogs.com/ujq3/p/8553784.html list_per_page = 2 #分页条数 list_per_page = 2 #分页条数 ...