python语法_模块_re(正则表达)
字符串操作方法有:
s = 'hello word'
s.find('l') 查询第一个l的索引
s.replace('ll','xx') 替换
s.split('w') 以w进行分割
这些都是完全匹配,要进入模糊匹配就需要引进正则表达式
正则表达式,主要作为字符串模糊匹配的作用
正则 元字符
. 点 ret = re.findall('w.r','hello world') . 点除了换行符以外,可以代指任何字符,一个点代表一个字符,点叫做通配符
尖角符^ ret = re.findall('^w.r','hello world') 从字符串的开头开始匹配,只从字符串开头开始匹配
$ 符 ret = re.findall('w.r$','hello world') 只在字符串最后位置进行匹配,
* 重复匹配 ret = re.findall('wr*'hello world') 重复匹配 优先匹配*前第一个字符
+重复匹配 ret = re.findall('ab+','hello b word') 重复匹配,至少要一个b
? 重复匹配 ret = re.findall('a?b','aaaaaabsdsdabsdfsb') 重复0-1次a
{}重复匹配 ret = re.findeall('a{5}b','aaaaab') 重复匹配指定次数a,ret = re.findeall('a{1,3}b','aaasdasdn') 指定按区间匹配
[] 字符集 ret = re.findall('[a,b]','asdbasd'] 匹配a,或者b都可以。或的关系
[] 字符集 ret = re.findall('[a,*]),'as*') 取消元子符的特殊作用,这里*已经不是元子符了,就是作为*这个字符。这三个字符例外(\ ^ -)
ret = re.findall('[1-9]','asd1231') 1-9的意思
ret = re.findall([^t],'tasdasd') 取反,除t以外的所有字符ret = re.findall([^t,a],'asd') t,a 是一组,这里去除去t 和a 以外的其他字符
\ 正则里最重要的一个:
反斜杠后面跟元子符取出特殊功能
反斜杠后面跟元字符实现特殊功能
\d 匹配任何十进制数 等价于[0-9]
\D 匹配任何非十进制数字符 等价于[^0-9]
\s 匹配任何空白字符 re,findall('\sasa','asd sasa')
\S 匹配任何非空白字符
\w 匹配任何字母数字字符
\W 匹配任何非字母数字字符
\b 匹配一个特殊边界,单词和空格间的位置
####
re.search('sb','saasdsbasassb') search方法只返回匹配的第一个值,后面匹配的就不返回了。
ret = re.search('sb','saasdsbasassb') ret.group() 获取对象的值
()
匹配()里面的内容作为一组,所有的都匹配出来
print(re.search('(as)+','sdjkfasas').group())
| 管道符,匹配或者
##########
re 下面的方法
findall 返回所有匹配只
search 返回一个对象,包含匹配第一个的信息,通过对象的group方法取第一个值
match 只在字符串开头进行匹配,也只返回一个对象,对象也通过调用group方法取值
split re.split('[j,s]','adjkasall') 分割,这个要先用js进行分割,分割完后剩下的内容再使用s进行分割。
re.sub 替换 re.sub('a..x','s..b','asdasdasassxasd') 规则,替换成的内容,被替换的字符串
re.compile 编译一个匹配规则,用于多次调用 obj=re.complie('\.com') obj.findall('asdasd.comasdasd')
python语法_模块_re(正则表达)的更多相关文章
- python语法_模块
方便调用的分组函数文件,一个py模块就是一个模块,模块分三类 python标准库 第三方模块 应程序自定义模块 模块的掉用: 可以把多个功能(函数)包含在一个模块文件里,调用时直接使用import 就 ...
- python语法_模块_os_sys
os模块:提供对此操作系统进行操作的接口 os.getcwd() 获取python运行的工作目录. os.chdir(r'C:\USERs') 修改当前工作目录. os.curdir 返回当前目录 ( ...
- python语法_模块_loggin_hashlib_conifgparser
loggin模块 日志模块,级别从上往下依次增强,debug 和 info 默认不输出信息,只有后三种级别有输出信息 loggin.debug('') loggin.info('') loggin.w ...
- python语法_模块_time_datetime_random
模块:可以被公共调用的. time import time print(time.time()) 时间戳方式显示时间. time.sleep(3) 休眠3秒 time.clock() 计算cpu执行时 ...
- python——re模块(正则表达)
python——re模块(正则表达) 两个比较不错的正则帖子: http://blog.csdn.net/riba2534/article/details/54288552 http://blog.c ...
- Python 进阶_模块 & 包
目录 目录 模块的搜索路径和路径搜索 搜索路径 命名空间和变量作用域的比较 变量名的查找覆盖 导入模块 import 语句 from-import 语句 扩展的 import 语句 as 自动载入模块 ...
- python语法_函数
---恢复内容开始--- 函数: 1 减少重复代码 2 定义一个功能,需要直接调用 3 保持代码一致性 def funcation_name(参数s): 功能代码块0 参数可以为多个,传入时按照前后 ...
- python语法_装饰器
装饰器的知识点储备: 1 作用域 2 高阶函数 3 闭包 内部函数,对外部作用作用域的变量进行了引用,该内部函数就认为是闭包, def outer(): x=10 def inner(): print ...
- python语法_文件操作
牢记“”“能调用方法的一定是对象”“” 文件的操作流程, 1 建立文件(打开文件)open('filename','模式').read() [这一步其实就是创建对象] 2 通过句柄进行操作 3 关闭o ...
随机推荐
- cadcam
Email:kefu007@vip.qq.com 13D TIMON 2007 英語版2007 23DVIA Composer V6R2013 中文版2013 3ABQUS V6.11 6.11 4A ...
- web.xml 各版本的 Schema 头部声明
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE web-app PUBLIC "- ...
- struts2-第一章-基础用法3
一,结果类型配置 在之前servlet学习中,知道网页页面路径跳转有两种方式,内部跳转(请求转发)和外部跳转(重定向),两者的区别,内部跳转浏览器地址不会变化 可以保存上一次请求的数据 外部跳转浏览器 ...
- 自己动手造拖拉机轮子系列 -(react-loadable)
最新消息:react官方已支持懒加载https://reactjs.org/docs/code-splitting.html#reactlazy 文章webpack分片chunk加载原理中深入探究了异 ...
- css设置多列等高布局
初始时,多个列内容大小不同,高度不同.现在需要设置不同的背景来显示,而且各个列的高度需要保持一致.那么这就需要利用到多列等高布局. 最终需要的效果: 1. 真实等高布局 flex 技术点:弹性盒子布局 ...
- having使用
啰嗦点: where子句用来筛选 from子句中指定的操作所产生的行. group by 子句用来分组 where子句的输出. having子句用来从分组的结果中筛选行. 对于可以在分组操作之前或之后 ...
- sql server DbHelperSQL类
using JKTAC_LMIS.Entity; using System; using System.Collections; using System.Collections.Generic; u ...
- Game 23
Polycarp plays "Game 23". Initially he has a number nn and his goal is to transform it to ...
- 【转】Socket接收字节缓冲区
原创本拉灯 2014年04月16日 10:06:55 标签: socket / 数据包 4448 我们接收Socket字节流数据一般都会定义一个数据包协议( 协议号,长度,内容),由于Socket接收 ...
- PBRT笔记(8)——材质
BSDF类 表面着色器会绑定场景中每一个图元(被赋予了这个着色器),而表面着色器则由Material类的实例来表示.它会拥有一个BSDF类对象(可能是BSSDF),用于计算表面上每一点的辐射度(颜色) ...