Python基础之re模块
什么是模块?
为了编写可维护的代码,我们把很多的函数分组,分别放到不同的文件里,这样,每个文件包含的代码就相对较少,很多编程语言都采用这种组织代码的方式,在Python中,一个.py文件就称为一个模块
模块的作用?
使用模块的好处 大大提高了代码的可维护性 其次 编写代码不必从零开始 当一个模块编写完毕 就可以被其他地方引用 我们在编写程序的时候,也就经常使用其他模块 包括Python内置的模块和来自第三方的模块; 另外使用模块可以避免函数名和变量名冲突。
re模块
re模块是python标准库(Python中已经定义好的)里面的一个模块,主要用于模糊查询,应用方面为WEB 、爬虫等; re 模块 就其本质而言,正则表达式(或re)是一种小型的,高度专业的编程语言,(在Python中) 它内嵌在Python中,并通过re模块实现,正则表达式模式被编译成一系列的字节码,然后由 C编写的匹配引擎执行。
re模块使用元字符去匹配数据,元字符包括:
. 通配符(可以匹配任意类型的数据)
^ 从开头开始匹配
$ 结尾符 (返回以指定内容结尾的数据)
* 匹配(0,+00)次
+ 匹配(1,+00)次
? 匹配(0,1)次
{} 可以代替之前的三种情况 {0,}== * {1,}==+ {0,1}==? {6}匹配重复6次
[a-z] 表示范围 re.findall('q[a-z]', 'quojqkjhk') re.findall('q[a-z]*', 'quojqkjhk') 匹配多次 re.findall('q[^a-z]*', 'quojqkjhk') 匹配不是以q开头后面是字母的数据
[xyz] 字符集 匹配字符集中的任何一个字符
\ 去掉转义 使元字符失去特殊功能
() 分组 将()之间的内容定义为组,并且将匹配这个字符的表达式暂存在一个临时区域
| 表示或运算
反斜杠后边跟普通字符实现特功能:
\d 匹配十进制数 它相当于类[0-9] 将每个数字分成单个方式展示 \d+ 可以展示十位数或者百位数
\D 匹配任何非数字字符 它相当于类[^0-9]
\s 匹配任何空白字符 它相当于类[\+\n\r\f\v]
\S 匹配任何非空白字符 它相当于类[^\+\n\r\f\v]
\w 匹配任何字母数字字符 它相当于类[a-zA-Z0-9_]
\W 匹配任何非字母数字字符 它相当于类[^a-z A-Z 0-9_]
\b 匹配一个特殊字符边界 比如空格 & #等
r 或者 \\ 去掉特殊意义
分组
re.search("(?P<name>[a-z]+)\(?P<age>\d+)", "alex36wusir34xialv33").gruop('name')
re模块使用的函数:
findall() 把返回的结果放在列表中
search() 函数在字符串内查找模式匹配 只找到第一个匹配然后返回一个对象
search.gruop() 通过调用group()方法得到匹配的字符串 如果字符串没有匹配则返回空
match() 匹配成功就返回一个对象 不成功就什么都不返回 与search 不同的是它只在开始位置进行匹配
spilt() 按照指定的字符将带匹配对象进行分割 被分割的位置用空白代替
sub() 用指定的字符去替换带替换的对象
re.sub('\d+','A','jadsk56469adsdfsdf35464')
re.sub('\d','A','jadsk56469adsdfsdf35464')
re.sub('\d','A','jadsk56469adsdfsdf35464', 5)
re.subn('\d', 'A', 'jafdsf2313asfdsd5534') 返回替换的结果和替换的次数
compile() re.compile('') 编译想要匹配的规则 com=compile('\d+') com.findal('asdfds23asdf') 这样做可以使用多次
finditer() 将返回结果存在迭代器中 使用的时候 next = re.finditer('\d','asfdds231dsfs') next(ret).group()
去优先级 re.findall('www\.(?:baidu|163)\.com', 'afsdfdsf.163.comsdafsdf')
Python基础之re模块的更多相关文章
- 十八. Python基础(18)常用模块
十八. Python基础(18)常用模块 1 ● 常用模块及其用途 collections模块: 一些扩展的数据类型→Counter, deque, defaultdict, namedtuple, ...
- Python基础-包与模块
Python基础-包与模块 写在前面 如非特别说明,下文均基于Python3 摘要 为重用以及更好的维护代码,Python使用了模块与包:一个Python文件就是一个模块,包是组织模块的特殊目录(包含 ...
- python基础,函数,面向对象,模块练习
---恢复内容开始--- python基础,函数,面向对象,模块练习 1,简述python中基本数据类型中表示False的数据有哪些? # [] {} () None 0 2,位和字节的关系? # ...
- python基础31[常用模块介绍]
python基础31[常用模块介绍] python除了关键字(keywords)和内置的类型和函数(builtins),更多的功能是通过libraries(即modules)来提供的. 常用的li ...
- python基础-包和模块
Python基础-包与模块 写在前面 如非特别说明,下文均基于Python3 摘要 为重用以及更好的维护代码,Python使用了模块与包:一个Python文件就是一个模块,包是组织模块的特殊目录(包含 ...
- Python全栈开发之路 【第六篇】:Python基础之常用模块
本节内容 模块分类: 好处: 标准库: help("modules") 查看所有python自带模块列表 第三方开源模块: 自定义模块: 模块调用: import module f ...
- Python基础入门-os模块
今天我们来介绍一下os模块中常用的一些方法,当然python中的os模块中提供的使用方法有很多,但是这里面小编会列举出来一些和实际工作中应用的相关的方法,而且会有一些实际的例子方便大家对os模块理解. ...
- python基础,导入模块,if语句,while语句
python基础 python代码 变为字节码 变为机器码 最后执行执行‘文件名.py’文件时出现的‘文件名.pyc’文件为字节码 缓存机制 使用pycharm的时候在文件最开始添加下面这两行代码,中 ...
- Python 基础之re 模块
Python 基础之大话 re 在使用re模块中主要会用到一下几个方法: re.match() #从头匹配一个字符串 re.search() #浏览全部字符串,匹配第一个符合规则的字符串 re.fin ...
- python基础之os模块操作
# os模块 目录相关内置库import os# . 当前目录 .. 返回上一级目录# 1. os.path.abspath() --获取当前文件的绝对路径(不包含os模块.py) pwd# path ...
随机推荐
- java同步和互斥【用具体程序说明】
java同步和互斥[用具体程序说明] 所有对象都自动含有单一的锁,也就是所有对象都有且只有唯一的锁,所以当某个任务(线程)访问一个类A中含有sycnhronized的方法是,那么 ...
- 3.9 run_main.py源码(兼容python2和3)
3.9 run_main.py源码(兼容python2和3) 以下代码在python2和python3上都跑通过,python3只需注释掉上面红色框框区域代码就行(最后一步发送邮箱代码,我注释掉了). ...
- yii2下载
我发现yii2下载贼困难,不过折腾了很久终于搞下来了. 一,设置镜像 安装composer , 下载 composer.phar 添加中国镜像 composer config -g repo. ...
- 用http请求一直失败,用https开头就ok了
今天晚上在调试新浪的程序,发现之前一直可以用的接口,有时候就会失败, 各项参数全部仔细核对,都没有发现任何不同之处,真是奇了怪了. 后来一看,post 的部分,之前是用 http:// 开头的,但是此 ...
- Windows下Redis安装过程
1.去github下载Redis-x64-2.8.2402.zip压缩包 2.将压缩包解压到你要安装的目录下 3.将redis设置为开机自启动服务 redis-server --service-ins ...
- AI之旅(3):升维与最小二乘法
前置知识 矩阵的逆 知识地图 首先我们将了解一种叫升维的方法,用已有特征构造更多的特征.接着通过对空间与投影建立一定的概念后,推导出最小二乘法. 当特征数量不足时 在上一篇<初识线性 ...
- centos 7 中安装 mysql 5.7
centos 7 中安装 mysql 5.7 环境说明: 查看centos的版本:cat /etc/redhat-release 安装和配置步骤: 下载 mysql 源安装包: sudo curl - ...
- bootstrap4.0
1.CDN库引用: <link rel="stylesheet" href="https://maxcdn.bootstrapcdn.com/bootstrap/4 ...
- C#服务端Web Api
本教程已经录制视频,欢迎大家观看我在CSDN学院录制的课程:http://edu.csdn.net/lecturer/944
- Python之进度条及π的计算
Python之进度条及π的计算 文本进度条 1. 简单的开始 这是利用print()函数来实现简单的非刷新文本进度条.它的基本思想是按照任务执行百分比将整个任务划分为100个单位,每执行N%输出一次 ...