re模块补充说明

在正则表达式中，'()'的作用是进行分组，但是在re模块中，正则表达式中的'()'代表着其他的意思。

1、在findall()方法中，匹配到值会优先返回括号内的值

import re

res = re.findall('a(b)c', 'abc|a1bc|d|abc|2')

print(res)  # 输出：['b', 'b']

"""匹配时先忽略括号，有结果时返回括号内的值"""

# 如果有多个括号

res = re.findall('(a)(b)c', 'abc|a1bc|d|abc|2')

print(res)  # 输出：[('a', 'b'), ('a', 'b')]

"""匹配时先忽略括号，有结果时把括号内的值组成元组存到列表中"""

# 如果想让'()'表示在正则表达式中的意义,可以在括号里加'?:'

res = re.findall('a(?:b)c', 'abc|a1bc|d|abc|2')

print(res)  # 输出：['abc', 'abc']

2、在search()方法中，具有分组的功能

import re

res = re.search('a(b)c', 'abc|a1bc|d|abc|2')

print(res)  # <_sre.SRE_Match object; span=(0, 3), match='abc'>

print(res.group())  # 输出：abc

print(res.group(0))  # 0是默认值，输出内容与不加参数一致

print(res.group(1))  # 输出：b

"""可以给group()添加参数输出括号的值，但是参数不能超过括号的个数"""

# 如果有多个括号

res = re.search('(a)(b)(c)', 'abc|a1bc|d|abc|2')

print(res.group(1))  # 输出：a

print(res.group(2))  # 输出：b

print(res.group(3))  # 输出：c

print(res.group(4))  # 报错，超出括号分组的个数了

"""可以给group()添加参数按顺序输出"""

# 分组后可以给每个组起别名

res = re.search('(?P<name1>a)(?P<name2>b)c', 'abc|a1bc|d|abc|2')

print(res.group('name1'))  # 输出：a

print(res.group('name2'))  # 输出：b

"""?P<别名>放在括号中，<>内的名称就是别名"""

# 如果想让'()'表示在正则表达式中的意义,可以在括号里加'?:'

res = re.search('a(?:b)c', 'abc|a1bc|d|abc|2')

print(res.group(1))  # 报错，没有分组的内容

3、括号在match()、search()、finditer()中用法相同

4、括号在findall()、compile()中用法相同

collections模块

除了基本数据类型外，collections模块提供了额外的数据类型。

1、namedtuple()，生成一个可以从名字访问值的元组

from collections import namedtuple

# 生成一个叫做"坐标"的元组，传列表类型表示把列表中的值当作元组的key

point = namedtuple('坐标', ['x', 'y'])

# 传值要与列表元素个数对应

p1 = point(1, 2)

p2 = point(5, 6)

print(p1, p2)  # 输出：坐标(x=1, y=2) 坐标(x=5, y=6)

# 按照名字来取值

print(p1.x)  # 输出：1

print(p2.y)  # 输出：6

# 也可以传字符串类型，每个key用空格隔开

person = namedtuple('人物', '姓名 age')

p1 = person('jason', 18)

p2 = person('kevin', 28)

print(p1, p2)  # 输出：人物(姓名='jason', age=18) 人物(姓名='kevin', age=28)

print(p1.姓名, p1.age)  # 输出：jason 18

2、deque()，双端队列，首尾都可以进出数据

from collections import deque

q = deque([1, 2, 3])

print(q)  # 输出：deque([1, 2, 3])

q.append(4)  # 默认从尾部添加数据

print(q)  # 输出：deque([1, 2, 3, 4])

q.appendleft(0)  # 从首部添加数据

print(q)  # 输出：deque([0, 1, 2, 3, 4])

q.pop()  # 默认从尾部弹出数据

print(q)  # 输出：deque([0, 1, 2, 3])

q.popleft()  # 从首部弹出数据

print(q)  # 输出：deque([1, 2, 3])

3、OrderedDict()，生成一个有序字典

# 基本数据类型的字典是无序的

d1 = dict([('a', 1), ('b', 2), ('c', 3)])

d2 = dict([('b', 2), ('c', 3), ('a', 1)])

print(d1 == d2)  # 输出：True

# 生成有序字典

from collections import OrderedDict

od1 = OrderedDict([('a', 1), ('b', 2), ('c', 3)])

od2 = OrderedDict([('b', 2), ('c', 3), ('a', 1)])

print(od1 == od2)  # 输出：False

"""

有序字典的方法与普通的字典类型相同

注意：给有序字典添加键值对是按顺序添加的

"""

4、defaultdict()，给字典的值设置一个默认值

from collections import defaultdict

# 设置默认值为列表类型

my_dict = defaultdict(list)

# 给列表添加值

my_dict['k1'].append('aaa')

# 不传值默认生成空列表

my_dict['k2']

print(my_dict)  # 输出：defaultdict(<class 'list'>, {'k1': ['aaa'], 'k2': []})

print(my_dict['k2'])  # 输出：[]

5、Counter()，统计所有字符出现的次数，返回的值可以当字典使用

from collections import Counter

res1 = 'asdbnbasdbanba'

r1 = Counter(res1)

print(r1)  # 输出：Counter({'a': 4, 'b': 4, 's': 2, 'd': 2, 'n': 2})

print(r1.get('a'))  # 输出：4

res2 = ['a', 45, 'qq', 2, 2, 'a']

r2 = Counter(res2)

print(r2)  # 输出：Counter({'a': 2, 2: 2, 45: 1, 'qq': 1})

queue模块

简单讲解，生成队列

import queue

q = queue.Queue(3)  # 最大只能放三个元素

# 存放元素

q.put(11)

q.put(22)

q.put(33)

"""此时队列满了，继续添加会原地等待，直到队列空出位置"""

# 获取元素

print(q.get())  # 输出：11

print(q.get())  # 输出：22

print(q.get())  # 输出：33

"""此时队列空了，继续获取会原地等待，直到队列有数据"""

time模块

和时间有关系的计算我们就要用到这个模块。

常用方法(sleep()、time())

import time

time.sleep(10)  # 括号内为程序停止时间，单位为秒

time.time()  # 获取当前时间戳

time模块有三种表示时间的格式：时间戳、结构化时间、格式化时间。

时间戳：

距离1970年1月1日0时0分0秒至此相差的秒数，使用time.time()可以获取时间戳。

结构化时间：

结构化时间中有9个元素，分别有着不同的意义，使用time.localtime()可以获取结构化时间。

import time

t = time.localtime()

print(t)

# 输出：time.struct_time(tm_year=2022, tm_mon=3, tm_mday=29, tm_hour=16, tm_min=43, tm_sec=12, tm_wday=1, tm_yday=88, tm_isdst=0)

索引	属性	值
0	tm_year（年）	比如2011
1	tm_mon（月）	1 - 12
2	tm_mday（日）	1 - 31
3	tm_hour（时）	0 - 23
4	tm_min（分）	0 - 59
5	tm_sec（秒）	0 - 60
6	tm_wday（星期）	0 - 6（0表示周一）
7	tm_yday（一年中的第几天）	1 - 366
8	tm_isdst（是否是夏令时）	默认为0

格式化时间：

我们可以最直观看懂的时间格式，使用time.strftime()可以获取格式化时间。

import time

t = time.strftime("%Y-%m-%d %X")

print(t)  # 输出：2022-03-29 16:45:37

特殊符号表

符号	意义
%y	两位数的年份表示（00 - 99）
%Y	四位数的年份表示（000 - 9999）
%m	月份（01 - 12）
%d	月内中的一天（0 - 31）
%H	24小时制小时数（0 - 23）
%I	12小时制小时数（01 - 12）
%M	分钟数（00 - 59）
%S	秒（00-59）
%a	本地简化星期名称
%A	本地完整星期名称
%b	本地简化的月份名称
%B	本地完整的月份名称
%c	本地相应的日期表示和时间表示
%j	年内的一天（001 - 366）
%p	本地A.M.或P.M.的等价符
%U	一年中的星期数（00-53）星期天为星期的开始
%w	星期（0-6），星期天为星期的开始
%W	一年中的星期数（00-53）星期一为星期的开始
%x	本地相应的日期表示
%X	本地相应的时间表示
%Z	当前时区的名称
%%	%号本身

只需要记住常用的即可。

时间格式的转换

时间戳<==>结构化时间

# 时间戳-->结构化时间

time.gmtime(时间戳)  # 返回结构化时间

time.localtime(时间戳)  # 返回结构化时间

"""上述的方法返回的结构化时间是UTC时间"""

# 结构化时间-->时间戳

time.mktime(结构化时间)  # 返回时间戳

格式化时间<==>结构化时间

# 结构化时间-->格式化时间

time.strftime(格式定义,结构化时间)  # 结构化时间参数若不传，则显示当前时间

# 格式化时间-->结构化时间

time.strptime(格式化时间,对应的格式)

datetime模块

导入模块

import datetime

获取当前年月日

dt = datetime.date.today()

print(dt)  # 输出：2022-03-29

# 获取年份

print(dt.year)  # 输出：2022

# 获取月份

print(dt.month)  # 输出：3

# 获取天数

print(dt.day)  # 输出：29

# 获取星期(0-6)，星期一开始

print(dt.weekday())  # 输出：1

# 获取星期(1-7)，星期一开始

print(dt.isoweekday())  # 输出：2

获取当前年月日，时分秒

dt = datetime.datetime.today()

# 或者

dt = datetime.datetime.now()

print(dt)  # 输出：2022-03-29 17:25:12.431065

# 获取年份

print(dt.year)  # 输出：2022

# 获取月份

print(dt.month)  # 输出：3

# 获取天数

print(dt.day)  # 输出：29

# 获取时

print(dt.hour)  # 输出：17

# 获取分

print(dt.minutes)  # 输出：25

# 获取秒

print(dt.second)  # 输出：12

# 获取星期(0-6)，星期一开始

print(dt.weekday())  # 输出：1

# 获取星期(1-7)，星期一开始

print(dt.isoweekday())  # 输出：2

时间差timedelta()

# 获取当前时间

date_time = datetime.datetime.today()

print(date_time)  # 输出：2022-03-29 17:34:11.180282

# 括号内可以是多种时间选项，这里是四天的意思，hour=3代表3小时等等...

time_delta = datetime.timedelta(days=4)

print(date_time + time_delta)  # 输出：2022-04-02 17:34:11.180282

自定义datetime()

dt = datetime.datetime(2001, 7, 28, 12, 12)

print(dt)  # 输出：2001-07-28 12:12:00

datetime()也可以转成格式化时间，转换方法与结构化转格式化时间相同。

random模块

random模块讲究的就是一个随机。

导入模块

import random

产生[0,1)的随机小数

print(random.random())

产生[2.3,3.5)的随机小数

print(random.uniform(2.3,3.5))

产生[2,10]的随机整数

print(random.randint(2,10))

随机打乱数据集

l = [1, 2, 3, 4, 5]

random.shuffle(l)

print(l)

从数据集随机选择一个

l = [1, 2, 3, 4, 5]

print(random.choice(l))

随机指定个数抽样

l = [1, 2, 3, 4, 5]

# 从l中随机取2个

print(random.sample(l, 2))

小练习

使用random模块编写一个能够产生随机验证码的代码

点击查看代码

import random

# 定义空列表

l_all = []

# 把A-Z添加到空列表中

l_all.extend([chr(i) for i in range(65, 91)])

# 把a-z添加到列表中

l_all.extend([chr(i) for i in range(97, 123)])

# 把0-9转为字符串类型添加到列表中

l_all.extend([str(i) for i in range(0, 10)])

def get_random(num):

    # 打乱列表，更随机

    random.shuffle(l_all)

    # 定义返回值为空字符串

    res = ''

    for i in range(num):

        # 随机从列表中那一个添加到字符串中

        res += random.choice(l_all)

    return res

print(get_random(5))

python之re模块补充和其他模块(collection、time、queue、datetime、random)的更多相关文章

python day 8: re模块补充，导入模块,hashlib模块，字符串格式化，模块知识拾遗，requests模块初识
目录 python day 8 1. re模块补充 2. import模块导入 3. os模块 4. hashlib模块 5. 字符串格式:百分号法与format方法 6. 模块知识拾遗 7. req ...
os模块补充以及序列化模块
os模块补充以及序列化模块一.os模块的补充 1.os.path.abspath 能把存在的相对路径的绝对路径显示出来 path = os.path.abspath("连达day19. ...
re模块补充与其他模块介绍
注:昨日写了re单个模块几个重要的点需要补充一.re模块补充 1.findall独有的优先级别展示 res = re.findall('abc', 'abcabcabcabc') print(res ...
文成小盆友python-num7 -常用模块补充，python 牛逼的面相对象
本篇内容: 常用模块的补充 python面相对象一.常用模块补充 1.configparser模块 configparser 用于处理特定格式的文件,起内部是调用open()来实现的,他的使用场景是 ...
python模块补充
一.模块补充 configparser 1.基本的读取配置文件 -read(filename) 直接读取ini文件内容 -sections() 得到所有的section,并以列表的形式返回 -opti ...
Python全栈开发之7、模块和几种常见模块以及format知识补充
一.模块的分类 Python流行的一个原因就是因为它的第三方模块数量巨大,我们编写代码不必从零开始重新造轮子,许多要用的功能都已经写好封装成库了,我们只要直接调用即可,模块分为内建模块.自定义的模块. ...
Python开发【第七篇】：面向对象和模块补充
内容概要特殊成员反射 configparser模块 hashlib模块 logging模块异常处理模块包 1. 特殊成员什么是特殊成员呢? __init_()就是个特殊的成员. 带双下划线 ...
python面向编程：常用模块补充与面向对象
一.常用模块 1.模块的用用法模块的相互导入绝对导入从sys.path (项目根目录)开始的完整路径相对导入是指相对于当前正在执行的文件开始的路径只能用于包内模块相互间导入不能超过顶层 ...
python【第五篇】常用模块学习
一.主要内容模块介绍 time &datetime模块 random os sys shutil json & pickle shelve xml处理 yaml处理 configpa ...

随机推荐

javaweb之连接数据库
最近做完了一个图书系统的增删改查,想着来总结一下这几个月的所学内容. 一.首先你需要在电脑上安装上mysql或者sql server(本文以mysql为例) mysql官网:MySQL :: Begi ...
leetcode-剑指 Offer II 012. 左右两边子数组的和相等
题目描述: 给你一个整数数组 nums ,请计算数组的中心下标 . 数组中心下标是数组的一个下标,其左侧所有元素相加的和等于右侧所有元素相加的和. 如果中心下标位于数组最左端,那么左侧数之和视为 ...
每日所学之自学习大数据的Linux环境配置2
今天设置网络出现报错明天找时间解决不用解决了刚才试了以下又能下载了描述一下问题: cannot find a valid baseurl for repo:base/7/x86_64 如果 ...
Python：爬取全国各省疫情数据并在地图显示
代码: import requests import pymysql import json from pyecharts import options as opts from pyecharts. ...
datetimepicker 设置日期格式、初始化
$('#datetimepicker').datetimepicker({ minView: "month", //选择日期后,不会再跳转去选择时分秒 language: 'zh- ...
docker更新portainer-ce2.0
前两天,我在使用portainer的过程中发现左下角提醒有新版本的portainer需要安装,google了一圈如何升级portainer,并没有找到我需要的资料,就算获取了portainer:las ...
论文翻译：2021_Performance optimizations on deep noise suppression models
论文地址:深度噪声抑制模型的性能优化引用格式:Chee J, Braun S, Gopal V, et al. Performance optimizations on deep noise sup ...
Python Requests 速通爆肝、这么牛逼的库你还不会用吗？
上网原理爬虫原理 Get.Post Requests 介绍安装常用方法 Http协议开发者工具网络界面 Response对象下载保存一张图片.一首音乐添加Headers发送请求判断HTT ...
Java语言学习day07--7月6日
今日内容介绍1.流程控制语句switch2.数组 ###01switch语句解构 * A:switch语句解构 * a:switch只能针对某个表达式的值作出判断,从而决定程序执行哪一段代码. * ...
react实战系列 —— 起步（mockjs、第一个模块、docusaurus）
其他章节请看: react实战系列起步本篇我们首先引入 mockjs ,然后进入 spug 系统,接着模仿"任务计划"模块实现一个类似的一级导航页面("My任务计划 ...

python之re模块补充和其他模块(collection、time、queue、datetime、random)