re模块和正则表达式别名和分组机制

命名分组

  (1)分组--可以让我们从文本内容中提取指定模式的部分内容,用()来表示要提取的分组,需要注意的是分组
是在整个文本符合指定的正则表达式前提下进行的进一步筛选。
(2)通过group()和groups()来获取分组的内容 group(num)返回的是第num组括号所匹配的值,group()即group(0),它表示匹配正则式的整个文本; groups()以tuple形式(元组)返回所有括号匹配的值。
如下例:
m = re.match('^(\d{3})-(\d{3,8})','012-123456')
print(m.group())
print(m.groups())
这里我们定义了两个分组,一个用来匹配3位数字,一个用来匹配3-8位数字,执行group()和
groups()的结果如下:
012-123456
('012', '123456') (3)分组命名
有时候我们需要匹配的分组描述可能十分复杂,这时我们可以通过给分组取名来让我们更方便地获
取分组。
分组命名的规则为:(?P<name>分组正则表达式)
string = "ip=130.192.168.23"
#为分组取别名ip
res = re.search(r"ip=(?P<ip>\d+\.\d+\.\d+\.\d+)", string)
print(res.group())
print(res.group('ip'))#通过命名分组引用分组
执行结果为:
ip=130.192.168.23
130.192.168.23 """
findall默认是分组优先展示
正则表达式中如果有括号分组 那么在展示匹配结果的时候
默认只演示括号内正则表达式匹配到的内容!!!
也可以取消分组有限展示的机制
(?:) 括号前面加问号冒号
""" '''针对search和match有几个分组 group方法括号内最大就可以写几'''

collections模块

模块简介

  collections是Python内建的一个集合模块,提供了许多有用的集合类。该模块实现了专门的容器数据类
型,提供了Python的通用内置容器,dict,list,set和tuple的替代方法。
在内置数据类型(dict、list、set、tuple)的基础上,collections模块还提供了几个额外的数据类
型:Counter、deque、defaultdict、namedtuple和OrderedDict等。

1、namedtuple: 生成可以使用名字来访问元素内容的tuple(具名元组)

  导入from collections import namedtuple
用法示例:tuple可以表示不变集合,例如,一个点的二维坐标就可以表示成:p(3,2)
但是,看到(3, 2),很难看出这个tuple是用来表示一个坐标的。
这时就可以用namedtuple来表示出更加详细的信息 from collections import namedtuple
1.先产生一个元组对象模板
point = namedtuple('坐标', ['x', 'y'])
p1 = point(3, 2)
p2 = point(1, 2)
print(p1, p2) # 坐标(x=3, y=2) 坐标(x=1, y=2)
print(p1.x) # 3
print(p2.y) # 2 info = namedtuple('信息', 'name age')
stud1 = info('张三', '18')
stud2 = info('李四', '18')
print(stud1, stud2) # 信息(name='张三', age='18') 信息(name='李四', age='18')
print(stud1.name) # 张三
print(stud2.age) # 18 """具名元组的使用场景也非常的广泛 比如数学领域、娱乐领域等"""
card = namedtuple('扑克牌', ['花色', '点数'])
c1 = card('黑桃', 'A')
c2 = card('黑梅', 'K')
c3 = card('红心', 'A')
print(c1, c2, c3)
print(c1.点数)

2、deque: 双端队列,可以快速的从另外一侧追加和推出对象

  用list存储数据时,按索引访问元素很快,但是插入和删除元素就很慢了,因为list是线性存储,数据量大
的时候,插入和删除效率很低。
deque可以通过appendleft()和popleft()实现另一侧的插入和删除操作,更加高效,适合用于队列和
栈,
from collections import deque q = deque([1, 2, 3, 4])
q.append(5) # 在后面追加
print(q) # deque([1, 2, 3, 4, 5])
q.appendleft(6) # 在前面追加
print(q) # deque([6, 1, 2, 3, 4, 5])
q.pop() # 弹出末尾的元素
print(q) # deque([6, 1, 2, 3, 4])
q.popleft() # 弹出开头的元素
print(q) # deque([1, 2, 3, 4])
print(q[1]) # 按索引取值 2

3、Counter: 计数器,主要用来计数

  Counter类的目的是用来跟踪值出现的次数。它是一个无序的容器类型,以字典的键值对形式存储,其中元
素作为key,其计数作为value(可以认为Counter直接
生成一个Hash表,这一点在处理问题时经常用到)。
计数值可以是任意的Interger(包括0和负数) from collections import Counter txt = '1aa22331sddddsw44'
c = Counter(txt)#返回一个字典
print(c)
# Counter({'d': 4, '1': 2, 'a': 2, '2': 2, '3': 2, 's': 2, '4': 2, 'w': 1})
print(c['d']) # 按key取值 4

4、OrderedDict: 有序字典

  使用dict时,Key是无序的。所以在对dict做迭代时,我们无法确定Key的顺序。
如果要保持Key的顺序,可以用OrderedDict:
from collections import OrderedDict
d = dict([('a', 1), ('b', 2), ('c', 3)])
print(d) # dict的Key是无序的{‘a’: 1, ‘c’: 3, ‘b’: 2}
od = OrderedDict([('a', 1), ('b', 2), ('c', 3)])
print(od) # OrderedDict的Key是有序的OrderedDict([(‘a’, 1), (‘b’, 2), (‘c’, 3)])

5、defaultdict: 带有默认值的字典

  使用dict时,如果引用的Key不存在,就会抛出KeyError。如果希望key不存在时,返回一个默认值,
就可以用defaultdict:
例一:
from collections import defaultdict
dd = defaultdict(lambda: 'N/A')
dd['k1'] = '1'
print(dd)
print(dd['k2']) # k2不存在,返回默认值’N/A’
执行结果:
defaultdict(<function <lambda> at 0x00CC3E38>, {'k1': '1'})
N/A 例二:
"""
有如下值集合 [11,22,33,44,55,67,77,88,99,999],
将所有大于 66 的值保存至字典的第一个key中,将小于 66 的值保存至第二个key的值中。
"""
from collections import defaultdict
values = [11, 22, 33,44,55,67,77,88,99,90]
my_dict = defaultdict(list) # 字典所有的值默认都是列表 {'':[],'':[]}
for value in values:
if value>66:
my_dict['k1'].append(value)
else:
my_dict['k2'].append(value)

time模块和datetime模块

time模块

  Python中有两个模块可以完成时间操作:time和datetime,其中time有这几种方式来表示时间:

  1.时间戳(timestamp):通常来说,时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量。我
们运行“type(time.time())”,返回的是float类型。
2.格式化的时间字符串(Format String)
3.结构化的时间(struct_time):struct_time元组共有9个元素共九个元素:(年,月,日,时,分,
秒,一年中第几周,一年中第几天,夏令时)

time模块的使用

    import time

    # 1、时间戳格式
print(time.time()) # 1648545357.8447278 # 2、 结构化时间
print(time.localtime()) # 本地时区的struct_time
print(time.gmtime()) # UTC时区的struct_time
'''
time.struct_time(tm_year=2022, tm_mon=3, tm_mday=29, tm_hour=17, tm_min=15, tm_sec=57, tm_wday=1, tm_yday=88, tm_isdst=0)
time.struct_time(tm_year=2022, tm_mon=3, tm_mday=29, tm_hour=9, tm_min=15, tm_sec=57, tm_wday=1, tm_yday=88, tm_isdst=0)
# 我们的时间是东八区和UTC标准时间相隔8个小时
'''
0 tm_year(年) 比如2011
1 tm_mon(月) 1 - 12
2 tm_mday(日) 1 - 31
3 tm_hour(时) 0 - 23
4 tm_min(分) 0 - 59
5 tm_sec(秒) 0 - 60
6 tm_wday(weekday) 0 - 6(0表示周一)
7 tm_yday(一年中的第几天) 1 - 366
8 tm_isdst(是否是夏令时) 默认为0
# 3、格式化时间
print(time.strftime('%Y-%m-%d %H:%M:%S')) #2022-03-29 17:15:57
'%Y-%m-%d %X' == '%Y-%m-%d %H:%M:%S'
python中时间日期格式化符号有:
%y 两位数的年份表示(00-99)
%Y 四位数的年份表示(000-9999)
%m 月份(01-12)
%d 月内中的一天(0-31)
%H 24小时制小时数(0-23)
%I 12小时制小时数(01-12)
%M 分钟数(00=59)
%S 秒(00-59)
%a 本地简化星期名称
%A 本地完整星期名称
%b 本地简化的月份名称
%B 本地完整的月份名称
%c 本地相应的日期表示和时间表示
%j 年内的一天(001-366)
%p 本地A.M.或P.M.的等价符
%U 一年中的星期数(00-53)星期天为星期的开始
%w 星期(0-6),星期天为星期的开始
%W 一年中的星期数(00-53)星期一为星期的开始
%x 本地相应的日期表示
%X 本地相应的时间表示
%Z 当前时区的名称
%% %号本身

格式转换

    import time

    # 1、时间戳和结构化时间相互转换
print(time.localtime(1582290777.6476405)) # 将时间戳转化为结构化时间
# time.struct_time(tm_year=2020, tm_mon=2, tm_mday=21, tm_hour=21, tm_min=12, tm_sec=57, tm_wday=4, tm_yday=52, tm_isdst=0) print(time.mktime(time.localtime())) # mktime(t) : 将一个struct_time转化为时间戳。
# 1648545808.0 # 2、结构化时间和格式化时间相互转换
print(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())) # 将结构化时间转化为格式化时间
# 2022-03-29 17:23:28 print(time.strptime('2020-02-21 21:19:43', '%Y-%m-%d %X')) # 将格式化时间转化为结构化时间
# time.struct_time(tm_year=2020, tm_mon=2, tm_mday=21, tm_hour=21, tm_min=19, tm_sec=43, tm_wday=4, tm_yday=52, tm_isdst=-1)
# time.strptime('string', [format]) 在这个函数中,format默认为:"%Y %m %d %H:%M:%S"。

datetime模块

  和time相比,datetime的功能更强大,以下分别是两个模块的具体信息。
import time
import datetime print(dir(time))
#['_STRUCT_TM_ITEMS', '__doc__', '__loader__', '__name__', '__package__', '__spec__',
# 'altzone', 'asctime', 'ctime', 'daylight', 'get_clock_info', 'gmtime', 'localtime',
# 'mktime', 'monotonic', 'monotonic_ns', 'perf_counter', 'perf_counter_ns',
# 'process_time', 'process_time_ns', 'sleep', 'strftime', 'strptime', 'struct_time',
# 'thread_time', 'thread_time_ns', 'time', 'time_ns', 'timezone', 'tzname']
print(dir(datetime.datetime))
#['__add__', '__class__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__',
# '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__',
# '__le__', '__lt__', '__ne__', '__new__', '__radd__', '__reduce__', '__reduce_ex__',
# '__repr__', '__rsub__', '__setattr__', '__sizeof__', '__str__', '__sub__',
# '__subclasshook__', 'astimezone', 'combine', 'ctime', 'date', 'day', 'dst', 'fold',
# 'fromisocalendar', 'fromisoformat', 'fromordinal', 'fromtimestamp', 'hour',
# 'isocalendar', 'isoformat', 'isoweekday', 'max', 'microsecond', 'min', 'minute',
# 'month', 'now', 'replace', 'resolution', 'second', 'strftime', 'strptime', 'time',
# 'timestamp', 'timetuple', 'timetz', 'today', 'toordinal', 'tzinfo', 'tzname',
# 'utcfromtimestamp', 'utcnow', 'utcoffset', 'utctimetuple', 'weekday', 'year'] print(datetime.datetime.now()) # 获取当前时间 2022-03-29 17:33:47.720877
print(datetime.date.fromtimestamp(time.time())) # 时间戳直接转成日期格式 2022-03-29
print(datetime.datetime.now() + datetime.timedelta(3)) # 当前时间+3天 2022-04-01 17:33:47.721875
print(datetime.datetime.now() - datetime.timedelta(3)) # 当前时间-3天 2022-03-26 17:33:47.721875
print(datetime.datetime.now() + datetime.timedelta(hours=3)) # 当前时间+3小时 2022-03-29 20:33:47.721875
print(datetime.datetime.now() + datetime.timedelta(minutes=30)) # 当前时间+30分 2022-03-29 18:03:47.721875 """
针对时间计算的公式
日期对象 = 日期对象 +/- timedelta对象
timedelta对象 = 日期对象 +/- 日期对象
"""

random模块

一,随机浮点数

  (1)random() --- 产生大于等于0且小于1的浮点数
ret = random.random()
print(ret)
0.698328408870422 (2)uniform(a,b) --- 产生指定范围的随机浮点数
ret = random.uniform(1, 4)
print(ret)
2.941859945496957

二,随机整数

  (1)randint(a,b) --- 产生a,b范围内的整数,包含开头和结尾
ret = random.randint(1, 3)
print(ret)
1 (2)randrange(start,stop,[step]) --- 产生start,stop范围内的整数,包含开头不包含结尾,
step指定产生随机数的步长。
ret = random.randrange(1, 6, 2)
print(ret)
5

三,随机选择一个或多个数据

  (1) random.choice(lst) --- 随机返回序列中的一个数据随机选择一个数据
lst = ['a', 'b', 'c']
ret = random.choice(lst)
print(ret)
b (2) random.sample(list, num) -- 随机返回序列中的num个数据
lst = ['a', 'b', 'c', 'd', 'e']
ret = random.sample(lst,2)
print(ret)
['b', 'd']

四,随机打乱一个数据集合

  randim.shuffle(list) -- 随机打乱一个数据集合
lst = ['a', 'b', 'c', 'd', 'e']
print(lst) # ['a', 'b', 'c', 'd', 'e']
random.shuffle(lst)
print(lst) # ['d', 'c', 'b', 'a', 'e']

今日作业

使用random模块编写一个能够产生随机验证码的代码

      验证码可以是数字、小写字母、大写字母 任意组合

      基本要求:产生固定位数的 比如四位

      拔高要求:产生指定位数的 ...

      eg:

            要产生四位随机验

            要产生五位随机验

证码 JkO98

  import random
def verification_Code(numb):
code = ''
str = [1,2,3]
for i in range(numb):
chioce = random.choice(str)
if chioce == 1:
code = code + chr(random.choice(range(48,58)))
elif chioce == 2:
code = code + chr(random.choice(range(65, 91)))
else:
code = code + chr(random.choice(range(97, 122)))
else:
return code
print(verification_Code(5)) # 5l72l

re模块,正则表达式起别名和分组机制,collections模块,time与datetime模块,random模块的更多相关文章

  1. collections、time、datetime、random模块

    今日内容概要 1.re模块的其他知识 2.正则起别名与分组机制 3.collections模块 4.time与datetime模块 5.random随机数模块 今日内容详细 re模块的其他知识 imp ...

  2. Python包,json&pickle,time&datetime,random模块

    补充内容: 解决模块循环导入的两种方法:(不得已而为之,表示程序结构不够严谨) 将导入模块语句放在文件最下方 保证语句导入之前函数内代码能够被执行 将导入语句放进函数体内 使其不影响整个函数的运行 包 ...

  3. python基础--常用的模块(collections、time、datetime、random、os、sys、json、pickle)

    collection模块: namedtuple:它是一个函数,是用来创建一个自定义的tuple对象的,并且规定了tuple元素的个数,并可以用属性而不是索引来引用tuple的某个元素.所以我们就可以 ...

  4. ZH奶酪:【Python】random模块

    Python中的random模块用于随机数生成,对几个random模块中的函数进行简单介绍.如下:random.random() 用于生成一个0到1的随机浮点数.如: import random ra ...

  5. python-利用random模块生成测试数据封装方法总结

    1.前言: 在测试中经常有需要用到参数化,我们可以用random模块,faker模块生成测试数据,也可以用到pymysql,此文主要针对random模块生成任意个数的随机整数,随机字符串,随机手机号, ...

  6. python-Day5-深入正则表达式--冒泡排序-时间复杂度 --常用模块学习:自定义模块--random模块:随机验证码--time & datetime模块

    正则表达式   语法:             mport re #导入模块名 p = re.compile("^[0-9]") #生成要匹配的正则对象 , ^代表从开头匹配,[0 ...

  7. s14 第5天 时间模块 随机模块 String模块 shutil模块(文件操作) 文件压缩(zipfile和tarfile)shelve模块 XML模块 ConfigParser配置文件操作模块 hashlib散列模块 Subprocess模块(调用shell) logging模块 正则表达式模块 r字符串和转译

    时间模块 time datatime time.clock(2.7) time.process_time(3.3) 测量处理器运算时间,不包括sleep时间 time.altzone 返回与UTC时间 ...

  8. Python中的re模块--正则表达式

    Python中的re模块--正则表达式 使用match从字符串开头匹配 以匹配国内手机号为例,通常手机号为11位,以1开头.大概是这样13509094747,(这个号码是我随便写的,请不要拨打),我们 ...

  9. Day 19 re 模块 random模块,正则表达式

    https://www.cnblogs.com/Eva-J/p/7228075.html#_label10 findall search match方法 和 search相比 match自带 ^ se ...

随机推荐

  1. Java 中,抽象类与接口之间有什么不同?

    Java 中,抽象类和接口有很多不同之处,但是最重要的一个是 Java 中限制一个 类只能继承一个类,但是可以实现多个接口.抽象类可以很好的定义一个家族类 的默认行为,而接口能更好的定义类型,有助于后 ...

  2. 玩转 React(四)- 创造一个新的 HTML 标签

    在第二篇文章 <新型前端开发方式> 中有说到 React 有很爽的一点就是给我们一种创造 HTML 标签的能力,那么今天这篇文章就详细讲解下 React 是如何提供这种能力的,作为前端开发 ...

  3. iView 一周年了,同时发布了 2.0 正式版,但这只是开始...

    两年前,我开始接触 Vue.js 框架,当时就被它的轻量.组件化和友好的 API 所吸引.之后我将 Vue.js 和 Webpack 技术栈引入我的公司(TalkingData)可视化团队,并经过一年 ...

  4. 使用 Vuex + Vue.js 构建单页应用【新篇】

    使用 Vuex + Vue.js 构建单页应用[新篇] 在去年的七月六号的时候,发布了一篇 使用 Vuex + Vue.js 构建单页应用 的文章,文章主要是介绍 vuex 的基本使用方法,发现对大部 ...

  5. Linux 0.11源码阅读笔记-内存管理

    内存管理 Linux内核使用段页式内存管理方式. 内存池 物理页:物理空闲内存被划分为固定大小(4k)的页 内存池:所有空闲物理页组成内存池,以页为单位进行分配回收.并通过位图记录了每个物理页是否空闲 ...

  6. C#编写一个控制台应用程序,输入正方形边长或者半径,计算其周长和面积并输出

    编写一个控制台应用程序,输入正方形边长或者半径,计算其周长和面积并输出 (1) 编写两个接口,接口 IShape 包含三个方法:initialize, getPerimeter, getArea.分别 ...

  7. Hive进行数据统计时报错:org.apache.hadoop.mapreduce.v2.app.MRAppMaster: Error starting MRAppMaster

    报错详情: 2020-04-09 22:56:58,827 ERROR [Listener at 0.0.0.0/45871] org.apache.hadoop.mapreduce.v2.app.M ...

  8. java中"Static块"是怎么回事,怎么用的,有什么意义

    6.Static块  Static块:该类的任何方法被首次触碰到时(马克-to-win: when you touch Test的main方法时),Static块被运行.可以在里面初始化你的stati ...

  9. JavaScript实现有农历和节气节假日的日历

    运行效果: 源代码: 1 <!DOCTYPE html> 2 <html> 3 <head> 4 <meta http-equiv="Content ...

  10. 【Java分享客栈】SpringBoot整合WebSocket+Stomp搭建群聊项目

    前言 前两周经常有大学生小伙伴私信给我,问我可否有偿提供毕设帮助,我说暂时没有这个打算,因为工作实在太忙,现阶段无法投入到这样的领域内,其中有两个小伙伴又问到我websocket该怎么使用,想给自己的 ...