day 21 内存管理，正则

一、内存管理

1、垃圾回收

不能被程序访问到的数据，就称之为垃圾。

2、引用计数

引用计数是用来记录值得内存地址被记录的次数

每一次对值地址的引用都可以使得该值的引用计数+1

每一次对值地址的释放都可以使得该值的引用计数-1

当一个值的引用计数为0时，该值就会被系统的垃圾回收机制回收

a=10;b=10  #当要将两个语句放在一行，需要使用分号；

print(id(a),id(b))

#8791461192816  8791461192816  使用的是同一个内存地址

del a    #此时并没有将堆区10这个内存地址删除掉，只是将这个值得引用计数值减了1，此时的10的内存地址的计数为1

del b    #此时堆区10的内存地址的计数为0

当引用计数为0时，存在一个时间，一个阈值，当满足这两种情况下，垃圾回收机制会优化堆区10这个内存地址，将其删除。

3.循环导入

#列表的循环引用

lis1=[10]

lis2=[20]

lis1.append(lis2)

lis2.append(lis1)

print(lis1,lis2)

#[10, [20, [...]]]  [20, [10, [...]]]

#此时二者循环引用

del lis1

del lis2

#此时删除了两个变量名，但是内部堆区的值得地址还存在，其值的引用计数都为1（二者相互引用），无法删除，此为循环引用。该引用会导致内存泄漏，对于这些不需要的值，系统会利用标记删除来清除内存中的地址，释放空间。

4.标记删除

标记：标记的过程其实就是，遍历所有的GC Roots对象(栈区中的所有内容或者线程都可以作为GC Roots对象），然后将所有GC Roots的对象可以直接或间接访问到的对象标记为存活的对象，存放到新的内存空间中。

删除：删除的过程将遍历堆中所有的对象，将之前所有的内容全部清除，之前被标记的对象会被复制新的一份保存在新的空间。

5.分带回收（优化机制）

分代：指的是根据存活时间来为变量划分不同的等级（也就是不同的代）

新定义的变量，放到新生代这个等级中，假设每隔1分钟扫描新生代一次，如果发现变量依然被引用，那么该对象的权重（权重本质就是个整数）加一，当变量的权重大于某个设定得值（假设为3），会将它移动到更高一级的青春代，青春代的gc扫描的频率低于新生代（扫描时间间隔更长），假设5分钟扫描青春代一次，这样每次gc需要扫描的变量的总个数就变少了，节省了扫描的总时间，接下来，青春代中的对象，也会以同样的方式被移动到老年代中。也就是等级（代）越高，被垃圾回收机制扫描的频率越低

分代解释

回收：任然使用引用计数作为回收的依据

二、正则

正则：就是带语法的字符串，用来匹配目标字符串得到想要的字符串结果

1.正则就是字符串，可以为带r的原意字符串

s = "123454http://www.baidu.com/12htp46"

res = re.findall(r'http://www.baidu.com/', s

#此处的r为原意字符串

print(res)

2.正则语法

#转义字符 \   在正则中，\\代表匹配\

print(re.findall(r'\\a',r'123\abc'))

# \\a  此处多出来一个\是正常的,显示效果，本质上为\a

import re

print(re.findall(r'\d',r'123\abc'))  #数字

print(re.findall(r'[0-9]',r'123\abc')) #0-9

print(re.findall(r'\D',r'123\abc'))    #非数字

print(re.findall(r'[A-z]',r'123\abc')) #A到z 根据ascii \在其中

print(re.findall(r'[A-Z]|[a-z]',r'123\abc'))#A-Z或a-z

print(re.findall(r'[A-Za-z]',r'123\abc'))#A-Z或a-z

print(re.findall(r'[A-Za-z0-9好]',r'1好23\abc'))#字母和数字 #重点掌握

print(re.findall(r'\w',r'1好_23\*abc'))#字母+数字+下划线

print(re.findall(r'\W',r'1好_23\*abc'))#与w相反

print(re.findall(r'\s','1好_23\n\t\f\v\r*abc'))#所有空白，换行，制表符，回车符  不需要加r

print(re.findall(r'\S','1好_23\n\t*abc'))#所有可见字符  不需要加r

print(re.findall(r'.','1好_2 3\n\t\f\v\r*abc'))#所有单个字符，刨除换行符

单个字符

print(re.findall(r'[a-z]{2}',r'123\\qwtrrererf'))#a-z里两个两个的寻找

print(re.findall(r'r{2,}',r'123\\qwtrrrerrfrr'))#['rrr', 'rr', 'rr'] 贪婪匹配

print(re.findall(r'r{2}',r'123\\qwrrrerrfrr'))#['rr', 'rr', 'rr']  连续的

print(re.findall(r'r{1,2}',r'123\\qwrrrerrfrr'))#['rr', 'r', 'rr', 'rr'] 最少匹配1次，最多匹配2次

# {n} n是一个非负整数。匹配确定的n次。

# {n,} n是一个非负整数。至少匹配n次。

# {n,m}  m和n均为非负整数，其中n<=m。最少匹配n次且最多匹配m次。

print(re.findall(r'qw*',r'123\\qwqeqwtqwqw'))#['qw', 'q', 'qw', 'qw', 'qw']

#匹配前面的子表达式任意次,=={,n} 0到n个，贪婪匹配

print(re.findall(r'qw+',r'123\\qwqeqwtqwqw'))#['qw', 'qw', 'qw', 'qw']

#匹配前面的子表达式一次或多次 =={1，n} 1到n个， 贪婪匹配

print(re.findall(r'qw?',r'123\\qwqeqwtqwqw'))#['qw', 'q', 'qw', 'qw', 'qw']

#匹配前面的子表达式零次或一次 =={0,1}  0个到1个  贪婪匹配

print(re.findall(r'qw?',r'123\\qwwwweqwtwqqwqw')) #['qw', 'qw', 'q', 'qw', 'qw']

print(re.findall(r'qw+',r'123\\qwwwweqwtwqqwqw')) #['qwwww', 'qw', 'qw', 'qw']

print(re.findall(r'qw*',r'123\\qwwwweqwtwqqwqw')) #['qwwww', 'qw', 'q', 'qw', 'qw']

多个字符

3.正则的多行匹配（字符串不能使用r来保持原义了）

print(re.findall(r'^http://.+/$', 'http://www.baidu.com/\nhttp://www.sina.com.cn/', re.M))

#['http://www.baidu.com/', 'http://www.sina.com.cn/']

print(re.findall(r'.', 'http://www.baidu.com/\nhttp://www.sina.com.cn/', re.S))  # .结合S 可将字符串里所有字符找出来

# ^: 以什么开头 $: 以什么结尾  结合 flags=re.M  可以按\n来完成多行匹配

# re.S：将\n也能被.匹配  re.I：不区分大小写

4.分组语法

# 1.从左往右数数 ( 进行编号，自己的分组从1开始，group(0)代表匹配到的目标整体

# 2.(?: ... )：取消所属分组，()就是普通()，可以将里面的信息作为整体包裹，但不产生分组

import re

regexp = re.compile('(?:(?:http://)\((.+)\)/)')  # 生成正则对象   此处的\()\用来转义，下面的字符串自带了括号

target = regexp.match('http://(www.baidu.com)/')

print(target.group(0)) #http://(www.baidu.com)/

print(target.group(1)) #www.baidu.com

其他函数

re模块常用方法
findall   从左往右查找所有满足条件的字符  返回一个列表
search    返回第一个匹配的字符串  结果封装为对象 span=(0, 5) 匹配的位置 match匹配的值
match     匹配行首  返回值与search相同   若行首不存在，则返回None
    对于search  match 匹配的结果通过group来获取
compile  将正则表达式 封装为一个正则对象 好处是可以重复使用这个表达式

split使用正则表达式来切分字符串

5、拆分

print(re.split('\s','123 456\n789\t000'))

#['123', '456', '789', '000'] 存在空格

6.替换

 1.不参与匹配的原样带下,即分组里没包含在内的字符，会给其返回值

2.参与匹配的都会被替换为指定字符串

 3.在指定字符串值\num拿到具体分组

4.其他字符串信息都是原样字符串 除了\num

import re

print(re.sub('([a-z]+)(\d+)(.+)',r'\1\3\2','abc123你好'))

#abc你好123 

print(re.sub('[0-9]+','数字','abc123你好'))  #注意+的添加

#abc数字你好

res = re.findall('<([a-z]{1,3})>(\w*?)</[a-z]{1,3}>', '<a>abc</a><b>123</b>')

print(res)  # [('a', 'abc'), ('b', '123')]

#('a', 'abc')  前者的a是第一个组产生的，后面的abc是第二个组产生的

#('b', '123')  前者的b是第一个组产生的，后面的123是第二个组产生

逻辑点：正则表达式里的三个条件是整体匹配所要匹配的字符串，当三个条件都满足时，会记录当前的结果，此时程序继续往后跑，再次遇到符合条件的字符串，继续记录，一直检索到字符串最后。  表达式里的条件不是满足一次就截止，且不是找齐满足条件的最大范围，只要符合要求，就将其值记录下来！！！

import re

res = re.match('(\d{3})(\d{3})(\d{3})', '123456789111222333')

print(res.group(0)) #123456789

print(res.group(1)) #123

print(res.group(2)) #456

print(res.group(3)) #789

res = re.findall('(\d{3})(\d{3})(\d{3})', '123456789111222333')

print(res)  #[('123', '456', '789'), ('111', '222', '333')]

#二者的区别：match 仅获取第一次匹配的内容  findall会一直更新获取匹配的内容

day 21 内存管理，正则的更多相关文章

内存管理与正则（re）模块
内存管理垃圾回收机制不能被程序访问到的数据,就称之为垃圾也就是失去了一个能够访问到值数据的名称空间,导致在内存中无作为引用计数:是内存管理的原理引用计数是用来记录值的内存地址被记录的次数每 ...
iOS阶段学习第21天笔记(ARC内存管理-Copy-代理)
iOS学习(OC语言)知识点整理一.OC 中的ARC内存管理 1)ARC中释放对象的内存原则:看这个对象有没有强引用指向它 2)strong:强引用,默认情况下的引用都是强引用 3) weak:弱引 ...
Linux内存管理 (21)OOM
专题:Linux内存管理专题关键词:OOM.oom_adj.oom_score.badness. Linux内核为了提高内存的使用效率采用过度分配内存(over-commit memory)的办法, ...
Linux堆内存管理深入分析（下）
Linux堆内存管理深入分析 (下半部) 作者@走位,阿里聚安全 0 前言回顾在上一篇文章中(链接见文章底部),详细介绍了堆内存管理中涉及到的基本概念以及相互关系,同时也着重介绍了堆中chunk分 ...
ARC内存管理机制详解
ARC在OC里面个人感觉又是一个高大上的牛词,在前面Objective-C中的内存管理部分提到了ARC内存管理机制,ARC是Automatic Reference Counting---自动引用计数. ...
深入了解C#系列：谈谈C#中垃圾回收与内存管理机制
今天抽空来讨论一下.Net的垃圾回收与内存管理机制,也算是完成上个<WCF分布式开发必备知识>系列后的一次休息吧.以前被别人面试的时候问过我GC工作原理的问题,我现在面试新人的时候偶尔也会 ...
iOS阶段学习第20天笔记（MRC内存管理）
iOS学习(OC语言)知识点整理一.OC中的内存管理 1)概念:内存管理的对象为所有继承了NSObject的对象,对基本数据(如:int .float.double...)无效 OC中采用 ...
Objective C 内存管理[转]
1 配对原则 alloc – release new – release retain - release copy – release 2 new和alloc-init的区别 (1)区别只在于a ...
Pooled Allocation池式分配实例——Keil 内存管理
最近翻看Kei安装目录,无意中发现C51\LIB下的几个.C文件: CALLOC.CFREE.CINIT_MEM.CMALLOC.CREALLOC.C 看到 MALLOC.C 和 FREE.C 想到可 ...

随机推荐

js循环中使用async/await踩过的坑
最近写koa的时候遇见需要在循环中使用async/await的情况,当然第一反应就是直接上forEach,然后就直接翻车了... 直接上代码: function handleSql(val) { re ...
Oracle之数组
记忆力不好,提供样例套路: 固定长度数组: declare type t_test ) ); test t_test := t_test('a', 'b', 'c', 'd', 'e'); begin ...
Java ----> java io / java nio / java net 学习资源汇总
Java IO教程 Java NIO 系列教程 Java网络教程学习Java基础的一个英文网站:http://tutorials.jenkov.com/ ,上面中文教程来自并发编程网,上面中文教程翻 ...
VSCode中使用vue项目ESlint验证配置
如果在一个大型项目中会有多个人一起去开发,为了使每个人写的代码格式都保持一致,就需要借助软件去帮我们保存文件的时候,自己格式化代码解决办法:vscode软件下载一个ESLint,在到设置里面找到se ...
vue 修改端口号
具体步骤如下: vue小白交流群,希望能够帮助到大家!
Chrome的Copy Selector中带有\3
F12,右键copy selector就是这个结果. 查询到如下资料: https://stackoverflow.com/questions/20043347/css-css-coding-that ...
ES6/ES7/ES8常用特性和新特性
转自:https://www.jianshu.com/p/9da4aa1c9970
asp.net 跨域访问
摘自 https://docs.microsoft.com/en-us/aspnet/web-api/overview/security/enabling-cross-origin-requests- ...
云计算概述和KVM虚拟化
前言: 近些年一直听着虚拟化.云计算.公有云.私有云.混合云这些个概念,一直想着....这些概念要用什么技术实现? 一.云计算的概念 1.传统IDC机房面都会临什么问题? 任何新事物都是由需求催生的 ...
ARP协议分析（Wireshark）
一.说明 1.1 背景说明以前学网络用的谢希仁的<计算机网络原理>,一是网开始学不太懂网络二是ARP协议是没有数据包格式的(如果没记错应该是没有).学完只记得老师说:ARP很简单的,就是 ...

day 21 内存管理，正则

day 21 内存管理，正则的更多相关文章

随机推荐

热门专题