python-常用模块xml、shelve、configparser、hashlib
一、shelve模块
shelve模块也是用来序列化的.
使用方法:
1.open
2.读写
3.close
import shelve
# 序列化
sl = shelve.open('shlvetest.txt',)
sl['date'] = '8-13'
sl.close() # 反序列化
s2 = shelve.open('shlvetest.txt',)
print(s2['date'])
s2.close()
特点:使用方法简单,提供一个文件名就可以开始读写
读写的方法和字典一致,可以当成自动序列化的字典
注:内部使用的就是pickle,所以也存在跨平台差的问题。自己存的数据只有自己知道如何取,一般用于单击程序
二、XML模块
XML全称为可扩展标记语言,标记符号为<>.
XML是为了能够跨平台数据交互。
XML语法格式:
1.任何的起始标签都必须有一个结束标签<tagname> </tagname>
2.可以采用另一种简化语法,可以在一个标签中同时表示起始和结束标签,用法为在大于符号之前加一个斜线(/)例如<tagname/>
3.标签必须按合适的顺序进行嵌套,所以结束标签必须按镜像顺序匹配起始标签
4.所有的特性都必须有值
5.所有的特性都必须在值的周围加上双引号。
注:最外层有且只有一个标签,这个标签为根标签。第一行应该有文档声明,用于告诉计算机怎么理解
<?XML version="1.0" encoding="utf-8"?>
使用场景:
1.配置文件 2.常规的数据交互
XML与json的区别:
作用是一样的都是一种数据格式
XML比json先诞生
json的数据比XML小
json是主流
python中XML处理
ElmentTree:表示整个文件的元素树
Elment:表示一个节点
属性:1.text 在开始标签和结束标签中间的文本
2.attrib:所有的属性 字典类型
3.tag:标签的名字
1.解析XML
查找节点(标签)
find:在子标签中获取匹配的第一个
findall:在子标签中获取名字匹配的所有
iter(名字)在全文中查找匹配的所有标签,返回一个迭代器
方法-----> get 获取某个属性的值
XML数据:
<?xml version="1.0"?>
<data>
<country name="Liechtenstein">
<rank updated="yes">2</rank>
<year>2008</year>
<gdppc>141100</gdppc>
<neighbor name="Austria" direction="E"/>
<neighbor name="Switzerland" direction="W"/>
</country>
<country name="Singapore">
<rank updated="yes">5</rank>
<year>2011</year>
<gdppc>59900</gdppc>
<neighbor name="Malaysia" direction="N"/>
</country>
<country name="Panama">
<rank updated="yes">69</rank>
<year>2011</year>
<gdppc>13600</gdppc>
<neighbor name="Costa Rica" direction="W"/>
<neighbor name="Colombia" direction="E"/>
</country>
</data> xml数据
print(root.iter('year')) #全文搜索
print(root.find('country')) #在root的子节点找,只找一个
print(root.findall('country')) #在root的子节点找,找所有
# 当要获取属性值时,用attrib方法。
# 当要获取节点值时,用text方法。
# 当要获取节点名时,用tag方法。
import xml.etree.cElementTree as et #读取XML文档到内存中, 得到一个包含所有数据的节点数
# 每一个标签就称之为一个节点 或元素 tree = et.parse("test.xml")
# 或取根标签
root = tree.getroot()
print(root)#<Element 'data' at 0x00000204FFD1CA48>
# 获取country 默认找的是第一个
print(root.find("country"))
# 获取所有的
print(root.findall("country")) #获取一个列表
# # 获取其中一个 year
print(root.iter("year"))
#只遍历year 节点
for i in root.iter("year"):
print(i) # 遍历整个xml
for country in root:
print(country.tag,country.attrib,country.text)
for t in country:
print(t.tag, t.attrib, t.text)
修改:
# ====================== 修改 素有country的year文本改成+1
# 读取到内存
tree = et.parse('test.xml')
for country in tree.findall("country"):
yeartag = country.find("year")
yeartag.text = str(int(yeartag.text)+1) # 写回到文件
tree.write('test.xml',encoding="utf-8",xml_declaration = False)
需要注意的是:读出来修改后,一定要记得写回去。
删除:
# 删除
tree = et.parse('test.xml')
for country in tree.findall("country"):
print(country.find("year"))
country.remove(country.find("year"))
# 写回到文件
tree.write('test.xml',encoding="utf-8",xml_declaration = False)
添加自定义标签:
tree = et.parse('test.xml')
for country in tree.findall("country"):
#添加自标签
newtag = et.Element("newTag")
#文本
newtag.text = ""
#属性
newtag.attrib["name"] = "DSB"
#添加
country.append(newtag)
# 写回到文件
tree.write('test.xml',encoding="utf-8",xml_declaration = False)
xml_declaration = True 给XML添加文档说明
用代码生成XML文档:
import xml.etree.ElementTree as et
# 创建根标签
root = et.Element("root")
# 创建节点树
t1 = et.ElementTree(root) # 加一个peron标签
persson = et.Element("person")
persson.attrib["name"] = "zfj"
persson.attrib["sex"] = "man"
persson.attrib["age"] = ""
persson.text = "这是一个person标签" root.append(persson) # 写入文件
t1.write("newXML.xml",encoding="utf-8",xml_declaration=True)
三、configparser模块
configparser模块是配置文件解析模块,配置文件是用于提供程序运行所需要的一些信息的文件
配置文件内容格式:只包括两种元素 section分区、option分区
一个文件可以有多个section,一个section可以有多个选项
核心功能:
1.section 获取所有分区
2.option获取所有选项
3.get 获取一个值 传入section option
========配置文件======== [section1]
k1 = v1
k2:v2
user=egon
age=18
is_admin=true
salary=31 [section2]
k1 = v1
配置读取:
import configparser config=configparser.ConfigParser()
config.read('a.cfg') #查看所有的标题
res=config.sections() #['section1', 'section2']
print(res) #查看标题section1下所有key=value的key
options=config.options('section1')
print(options) #['k1', 'k2', 'user', 'age', 'is_admin', 'salary'] #查看标题section1下所有key=value的(key,value)格式
item_list=config.items('section1')
print(item_list) #[('k1', 'v1'), ('k2', 'v2'), ('user', 'egon'), ('age', '18'), ('is_admin', 'true'), ('salary', '31')] #查看标题section1下user的值=>字符串格式
val=config.get('section1','user')
print(val) #egon #查看标题section1下age的值=>整数格式
val1=config.getint('section1','age')
print(val1) # #查看标题section1下is_admin的值=>布尔值格式
val2=config.getboolean('section1','is_admin')
print(val2) #True #查看标题section1下salary的值=>浮点型格式
val3=config.getfloat('section1','salary')
print(val3) #31.0
配置改写:
import configparser config=configparser.ConfigParser()
config.read('a.cfg',encoding='utf-8') #删除整个标题section2
config.remove_section('section2') #删除标题section1下的某个k1和k2
config.remove_option('section1','k1')
config.remove_option('section1','k2') #判断是否存在某个标题
print(config.has_section('section1')) #判断标题section1下是否有user
print(config.has_option('section1','')) #添加一个标题
config.add_section('egon') #在标题egon下添加name=egon,age=18的配置
config.set('egon','name','egon')
config.set('egon','age',18) #报错,必须是字符串 #最后将修改的内容写入文件,完成最终的修改
config.write(open('a.cfg','w'))
模拟一个下载功能 最大连接速度可以由用户来控制,用户不能看代码,所以提供一个配置文件
import configparser cfg = configparser.ConfigParser()
cfg.read("download.ini")
print(cfg.sections())
print(cfg.options("section1")) print(type(cfg.get("section1","maxspeed")))
print(cfg.get("section1","maxspeed")) print(cfg.getint("section2","minspeed")) #修改最大速度为2048
cfg.set("section1","maxspeed","") cfg.write(open("download.ini","w",encoding="utf-8"))
四、hashlib模块
hash是一种算法,用于将任意长度的数据,压缩映射到一段固定长度的字符(提取特征)常用于加密和文件校验
hash值的特点:
1.传入值不同,得到的hash值有可能相同
2.不能由hash值返解成内容
3.只要hash算法不变,无论输入的数据长度是多少,得到的hash值长度相等
破解MD5的方法可以尝试撞库,原理:有一个数据库中存放了常见的明文和密文的对应关系,可以拿密文去查数据库里已经存在的明文,如果有就是撞库成功,能不能破解全凭运气
import hashlib
md = hashlib.md5()
md.update("".encode("utf-8"))
print(md.hexdigest())
常用的提升安全性的手段就是加盐
md2 = hashlib.md5()
md2.update("".encode("utf-8"))
md2.update(pwd.encode("utf-8"))
md2.update("".encode("utf-8"))
print(md2.hexdigest())
还有一个 hmac 模块,它内部对我们创建 key 和 内容 进行进一步的处理然后再加密,不加盐会报错
hmac模块的使用步骤与hashlib模块的使用步骤基本一致,只是在第1步获取hmac对象时,只能使用hmac.new()函数,因为hmac模块没有提供与具体哈希算法对应的函数来获取hmac对象。
import hmac h = hmac.new(b"net")
h.update(b"luzhuo.me")
h_str = h.hexdigest()
print(h_str)
补充:
hash.digest()
返回摘要,作为二进制数据字符串值
hash.hexdigest()
返回摘要,作为十六进制数据字符串值
每天都学习!!!!!!
python-常用模块xml、shelve、configparser、hashlib的更多相关文章
- 常用模块xml,shelve,configparser,hashlib
XML 什么XML:全称 可扩展标记语言 标记指的是代表某种含义的字符 XML<> 为什么需要XML 为能够在不同的平台间继续数据的交换 为了使交换的数据能让对方看懂 就需要按照一定的语法 ...
- python常用模块之shelve模块
python常用模块之shelve模块 shelve模块是一个简单的k,v将内存中的数据通过文件持久化的模块,可以持久化任何pickle可支持的python数据类型 我们在上面讲json.pickle ...
- python常用模块:logging、hashlib、re
今日内容主要有:一.logging模块二.logging模块的使用三.hashlib模块四.re模块 一.logging模块 import logging # 1 日志的级别 logging.debu ...
- python常用模块集合
python常用模块集合 Python自定义模块 python collections模块/系列 Python 常用模块-json/pickle序列化/反序列化 python 常用模块os系统接口 p ...
- python 常用模块 time random os模块 sys模块 json & pickle shelve模块 xml模块 configparser hashlib subprocess logging re正则
python 常用模块 time random os模块 sys模块 json & pickle shelve模块 xml模块 configparser hashlib subprocess ...
- python常用模块-配置文档模块(configparser)
python常用模块-配置文档模块(configparser) 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. ConfigParser模块用于生成和修改常见配置文档,当前模块的名称 ...
- Python常用模块-摘要算法(hashlib)
Python常用模块-摘要算法(hashlib) 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.MD5算法参数详解 1.十六进制md5算法摘要 #!/usr/bin/env p ...
- python常用模块之configparser模块
python常用模块之configparser 作用:解析配置文件 假设在当前目录下有这样一个conf.ini文件 [DEFAULT] ServerAliveInterval = 45 Compres ...
- python常用模块之xml模块
python常用模块之xml模块 xml是实现不同语言或程序之间进行数据交换的协议,跟json差不多,但json使用起来更简单,不过,在json还没诞生的年代,大家都是使用xml,目前很多传统公司的系 ...
- Python常用模块之hashlib(加密)
Python常用模块之hashlib(加密) Python里面的hashlib模块提供了很多加密的算法,这里介绍一下hashlib的简单使用事例,用hashlib的md5算法加密数据import ha ...
随机推荐
- Vue.Draggable/SortableJS 的排序功能,在VUE中的使用
此插件git: https://github.com/SortableJS/Vue.Draggable 基于Sortable.js http://www.cnblogs.com/xiangsj/p/6 ...
- 三十四、Linux 进程与信号——信号特点、信号集和信号屏蔽函数
34.1 信号特点 信号的发生是随机的,但信号在何种条件下发生是可预测的 进程杠开始启动时,所有信号的处理方式要么默认,要么忽略:忽略是 SIGUSR1 和 SIGUSR2 两个信号,其他都采取默认方 ...
- 获取对象的key值,并保存在数组中
const itm = { a:1, b:2, c:3 } //Object.keys获取对象的属性,再遍历 Object.keys(itm).forEach(function(key,i,v){ c ...
- 5.21http网页基础
1,HTML的由来: web网页开发的标准,由w3c万维网联盟组织制定的.是制作网页的规范标准,分为结构标准.表现标准.行为标准.结构:html.表现:css.行为:Javascript. 2,htm ...
- table 如何不越过父级div
设置table 被限制在外围div的方法: 设置样式: table { table-layout: fixed; /*fiexed 列宽由表格宽度和列宽度设定. 默认.列宽度由单元格内容设定.*/ w ...
- L - Tic-Tac-Toe FZU - 2283 (思维)
题目链接: L - Tic-Tac-Toe FZU - 2283 题目大意:两个人下棋,一共是三步棋,第一个人下一步,第二个人下一步,第三个人下一步,然后问你在两个人在都足够聪明的条件下,第一个人能否 ...
- 黑马程序员_Java基础视频-深入浅出精华版--视频列表
\day01\avi\01.01_计算机基础(计算机概述).avi; \day01\avi\01.02_计算机基础(计算机硬件和软件概述).avi; \day01\avi\01.03_计算机基础(软件 ...
- Django学习手册 - 前端input数据获取
view获取数据方法归纳: #请求meta数据 request.mata(...) request.method(POST,GET,PUT) #从meta里面获取数据 request.path_inf ...
- 利用jTessBoxEditor工具进行Tesseract-OCR样本训练
jTessBoxEditor依赖java虚拟机 , 所以要先安装 java. jTessBoxEditor下载地址: https://sourceforge.net/projects/vietocr/ ...
- Pytorch Visdom
fb官方的一些demo 一. show something 1. vis.image:显示一张图片 viz.image( np.random.rand(3, 512, 256), opts=dic ...