json

  1. import json
  2. dic = {'k1':'v1','k2':'v2','k3':'v3'}
  3. str_dic = json.dumps(dic) #序列化:将一个字典转换成一个字符串
  4. print(type(str_dic),str_dic) #<class 'str'> {"k3": "v3", "k1": "v1", "k2": "v2"}
  5. #注意,json转换完的字符串类型的字典中的字符串是由""表示的

  6. dic2 = json.loads(str_dic) #反序列化:将一个字符串格式的字典转换成一个字典
  7. #注意,要用json的loads功能处理的字符串类型的字典中的字符串必须由""表示
  8. print(type(dic2),dic2) #<class 'dict'> {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}


  9. list_dic = [1,['a','b','c'],3,{'k1':'v1','k2':'v2'}]
  10. str_dic = json.dumps(list_dic) #也可以处理嵌套的数据类型
  11. print(type(str_dic),str_dic) #<class 'str'> [1, ["a", "b", "c"], 3, {"k1": "v1", "k2": "v2"}]
  12. list_dic2 = json.loads(str_dic)
  13. print(type(list_dic2),list_dic2) #<class 'list'> [1, ['a', 'b', 'c'], 3, {'k1': 'v1', 'k2': 'v2'}]
  14.  
  15. dump load
  16. import json
  17. f = open('json_file','w')
  18. dic = {'k1':'v1','k2':'v2','k3':'v3'}
  19. json.dump(dic,f) #dump方法接收一个文件句柄,直接将字典转换成json字符串写入文件
  20. f.close()

  21. f = open('json_file')
  22. dic2 = json.load(f) #load方法接收一个文件句柄,直接将文件中的json字符串转换成数据结构返回
  23. f.close()
  24. print(type(dic2),dic2)
 json格式化输出
  1. import json
  2. data = {'username':['李华','二愣子'],'sex':'male','age':16}
  3. json_dic2 = json.dumps(data,sort_keys=True,indent=2,separators=(',',':'),ensure_ascii=False)
  4. print(json_dic2

pickle模块

用于序列化的两个模块

json,用于字符串 和 python数据类型间进行转换 pickle,用于python特有的类型 和 python的数据类型间进行转换 pickle模块提供了四个功能:dumps、dump(序列化,存)、loads(反序列化,读)、load (不仅可以序列化字典,列表...可以把python中任意的数据类型序列化)pickle是python特有的模块.

  1. import pickle
  2. dic = {'k1':'v1','k2':'v2','k3':'v3'}
  3. str_dic = pickle.dumps(dic)
  4. print(str_dic) #一串二进制内容

  5. dic2 = pickle.loads(str_dic)
  6. print(dic2) #字典

  7. import time
  8. struct_time = time.localtime(1000000000)
  9. print(struct_time)
  10. f = open('pickle_file','wb')
  11. pickle.dump(struct_time,f)
  12. f.close()

  13. f = open('pickle_file','rb')
  14. struct_time2 = pickle.load(f)
  15. print(struct_time2.tm_year)

这时候机智的你又要说了,既然pickle如此强大,为什么还要学json呢? 这里我们要说明一下,json是一种所有的语言都可以识别的数据结构。 如果我们将一个字典或者序列化成了一个json存在文件里,那么java代码或者js代码也可以拿来用。 但是如果我们用pickle进行序列化,其他语言就不能读懂这是什么了~ 所以,如果你序列化的内容是列表或者字典,我们非常推荐你使用json模块 但如果出于某种原因你不得不序列化其他的数据类型,而未来你还会用python对这个数据进行反序列化的话,那么就可以使用pickle

总结:

  1. json模块里的dumps是将python的数据结构转换成字符串,loads是将字符串类型转换成python的数据结构

  2. json模块里的dump是将python的数据结构转换成字符串,然后存入到文件当中

  3. json模块里的load是将文件中字符串类型转换成python的数据结构

  4. pickle模块里的dumps是将python的数据结构转换成二进制的文件,loads是将二进制的文件转换成python

  5. 数据结构

  6. pickle模块里的dump是将python的数据结构转换成二进制然后存入到文件中

  7. pickle模块里的load是将文件中的二进制文件转成python的数据结构

random 模块

random是一个随机数模块,我们一般用来生成一些没有规则的内容

获取0-1之间的随机小数

 
import random

print(random.random())

我们可以获取0到1之间的随机的小数,但是还能够满足你,你想要生成指定的数字内的随机小数怎么办??

import random

print(random.uniform(1,5))

这样写完后,你就有又想法了,说小数你实现了.整数怎么做到随机呢?老铁别急

 
import random

print(random.randint(1,5))

你这样是实现了,我想让你给生成随机的奇数和偶数,怎么样不会了吧??

 
import random

print(random.randrange(1,5,2))   #随机生成1-5的奇数
print(random.randrange(0,5,2))   #随机生成0-5的偶数
 

我还真发现了,真有点难不住你了,我现在有一个列表 lst = ['张开','宝元','佩奇','太白'],你给我随机抽一个人出来

 
import random

lst = ['张开','宝元','佩奇','太白']
print(random.choice(lst))

看来还是有两把刷子的,我在考考你.怎么给我随机抽出两个来  

 
 
import random

lst = ['张开','宝元','佩奇','太白']
print(random.choices(lst,k=2))

差点就被你骗你了,要不是我眼疾手快,发现了你随机出来的两个内容是有重复的,我还就要夸你了,没有满足需求重新实现

 
import random

lst = ['张开','宝元','佩奇','太白']
print(random.sample(lst,k=2))
 

可以啊,真是少年有为啊,难不住了,看来事要逼着我使用绝招了.我给你一个列表你给我让他变成随机排序的

 
import random

lst = [1,2,3,4,5,6]
random.shuffle(lst)
print(lst)

os模块

os模块是与操作系统交互的一个接口

  1. <em>#和文件夹相关
  2. os.makedirs('dirname1/dirname2') 可生成多层递归目录
  3. os.removedirs('dirname1') 若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
  4. os.mkdir('dirname') 生成单级目录;相当于shell中mkdir dirname
  5. os.rmdir('dirname') 删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
  6. os.listdir('dirname') 列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印

  7. # 和文件相关
  8. os.remove() 删除一个文件
  9. os.rename("oldname","newname") 重命名文件/目录
  10. os.stat('path/filename') 获取文件/目录信息

  11. # 和操作系统差异相关
  12. os.sep 输出操作系统特定的路径分隔符,win下为"\\",Linux下为"/"
  13. os.linesep 输出当前平台使用的行终止符,win下为"\r\n",Linux下为"\n"
  14. os.pathsep 输出用于分割文件路径的字符串 win下为;,Linux下为:
  15. os.name 输出字符串指示当前使用平台。win->'nt'; Linux->'posix'

  16. # 和执行系统命令相关
  17. os.system("bash command") 运行shell命令,直接显示
  18. os.popen("bash command).read() 运行shell命令,获取执行结果
  19. os.environ 获取系统环境变量

  20. #path系列,和路径相关
  21. os.path.abspath(path) 返回path规范化的绝对路径
  22. os.path.split(path) 将path分割成目录和文件名二元组返回
  23. os.path.dirname(path) 返回path的目录。其实就是os.path.split(path)的第一个元素
  24. os.path.basename(path) 返回path最后的文件名。如何path以/或\结尾,那么就会返回空值,即os.path.split(path)的第二个元素。
  25. os.path.exists(path) 如果path存在,返回True;如果path不存在,返回False
  26. os.path.isabs(path) 如果path是绝对路径,返回True
  27. os.path.isfile(path) 如果path是一个存在的文件,返回True。否则返回False
  28. os.path.isdir(path) 如果path是一个存在的目录,则返回True。否则返回False
  29. os.path.join(path1[, path2[, ...]]) 将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
  30. os.path.getatime(path) 返回path所指向的文件或者目录的最后访问时间
  31. os.path.getmtime(path) 返回path所指向的文件或者目录的最后修改时间
  32. os.path.getsize(path) 返回path的大小<br></em>
  1. os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径
  2. os.chdir("dirname") 改变当前脚本工作目录;相当于shellcd
  3. os.curdir 返回当前目录: ('.')
  4. os.pardir 获取当前目录的父目录字符串名:('..')

注意:os.stat('path/filename') 获取文件/目录信息 的结构说明

  1. stat 结构:
  2. st_mode: inode 保护模式
  3. st_ino: inode 节点号。
  4. st_dev: inode 驻留的设备。
  5. st_nlink: inode 的链接数。
  6. st_uid: 所有者的用户ID
  7. st_gid: 所有者的组ID
  8. st_size: 普通文件以字节为单位的大小;包含等待某些特殊文件的数据。
  9. st_atime: 上次访问的时间。
  10. st_mtime: 最后一次修改的时间。
  11. st_ctime: 由操作系统报告的"ctime"。在某些系统上(如Unix)是最新的元数据更改的时间,在其它系统上(如Windows)是创建时间(详细信息参见平台的文档)。 

sys模块

sys模块是与python解释器交互的一个接口

  1. sys.argv 命令行参数List,第一个元素是程序本身路径
  2. sys.exit(n) 退出程序,正常退出时exit(0),错误退出sys.exit(1)
  3. sys.version 获取Python解释程序的版本信息
  4. sys.path 返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
  5. sys.platform 返回操作系统平台名称

hashlib模块

算法介绍 Python的hashlib提供了常见的摘要算法,如MD5,SHA1等等。

什么是摘要算法呢?摘要算法又称哈希算法、散列算法。它通过一个函数,把任意长度的数据转换为一个长度固定的数据串(通常用16进制的字符串表示)。

摘要算法就是通过摘要函数f()对任意长度的数据data计算出固定长度的摘要digest,目的是为了发现原始数据是否被人篡改过。

摘要算法之所以能指出数据是否被篡改过,就是因为摘要函数是一个单向函数,计算f(data)很容易,但通过digest反推data却非常困难。而且,对原始数据做一个bit的修改,都会导致计算出的摘要完全不同。

我们以常见的摘要算法MD5为例,计算出一个字符串的MD5值:

  1. import hashlib
  2.  
  3. md5 = hashlib.md5()
  4. md5.update('how'.encode('utf-8'))
  5. print(md5.hexdigest())
  6.  
  7. 结果:db88a0257c220dbfdd2e40f6152d6a8d

如果数据量很大,可以分块多次调用update(),最后计算的结果是一样的:

  1. import hashlib
  2. md5 = hashlib.md5()
  3. md5.update('how你好啊,我不好'.encode('utf-8'))
  4. print(md5.hexdigest())
  5. 结果:3bfa4bfb7b59a59f27c24ebdd89cd13c
  6.  
  7. import hashlib
  8. md5 = hashlib.md5()
  9. md5.update('how'.encode('utf-8'))
  10. md5.update('你好啊,我不好'.encode('utf-8'))
  11. print(md5.hexdigest())
  12. 结果:3bfa4bfb7b59a59f27c24ebdd89cd13c

MD5是最常见的摘要算法,速度很快,生成结果是固定的128 bit字节,通常用一个32位的16进制字符串表示。另一种常见的摘要算法是SHA1,调用SHA1和调用MD5完全类似:

  1. import hashlib
  2.  
  3. sha1 = hashlib.sha1()
  4. sha1.update('how to use sha1 in'.encode('utf-8'))
  5. sha1.update('python hashlib?'.encode('utf-8'))
  6. print(sha1.hexdigest())
  7.  
  8. 结果:86e1eae2a08c152d39b55baed085c71a0cc9d10b

SHA1的结果是160 bit字节,通常用一个40位的16进制字符串表示。

SHA1的安全系数比MD5还要高一些,而且摘要的长度要比MD5长一些.

比SHA1更安全的算法是SHA256和SHA512,不过越安全的算法越慢,而且摘要长度更长。

摘要算法应用 任何允许用户登录的网站都会存储用户登录的用户名和口令。如何存储用户名和口令呢?方法是存到数据库表中:

  1. name | password
  2. --------+----------
  3. michael | 123456
  4. bob | abc999
  5. alice | alice2008

考虑这么个情况,很多用户喜欢用123456,888888,password这些简单的口令,于是,黑客可以事先计算出这些常用口令的MD5值,得到一个反推表:

  1. 'e10adc3949ba59abbe56e057f20f883e': '123456'
    '21218cca77804d2ba1922c33e0151105': '888888'
    '5f4dcc3b5aa765d61d8327deb882cf99': 'password'

这样,无需破解,只需要对比数据库的MD5,黑客就获得了使用常用口令的用户账号。

对于用户来讲,当然不要使用过于简单的口令。但是,我们能否在程序设计上对简单口令加强保护呢?

由于常用口令的MD5值很容易被计算出来,所以,要确保存储的用户口令不是那些已经被计算出来的常用口令的MD5,这一方法通过对原始口令加一个复杂字符串来实现,俗称“加盐”:

  1. import hashlib
  2. md5 = hashlib.md5('salt'.encode('utf-8')) #这是加盐了的
  3. md5.update('how你好啊,我不好'.encode('utf-8'))
  4. print(md5.hexdigest())
  5. #结果 49f3d086ef5582b12d294c6f1b1c9dea
  6.  
  7. import hashlib
  8. md5 = hashlib.md5()
  9. md5.update('how你好啊,我不好'.encode('utf-8'))
  10. print(md5.hexdigest())
  11. #结果 3bfa4bfb7b59a59f27c24ebdd89cd13c

经过Salt处理的MD5口令,只要Salt不被黑客知道,即使用户输入简单口令,也很难通过MD5反推明文口令。

但是如果有两个用户都使用了相同的简单口令比如123456,在数据库中,将存储两条相同的MD5值,这说明这两个用户的口令是一样的。有没有办法让使用相同口令的用户存储不同的MD5呢?

如果假定用户无法修改登录名,就可以通过把登录名作为Salt的一部分来计算MD5,从而实现相同口令的用户也存储不同的MD5。

摘要算法在很多地方都有广泛的应用。要注意摘要算法不是加密算法,不能用于加密(因为无法通过摘要反推明文),只能用于防篡改,但是它的单向计算特性决定了可以在不存储明文口令的情况下验证用户口令。

collections模块

在内置数据类型(dict、list、set、tuple)的基础上,collections模块还提供了几个额外的数据类型:Counter、deque、defaultdict、namedtuple和OrderedDict等。

1.namedtuple: 生成可以使用名字来访问元素内容的tuple

2.deque: 双端队列,可以快速的从另外一侧追加和推出对象

3.Counter: 计数器,主要用来计数

4.OrderedDict: 有序字典

5.defaultdict: 带有默认值的字典

namedtuple

我们知道tuple可以表示不变集合,例如,一个点的二维坐标就可以表示成:

  1. p = (1,2)

但是,看到(1, 2),很难看出这个tuple是用来表示一个坐标的。

这时,namedtuple就派上了用场:

  1. >> from collections import namedtuple
  2. >>> Point = namedtuple('Point', ['x', 'y'])
  3. >>> p = Point(1, 2)
  4. >>> p.x
  5. 1
  6. >>> p.y
  7. 2

类似的,如果要用坐标和半径表示一个圆,也可以用namedtuple定义:

  1. namedtuple('名称', [属性list]):
  2. Circle = namedtuple('Circle', ['x', 'y', 'r'])

deque

使用list存储数据时,按索引访问元素很快,但是插入和删除元素就很慢了,因为list是线性存储,数据量大的时候,插入和删除效率很低。

deque是为了高效实现插入和删除操作的双向列表,适合用于队列和栈:

  1. >>> from collections import deque
  2. >>> q = deque(['a', 'b', 'c'])
  3. >>> q.append('x')
  4. >>> q.appendleft('y')
  5. >>> q
  6. deque(['y', 'a', 'b', 'c', 'x'])

deque除了实现list的append()和pop()外,还支持appendleft()和popleft(),这样就可以非常高效地往头部添加或删除元素。

OrderedDict

使用dict时,Key是无序的。在对dict做迭代时,我们无法确定Key的顺序。

如果要保持Key的顺序,可以用OrderedDict:

  1. >>> from collections import OrderedDict
  2. >>> d = dict([('a', 1), ('b', 2), ('c', 3)])
  3. >>> d # dict的Key是无序的
  4. {'a': 1, 'c': 3, 'b': 2}
  5. >>> od = OrderedDict([('a', 1), ('b', 2), ('c', 3)])
  6. >>> od # OrderedDict的Key是有序的
  7. OrderedDict([('a', 1), ('b', 2), ('c', 3)])

注意,OrderedDict的Key会按照插入的顺序排列,不是Key本身排序:

defaultdict

有如下值集合 [11,22,33,44,55,66,77,88,99,90...],将所有大于 66 的值保存至字典的第一个key中,将小于 66 的值保存至第二个key的值中。

即: {'k1': 大于66 , 'k2': 小于66}

  1. li = [11,22,33,44,55,77,88,99,90]
  2. result = {}
  3. for row in li:
  4. if row > 66:
  5. if 'key1' not in result:
  6. result['key1'] = []
  7. result['key1'].append(row)
  8. else:
  9. if 'key2' not in result:
  10. result['key2'] = []
  11. result['key2'].append(row)
  12. print(result)
  13. from collections import defaultdict

  14. values = [11, 22, 33,44,55,66,77,88,99,90]

  15. my_dict = defaultdict(list)

  16. for value in values:
  17. if value>66:
  18. my_dict['k1'].append(value)
  19. else:
  20. my_dict['k2'].append(value)

使用dict时,如果引用的Key不存在,就会抛出KeyError。如果希望key不存在时,返回一个默认值,就可以用defaultdict:

  1. >>> from collections import defaultdict
  2. >>> dd = defaultdict(lambda: 'N/A')
  3. >>> dd['key1'] = 'abc'
  4. >>> dd['key1'] # key1存在
  5. 'abc'
  6. >>> dd['key2'] # key2不存在,返回默认值
  7. 'N/A'

Counter

Counter类的目的是用来跟踪值出现的次数。它是一个无序的容器类型,以字典的键值对形式存储,其中元素作为key,其计数作为value。计数值可以是任意的Interger(包括0和负数)。Counter类和其他语言的bags或multisets很相似。

  1. c = Counter('abcdeabcdabcaba')
  2. print c
  3. 输出:Counter({'a': 5, 'b': 4, 'c': 3, 'd': 2, 'e': 1})

day13 函数模块之序列化 random 模块 os模块 sys模块 hashlib模块 collections模块的更多相关文章

  1. Python 第五篇(上):算法、自定义模块、系统标准模块(time 、datetime 、random 、OS 、sys 、hashlib 、json和pickle)

    一:算法回顾: 冒泡算法,也叫冒泡排序,其特点如下: 1.比较相邻的元素.如果第一个比第二个大,就交换他们两个. 2.对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对.在这一点,最后的元素应 ...

  2. Day5- Python基础5 模块导入、time、datetime、random、os、sys、hashlib、json&pickle

    本节目录: 1.模块的分类 2.模块的导入 3.time模块 4.datetime模块 5.random 6.os模块 7.sys模块 8.hashlib 9.json&pickle 一.模块 ...

  3. python模块(os,sys,hashlib,collections)

    列出目录下所有文件 os.listdir('dirname'):列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式返回. 创建文件夹: os.mkdir('文件夹')    创建文件夹 os ...

  4. day17——序列化、os、sys、hashlib、collections

    day17 序列化 json 两组4个方法: 1.dumps(序列化) -- loads(反序列) dumps(list):将对象转换成字符串 loads(str):将字符串转换成对象 list--s ...

  5. python 正则,os,sys,hashlib模块

    简单的小算法 random随机获取数据 import random def getrandata(num): a=[] i= while i<num: a.append(random.randi ...

  6. Python模块之time、random、os、sys、序列化、re

    Time模块 和时间有关系的我们就要用到时间模块.在使用模块之前,应该首先导入这个模块. #常用方法 1.time.sleep(secs) (线程)推迟指定的时间运行.单位为秒. 2.time.tim ...

  7. Python之常用模块(re,时间,random,os,sys,序列化模块)(Day20)

    一.时间模块 #常用方法 1.time.sleep(secs) (线程)推迟指定的时间运行.单位为秒. 2.time.time() 获取当前时间戳 在Python中表示时间的三种方式:时间戳,元组(s ...

  8. python-时间模块,random、os、sys、shutil、json和pickle模块

    一.time与datetime模块 time模块: 时间戳:表示的是从1970年1月1日00:00:00开始按秒计算的偏移量,返回类型为float类型 格式化时间字符串(Format String) ...

  9. python27期day15:自定义模块、模块导入、模块的路径、模块的查找顺序、time、datetime、random、os、sys、作业题

    1.模块的介绍: py文件就是一个模块 2.模块的分类:内置模块:python标准库 200 第三方模块 自定义模块 3.为什么学习模块? 开发效率高,内置函数和模块 减少重复代码,分文件管理,有助于 ...

随机推荐

  1. 3.9-3.10 分布式协作服务框架Zookeeper

    一.zookeeper概述 一个开源的分布式的,为分布式应用提供协调服务的Apache项目. 提供一个简单的原语集合,以便于分布式应用可以在它之上构建更高层次的同步服务. 设计非常易于编程,它使用的是 ...

  2. EJ20170430-hm

    alignment  n. 结盟; 队列,排成直线; 校直,调整; [工] 准线 aspect ratio  n. 宽高比; 纵横比,屏幕高宽比 aspect   n. 方面; thick   n.  ...

  3. Android Studio新建类头部注释和添加函数注释模板及快捷键

    一,Android Studio新建类头部注释 是不是有时候看到这个很心烦 其实Studio中有设置修改这些注释模板的信息的功能 其实很简单,只需要两步: 1.打开Setting设置面板,找到File ...

  4. P4692 [Ynoi2016]谁的梦

    传送门 分别考虑每一种颜色对答案的贡献.每种颜色的贡献就是他出现的区间个数,那么可以用总区间减去不包含它的区间个数,把每一个序列里不包含它的区间个数加起来,然后不同序列用乘法原理计算即可 于是我辛辛苦 ...

  5. 黑客攻防技术宝典web实战篇:测试后端组件习题

    猫宁!!! 参考链接:http://www.ituring.com.cn/book/885 随书答案. 1. 某网络设备提供用于执行设备配置的 Web 界面.为什么这种功能通常易于受到操作系统命令注入 ...

  6. 查看软件安装的位置 Ubuntu

    Ubuntu和windows不一样,不是所有的软件都在一个文件夹,而是不同类型的分散在不同的文件夹下 所以查找起来也是不同的 如果知道是用 apt-get install 方法安装的,可以直接用 dp ...

  7. Selenium | 基础入门

    在maven项目搭建环境: <dependency> <groupId>org.seleniumhq.selenium</groupId> <artifact ...

  8. [洛谷P2417]课程

    题目链接: 点我 题目分析: 二分图最大匹配裸题,跑完匈牙利判断\(ans\)是否等于教室数即可 多组数据请注意初始化. 代码: #include<bits/stdc++.h> #defi ...

  9. 题解报告:hdu 2141 Can you find it?(二分)

    Problem Description Give you three sequences of numbers A, B, C, then we give you a number X. Now yo ...

  10. PWA之push服务

    转载: https://www.jishux.com/p/c5735af96c39bd4a https://www.jianshu.com/p/9970a9340a2d 系列文章参考:https:// ...