Python与常见加密方式

前言

数据加密与解密通常是为了保证数据在传输过程中的安全性，自古以来就一直存在，古代主要应用在战争领域，战争中会有很多情报信息要传递，这些重要的信息都会经过加密，在发送到对应的人手上。

现代，在网络发展初期，网络的数据安全性是没有被足够的重视的。事实上，当时为了实现数据可以通过网络进行传输已经耗费了科学家大部分脑细胞，因此在TCP/IP协议设计的初期，他们也实在没有太多精力去过多考虑数据在网络传输过程中可能存在的安全性问题。随着TCP/IP协议及相关技术的日渐成熟，网络数据传输技术越来越稳定，人们才慢慢开始重视这个问题。

1. 什么是加密解密？

“加密”的过程，就是把“明文”变成“密文”的过程；反之，“解密”的过程，就是把“密文”变为“明文”。在这两个过程中，都需要一个关键的东西——叫做“密钥”——来参与数学运算。

加密与解密函数的参数都要求是字节对象，在python中也就是我们的Bytes对象

Python 3.x中的str是字符串，使用python3进行加密与解密操作的时候，要确保我们操作的数据是Bytes

字符串和Bytes互相转换可以使用encode()和decode()方法。

注：两位十六进制常常用来显示一个二进制字节。

利用binascii模块可以将十六进制显示的字节转换成我们在加解密中更常用的显示方式：

In [1]: import binascii

In [2]: '测试'.encode()
Out[2]: b'\xe6\xb5\x8b\xe8\xaf\x95'

In [3]: binascii.b2a_hex('测试'.encode()) 
Out[3]: b'e6b58be8af95'

In [4]: binascii.a2b_hex(b'e6b58be8af95')
Out[4]: b'\xe6\xb5\x8b\xe8\xaf\x95'

In [5]: binascii.a2b_hex(b'e6b58be8af95').decode()
Out[5]: '测试'

计算机使用的存储单位

位(bit) 计算机使用的最小单位，用来存放二进制数

字节(Byte) 计算机最常用的基本单位，一个字节有八位（1Byte = 8 bit）

KB( K字节) 1K = 1024 Byte
MB(兆字节 ) 1M = 1024K
GB(吉字节 ) 1G = 1204M
TB（太字节） 1T = 1024G

网络信息安全涉及到很多个方面，其中主要有三个要解决的问题：

保密性(Confidentiality)：信息在传输时不被泄露
完整性（Integrity）：信息在传输时不被篡改
有效性（Availability）：信息的使用者是合法的

针对以上几个问题，可以用以下几种数据加密方式来解决（每种数据加密方式又有多种不同的算法实现）：

数据加密方式	描述	主要解决的问题	常用算法
对称加密	指数据加密和解密使用相同的密钥	数据的机密性	DES, AES
非对称加密	也叫公钥加密，指数据加密和解密使用不同的密钥--密钥对儿	身份验证	DSA，RSA
单向加密	指只能加密数据，而不能解密数据	数据的完整性	MD5，SHA系列算法

单向加密

1. 简介

单向加密是指只能对明文数据进行加密，而不能解密数据。

举个栗子：每个人都有不同的指纹，看到这个人，可以得出他的指纹等信息，并且唯一对应，但你只看一个指纹，是不可能看到或读到这个人的长相或身份等信息。

主要功能：

通常用于保证数据的完整性。

常用的算法实现：

MD5： 128bits
SHA： SHA1(160bits), SHA224, SHA256, SHA384

特点：

不可逆：无法根据数据指纹/特征码还原原来的数据。
容易计算：从原数据计算出MD5值很容易。
抗修改性：对原数据进行任何改动，哪怕只修改1个字节，所得到的MD5值都有很大区别。
定长输出：任意长度的数据，算出的MD5值长度都是固定的。

2. Python的MD5， SHA系列使用

由于MD5模块在python3中被移除，在python3中使用hashlib模块进行md5操作

import hashlib

# 待加密信息
str = '这是一个测试'

# 创建md5对象， sha系列把md5换成sha系列的名字就可以了
hl = hashlib.md5()

hl.update(str.encode())

print('MD5加密前为 ：' + str)
print('MD5加密后为 ：' + hl.hexdigest())

运行结果

MD5加密前为 ：这是一个测试
MD5加密后为 ：cfca700b9e09cf664f3ae80733274d9f

MD5长度

md5的长度，默认为128bit，也就是128个0和1的二进制串。这样表达是很不友好的。所以将二进制转成了16进制，每4个bit表示一个16进制，所以128/4 = 32 换成16进制表示后，为32位了。

2. 对称加密

1.简介

对称加密是指数据加密与解密使用相同的密钥。

主要功能：

通常用于保证数据的机密性。

常用的算法实现：

DES： Data Encryption Standard，秘钥长度为56位，2003年左右被破解--秘钥可以暴力破解。
3DES： DES的改进版本。
AES： Advanced Encryption Standard，支持的秘钥长度包括 128bits，192bits，258bits，384bits，512bits。

需要说明的是，秘钥长度越长，数据加密与解密的时间就越久。

特点：

加密与解密使用的密钥相同。
但是由于算法一般都是公开的，因此机密性几乎完全依赖于密钥。
通常使用的是相对较小的密钥，一般小于256bit。因为密钥越大，加密越强，但加密与解密的过程越慢。

2. python中的使用

PyCrypto是 Python 中密码学方面最有名的第三方软件包。可惜的是，它的开发工作于2012年就已停止。

幸运的是，有一个该项目的分支PyCrytodome 取代了 PyCrypto 。

PyCrypto文档： https://pycryptodome.readthedocs.io/en/latest/src/introduction.html

安装与导入

Windows安装之前需要先安装Microsoft Visual c++ 2015。

在Linux上安装，可以使用以下 pip 命令：

pip install pycryptodome

导入：

import Crypto

在Windows 系统上安装则稍有不同：

pip install pycryptodomex

导入：

import Cryptodome

DES

简介

DES算法为密码体制中的对称密码体制，又被称为美国数据加密标准。

DES是一个分组加密算法，典型的DES以64位为分组对数据加密，加密和解密用的是同一个算法。

DES算法的入口参数有三个：Key、Data、Mode。其中Key为8个字节共64位，是DES算法的工作密钥；Data为8个字节64位，是要被加密或被解密的数据；Mode为DES的工作方式,有两种:加密或解密。

密钥长64位，密钥事实上是56位参与DES运算（第8、16、24、32、40、48、56、64位是校验位，使得每个密钥都有奇数个1），对64位二进制数据块进行加密，分组后的明文组和56位的密钥按位替代或交换的方法形成密文组。每次加密对64位的输入数据进行16轮编码，经过一系列替换和移位后转换成完全不同的64位输出数据。

例子

# 导入DES模块
from Cryptodome.Cipher import DES
import binascii

# 这是密钥
key = b'abcdefgh'
# 需要去生成一个DES对象
des = DES.new(key, DES.MODE_ECB)
# 需要加密的数据
text = 'python spider!'
text = text + (8 - (len(text) % 8)) * '='

# 加密的过程
encrypto_text = des.encrypt(text.encode())
print(encrypto_text)
print(binascii.b2a_hex(encrypto_text))

#解密的过程
decrypt_text = des.decrypt(encrypto_text)
print(decrypt_text)

3DES

简介

3DES（或称为Triple DES）是三重数据加密算法（TDEA，Triple Data Encryption Algorithm）块密码的通称。它相当于是对每个数据块应用三次DES加密算法。

由于计算机运算能力的增强，原版DES密码的密钥长度变得容易被暴力破解。3DES即是设计用来提供一种相对简单的方法，即通过增加DES的密钥长度来避免类似的攻击，而不是设计一种全新的块密码算法。

3DES（即Triple DES）是DES向AES过渡的加密算法（1999年，NIST将3-DES指定为过渡的加密标准），加密算法，其具体实现如下：设Ek()和Dk()代表DES算法的加密和解密过程，K代表DES算法使用的密钥，M代表明文，C代表密文，这样：

3DES加密过程为：C=Ek3(Dk2(Ek1(M)))

3DES解密过程为：M=Dk1(EK2(Dk3(C)))

AES

简介

高级加密标准（英语：Advanced Encryption Standard，缩写：AES），在密码学中又称Rijndael加密法，是美国联邦政府采用的一种区块加密标准。这个标准用来替代原先的DES，已经被多方分析且广为全世界所使用。经过五年的甄选流程，高级加密标准由美国国家标准与技术研究院（NIST）于2001年11月26日发布于FIPS PUB 197，并在2002年5月26日成为有效的标准。2006年，高级加密标准已然成为对称密钥加密中最流行的算法之一。

AES在软件及硬件上都能快速地加解密，相对来说较易于实作，且只需要很少的存储器。作为一个新的加密标准，目前正被部署应用到更广大的范围。

特点与思想

抵抗所有已知的攻击。
在多个平台上速度快，编码紧凑。
设计简单。

详解

AES为分组密码，分组密码也就是把明文分成一组一组的，每组长度相等，每次加密一组数据，直到加密完整个明文。在AES标准规范中，分组长度只能是128位，也就是说，每个分组为16个字节（每个字节8位）。密钥的长度可以使用128位、192位或256位。密钥的长度不同，推荐加密轮数也不同。

一般常用的是128位

例子

from Cryptodome.Cipher import AES

from Cryptodome import Random

from binascii import b2a_hex  

# 要加密的明文

data = '测试数据'

# 密钥key 长度必须为16（AES-128）、24（AES-192）、或32（AES-256）Bytes 长度.

# 目前AES-128足够用

key = b'this is a 16 key'

# 生成长度等于AES块大小的不可重复的密钥向量

iv = Random.new().read(AES.block_size)

# 使用key和iv初始化AES对象, 使用MODE_CFB模式

mycipher = AES.new(key, AES.MODE_CFB, iv)

# 加密的明文长度必须为16的倍数，如果长度不为16的倍数，则需要补足为16的倍数

# 将iv（密钥向量）加到加密的密文开头，一起传输

ciphertext = iv + mycipher.encrypt(data.encode())

# 解密的话要用key和iv生成新的AES对象

mydecrypt = AES.new(key, AES.MODE_CFB, ciphertext[:16])

# 使用新生成的AES对象，将加密的密文解密

decrypttext = mydecrypt.decrypt(ciphertext[16:])

print('密钥k为：', key)

print('iv为：', b2a_hex(ciphertext)[:16])

print('加密后数据为：', b2a_hex(ciphertext)[16:])

print('解密后数据为：', decrypttext.decode())

运行结果：

密钥k为： b'this is a 16 key'

iv为： b'3020aad2165cc917'

加密后数据为： b'25bd855fc0caca2a5f9f34dff175a36ade881337'

解密后数据为： 测试数据

3. 非对称加密（也叫公钥加密）

1.简介

指的是加密和解密使用不同的秘钥。

一把作为公开的公钥，另一把作为私钥。这对密钥中的公钥进行加密，私钥用于解密。反之亦然（被私钥加密的数据也可以被公钥解密) 。

在实际使用中私钥一般保存在发布者手中，是私有的不对外公开的，只将公钥对外公布，就能实现只有私钥的持有者才能将数据解密的方法。这种加密方式安全系数很高，因为它不用将解密的密钥进行传递，从而没有密钥在传递过程中被截获的风险，而破解密文几乎又是不可能的。

但是算法的效率低，所以常用于很重要数据的加密，常和对称配合使用，使用非对称加密的密钥去加密对称加密的密钥。

事实上，公钥加密算法很少用于数据加密，它通常只是用来做身份认证，因为它的密钥太长，加密速度太慢--公钥加密算法的速度甚至比对称加密算法的速度慢上3个数量级（1000倍）。

主要作用：

通常用于保证身份验证。

常用的公钥加密算法有：

RSA： 可以实现数字签名和数据加密
DSA： 只能实现数字签名，不能实现数据加密

特点：

加密与解密使用的不同的密钥。
实际上它所使用的密钥是一对儿，一个叫公钥，一个叫私钥。这对密钥不是独立的，公钥是从私钥中提炼出来，因此私钥是很长的，968位、1024位、2048位、4096位的都有。
通常公钥是公开的，所有人都可以得到；私钥是不能公开的，只有自己才有。
用公钥机密的内容只能用与之对应的私钥才能解密，反之亦然。

2.python中的使用

RSA

RSA公钥加密算法是1977年由罗纳德·李维斯特（Ron Rivest）、阿迪·萨莫尔（Adi Shamir）和伦纳德·阿德曼（Leonard Adleman）一起提出的。RSA就是他们三人姓氏开头字母拼在一起组成的。 RSA是目前最有影响力的公钥加密算法，它能够抵抗到目前为止已知的绝大多数密码攻击，RSA算法基于一个十分简单的数论事实：将两个大质数相乘十分容易，但是想要对其乘积进行因式分解却极其困难，因此可以将乘积公开作为加密密钥。

首先我们需要安装一个rsa模块：

pip install rsa

而且，因为RSA加密算法的特性，RSA的公钥私钥都是10进制的，但公钥的值常常保存为16进制的格式，所以需要将其用int()方法转换为10进制格式。

用网页中的公钥把数据加密

import rsa

import binascii

# 使用网页中获得的n和e值，将明文加密

def rsa_encrypt(rsa_n, rsa_e, message):

    # 用n值和e值生成公钥

    key = rsa.PublicKey(rsa_n, rsa_e)

    # 用公钥把明文加密

    message = rsa.encrypt(message.encode(), key)

    # 转化成常用的可读性高的十六进制

    message = binascii.b2a_hex(message)

    # 将加密结果转化回字符串并返回

    return message.decode()

# RSA的公钥有两个值n和e，我们在网站中获得的公钥一般就是这样的两个值。

# n常常为长度为256的十六进制字符串

# e常常为十六进制‘10001’

pubkey_n = '8d7e6949d411ce14d7d233d7160f5b2cc753930caba4d5ad24f923a505253b9c39b09a059732250e56c594d735077cfcb0c3508e9f544f101bdf7e97fe1b0d97f273468264b8b24caaa2a90cd9708a417c51cf8ba35444d37c514a0490441a773ccb121034f29748763c6c4f76eb0303559c57071fd89234d140c8bb965f9725'

pubkey_e = '10001'

# 需要将十六进制转换成十进制

rsa_n = int(pubkey_n, 16)

rsa_e = int(pubkey_e, 16)

# 要加密的明文

message = '测试数据'

print("公钥n值长度：", len(pubkey_n))

print(rsa_encrypt(rsa_n, rsa_e, message))

运行结果：

公钥n值长度： 256

7b2ab6bffebc258c9ad577fed797868c5321a919b817e7f4fbf0f67ba450ace6cd4d9574345912226d1875dab7f0c973b3c442fc12fe5f1b71f8be3dccd071f8ca91c4dac7da046bba8461b7c88b5c8acfb4995650746aa3f5e241f5c97aafc46f5da222b41a7883aaa54457d9e47b62428fab94dc093bd840ba2454477143ad

作业

将AES和RSA的加密过程通过面向对象的方式写成一个类，封装起来。

只需要传入一些参数就可以进行加密。

python爬虫基础06-常见加密算法的更多相关文章

python爬虫-基础入门-python爬虫突破封锁
python爬虫-基础入门-python爬虫突破封锁 >> 相关概念 >> request概念:是从客户端向服务器发出请求,包括用户提交的信息及客户端的一些信息.客户端可通过H ...
Python爬虫基础
前言 Python非常适合用来开发网页爬虫,理由如下: 1.抓取网页本身的接口相比与其他静态编程语言,如java,c#,c++,python抓取网页文档的接口更简洁:相比其他动态脚本语言,如perl ...
python爬虫-基础入门-爬取整个网站《3》
python爬虫-基础入门-爬取整个网站<3> 描述: 前两章粗略的讲述了python2.python3爬取整个网站,这章节简单的记录一下python2.python3的区别 python ...
python爬虫-基础入门-爬取整个网站《2》
python爬虫-基础入门-爬取整个网站<2> 描述: 开场白已在<python爬虫-基础入门-爬取整个网站<1>>中描述过了,这里不在描述,只附上 python3 ...
python爬虫-基础入门-爬取整个网站《1》
python爬虫-基础入门-爬取整个网站<1> 描述: 使用环境:python2.7.15 ,开发工具:pycharm,现爬取一个网站页面(http://www.baidu.com)所有数 ...
python爬虫的一个常见简单js反爬
python爬虫的一个常见简单js反爬我们在写爬虫是遇到最多的应该就是js反爬了,今天分享一个比较常见的js反爬,这个我已经在多个网站上见到过了. 我把js反爬分为参数由js加密生成和js生成coo ...
【学习笔记】第二章 python安全编程基础---python爬虫基础（urllib）
一.爬虫基础 1.爬虫概念网络爬虫(又称为网页蜘蛛),是一种按照一定的规则,自动地抓取万维网信息的程序或脚本.用爬虫最大的好出是批量且自动化得获取和处理信息.对于宏观或微观的情况都可以多一个侧面去了 ...
Python爬虫基础之认识爬虫
一.前言爬虫Spider什么的,老早就听别人说过,感觉挺高大上的东西,爬网页,爬链接~~~dos黑屏的数据刷刷刷不断地往上冒,看着就爽,漂亮的校花照片,音乐网站的歌曲,笑话.段子应有尽有,全部都过来 ...
python 爬虫基础知识一
网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本. 网络爬虫必备知识点 1. Python基础知识2. P ...

随机推荐

slice方法可以将“类似数组的对象”变成真正的数组（遇到时候再研究一次）
典型的“类似数组的对象”是函数的arguments对象,以及大多数 DOM 元素集,还有字符串. // arguments对象 function args() { return arguments } ...
layui 单选框选中事件
<div class="layui-form-item" pane=""> <label class="layui-form-lab ...
python模块之struct
# #********struct模块********# # 1.按照指定格式将Python数据转换为字符串,该字符串为字节流,如网络传输时, # 不能传输int,此时先将int转化为字节流,然后再发 ...
__str__,__repr__,__format__
__str__,__repr__ __str__:控制返回值,并且返回值必须是str类型,否则报错 __repr__:控制返回值并且返回值必须是str类型,否则报错 __repr__是__str__的 ...
最大xor,and,or
http://210.33.19.103/contest/998 and,or部分并不用01trie,题目&题解:https://blog.csdn.net/dreaming__ldx/ar ...
Longest Palindromic Substring笔记
这是一道在leetcode上看到的题目一开始,我能想到的思路是蛮力法: 就遍历每个字符,然后对每个字符都尝试从1到n的长度,看有没有回文串,并记录以该字符起始的回文串的最大长度.这个思路其实没有上手 ...
Unity Shader入门精要学习笔记 - 第15章使用噪声
转载自冯乐乐的 <Unity Shader 入门精要> 消融效果消融效果常见于游戏中的角色死亡.地图烧毁等效果.这这些效果中,消融往往从不同的区域开始,并向看似随机的方向扩张,最后整个 ...
CSS3在hover下的几种效果
CSS3在hover下的几种效果代码分享,CSS3在鼠标经过时的几种效果集锦效果一:360°旋转修改rotate(旋转度数) * { transition:All 0.4s ease-in-out ...
ubuntu 下 docker安装
1移除以前安装docker sudo apt-get remove docker docker-engine docker-ce docker.io 2 安装包以允许apt通过HTTPS使用存储库 s ...
[转]如何降低SQL Server 内存使用率
我的数据库服务器内存为8G,现在资源管理器显示内存用到5G,可以肯定是sql server数据库吃内存原因. MSSQL占用了太多的内存,而且还不断的增长:或者说已经设置了使用内存,可是它没有用到那么 ...

python爬虫基础06-常见加密算法

Python与常见加密方式

前言

1. 什么是加密解密？

单向加密

1. 简介

2. Python的MD5， SHA系列使用

2. 对称加密

1.简介

2. python中的使用

DES

3DES

AES

3. 非对称加密（也叫公钥加密）

1.简介

2.python中的使用

RSA

作业

python爬虫基础06-常见加密算法的更多相关文章

随机推荐

热门专题