本文分享知识:

  1. pandas读取Excel数据 read_excel()
  2. 使用Python的加密库 hashlib
  3. pandas中map方法使用
  4. pandas写入Excel数据 to_excel()

项目源码地址:https://gitee.com/myrensheng/encryption

我这里有一份客户的Excel数据,里面有客户的手机号和身份证号信息,这些信息不能泄露,你加密一下发给我。

面对经理紧急安排的任务,小凡不敢懈怠,暂时放下手中正在处理的任务,将精力集中到数据加密这件事情上。

小凡思考了一会,数据加密,常用的加密算法有:md5和sha,既然没有要求,那就选择最简单的md5加密吧。

不一会,小凡脑海中就构思出了两种解决办法:

1、在Excel中调用md5加密函数,但这个需要安装加密文件,时间上可能来不及

2、用Python中的加密库,只需要读取Excel中的数据,再将加密好的数据导出为Excel即可

经过慎重的考虑,小凡决定使用Python进行数据加密。

一、用 pandas 读取 Excel 数据

import pandas as pd
# Excel文件
excel_path = "./test.xlsx"
# pandas读取Excel数据,并保存到 df 变量中
df = pd.read_excel(excel_path)
# 随机查看5条数据
df.sample(5)

read_excel() 常用参数:

io:excel文件地址

sheet_name:默认为第一个表格

header:头部(列名)从第几行开始,默认第一行

除了用pandas还可以用xlrd库读取Excel,xlwt将数据写入Excel,详情请看:第三章内容

二、加密库 hashlib

获取到数据后,开始加密。我们先学习一下如何使用加密库hashlib,加密一个客户的身份证号?

import hashlib
# 加密的字符串
string = "730763747019734357"
# 字符串进行 utf-8 编码
utf_8_str = str(string).encode("utf8")
# 调用 hashlib.md5() 方法进行加密
encry_result = hashlib.md5(utf_8_str).hexdigest()
encry_result
# 'f29e8eb231261735b849ad248ff50573'

这样就把一个字符串用 md5 的方法加密完成啦。让我们稍微修饰一下,编写一个加密的函数。

def encryption_str(string, encry_model="md5_32", encry_style=True):
# 加密为 utf-8 编码
utf_8_str = str(string).encode("utf8")
# 函数字典
param_dict = {
"md5_32": hashlib.md5(utf_8_str),
"md5_16": hashlib.md5(utf_8_str),
"sha1": hashlib.sha1(utf_8_str),
"sha224": hashlib.sha224(utf_8_str),
"sha256": hashlib.sha256(utf_8_str),
"sha512": hashlib.sha512(utf_8_str)
}
encry_result = param_dict[encry_model].hexdigest()
if encry_model == 'md5_16':
encry_result = encry_result[8:-8]
# 返回结果
return encry_result if encry_style == "小写" else encry_result.upper()

嗯,只是稍微修改一下。

三、 pandas中的 map() 方法

现在有1000多条数据,怎样才能将这么多的数据一次性加密完成呢?

这就需要用到 map() 方法:

pandas.series.map(arg,na_action=None),arg为一个函数,将series中的每一个数据作为arg函数的参数

经常与 lambda 函数连用,即:

df[“列名”].map(lambda x:func(x))

表示将该列的每一个数据 x,传递给 func(),并把函数的返回值组成新的列

df["手机号_md5"] = df["手机号"].map(lambda x:encryption_str(x))
df["身份证号_md5"] = df["身份证号"].map(lambda x:encryption_str(x))
df.sample(5)

数据已经加密完成啦,接下来就把数据重新保存为 Excel 发给经理。

pandas.DataFrame.to_excel() 常用参数:

sheet_name:工作表名,默认为 sheet1

index:是否输入索引,默认为 True

# 将数据保存到新的 excel 中
df.to_excel("./客户数据_md5加密.xlsx")

整个过程耗时15分钟,小凡检查了一下加密后的数据,确定没有问题,便将Excel发给经理。

见经理一直没有回消息,小凡继续做着先前的数据报告。

四、数据加密工具

过了一会,经理过来啦。

做的很好,能告诉我怎么做的吗?经理问。

小凡将自己如何用Python加密数据的步骤讲给经理听,但是经理好像听不太懂。

有没有什么工具,直接就将excel数据加密完成,不用写代码?经理期待的问到。

没有吧,网上的工具都只能加密一个字符串,没有直接加密excel文件的工具。不过,有什么是Python不能实现的呢?

小凡将自己如何用Python加密数据的步骤讲给经理听,但是经理好像听不太懂。

有没有什么工具,直接就将excel数据加密完成,不用写代码?经理期待的问到。

没有吧,网上的工具都只能加密一个字符串,没有直接加密excel文件的工具。不过,有什么是Python不能实现的呢?

于是,小凡决定用Python做个加密工具,这样操作起来就很方便啦。

用Python中的hashlib实现md5和sha加密的更多相关文章

  1. Java的单向加密算法MD5和SHA——加密和解密

    出自:http://www.cnblogs.com/onetwo/p/3875551.html 1.JDK中MD5和SHA加密的主要类 在JDK6.0中,与MD5与SHA密切相关的几个类的类图如下:  ...

  2. JAVA加密技术-----MD5 与SHA 加密

    关于JAVA的加密技术有很多很多,这里只介绍加密技术的两种 MD5与 SHA. MD5与SHA是单向加密算法,也就是说加密后不能解密. MD5 ---信息摘要算法,广泛用于加密与解密技术,常用于文件校 ...

  3. MD5和SHA加密实现

    @Test public void TestMD5AndSHA() throws NoSuchAlgorithmException { String MD5=Md5("123456" ...

  4. python中常用的base64 md5 aes des crc32等的加密解密

    1.base64 Python内置的base64模块可以实现base64.base32.base16.base85.urlsafe_base64的编码解码,python 3.x通常输入输出都是二进制形 ...

  5. 【Python】使用hashlib进行MD5和sha1摘要计算

    代码: import hashlib hash = hashlib.md5() hash.update('http://www.cnblogs.com/xiandedanteng'.encode('u ...

  6. Python中使用hashlib进行加密的简单使用

    import hashlib ''' 原文= '字符串' 哈希加密对象 = hashlib.加密算法( 原文.encode('utf-8') ) 密文 = 哈希加密对象.hexdigest() #密文 ...

  7. DES,AeS加解密,MD5,SHA加密

    1.DES一共就有4个参数参与运作:明文.密文.密钥.向量.其中这4者的关系可以理解为: 密文=明文+密钥+向量: 明文=密文-密钥-向量: 为什么要向量这个参数呢?因为如果有一篇文章,有几个词重复, ...

  8. MD5、sha加密

    MD5: 不可逆,一般用于密码的加密存储,数字签名,文件完整性验证 MD5码具有高度离散性,不可预测 MD5长度为128位,重复率几乎为0 易受密码分析的攻击 Sha: 对于长度小于2^64位的消息, ...

  9. python 模块之hashlib

    Hashlib模块 Python里面的hashlib模块提供了很多加密的算法,这里介绍一下hashlib的简单使用事例,用hashlib的md5算法加密数据,其他的所有加密算法使用方式上基本类似. h ...

  10. 加密算法中BASE64、MD5、SHA、HMAC等之间的区别

    http://blog.csdn.net/lplj717/article/details/51828692 根据项目需要了解了一下几种加密算法(参考其他博客),内容简要介绍BASE64.MD5.SHA ...

随机推荐

  1. shell语法3-expr命令、read命令、echo命令

    一.expr命令(注:常常配合``或者$()来取得所求的值) 1.expr用于求表达式的值:expr 表达式 注意: (1)用空格隔开每一项(2)用反斜杠放在shell特定的字符前面(发现表达式运行错 ...

  2. Pyqtgraph入门

    一.介绍 1.1 什么是pyqtgraph? PyQtGraph是Python的图形和用户界面库,它充分利用PyQt和PtSide的高质量的图形表现水平和NumPy的快速科学计算与处理能力,在数学.科 ...

  3. ES-分页查询

    从一个分页问题开始 做分页查询,当分页达到一定量的时候,报如下错误 Result window is too large, from + size must be less than or equal ...

  4. 直播平台制作,Android 悬浮窗延时5秒返回APP问题

    直播平台制作,Android 悬浮窗延时5秒返回APP问题 案例需求分析:在APP界面,点击Home键后,APP退出后台,同时会打开一个悬浮窗,当用户点击悬浮窗上的按键会返回APP. 出现的问题是:点 ...

  5. POD状态整理(持续更新)

    pendding Pod一直停留在Pending状态,可能表示,该Pod不能被调度到某一个节点上------我遇到的一个情况确实是这样的,因为我要mount的卷是在worker1上的,由于pod运行时 ...

  6. LeNet,AlexNet,VGG,GoogLeNet

    卷积神经网络-LeNet 理解channel:卷积操作完成后输出的 out_channels ,取决于卷积核的数量.此时的 out_channels 也会作为下一次卷积时的卷积核的 in_channe ...

  7. Python 常见报错类型整理(一)

    很多初学者会遇到很多奇奇怪怪的报错信息,在这里,我为大家已经准备好一部分报错信息的分析以及解决办法. 一.TypeError:类型错误,对象用来表示值的类型非预期类型时发生的错误 错误例子: age= ...

  8. 230219 Business 1-30

    1: Packing for a Business TripWhat should I bring on this business trip?Haven't you been on a busine ...

  9. debian11 配置samba服务 linuxsys

    一.安装软件包 sudo apt -y install samba samba-common 二.linux系统添加samba需要用的账户,创建需要共享的文件夹,并配置好权限.(注意共享文件夹最好不要 ...

  10. vue 定时器 定时刷新页面 定时请求接口

    data(){ return{ intervalId:null, } }, methods:{ // 定时刷新数据函数 dataRefreh() { // 计时器正在进行中,退出函数 if (this ...