在使用Python2时，我们习惯于在文件开头声明编码

# coding: utf-8

不然在文件中出现中文，运行时就会报错 SyntaxError: Non-ASCII character... 之类，这是因为python2的文件编码默认使用的ascii，ascii码是不支持中文的。

如果在开头声明了编码，文件编码就会变为utf-8。

python执行过程的编解码

python使用的unicode类型作为编码的基础类型，默认情况下，python在执行文件过程中的编解码为 str-->unicode-->str，当我们在python开头声明utf-8编码后，编解码就变为了 str-->ascii-->str

举个简单例子，就可以验证这个现象。

# coding:utf-8

s = "我要学Python"

print(1, s)

从打印结果可以看出，我们没有做任何处理，中文在执行过程就被处理成了ascii码

encode&decode

在了解了Python执行过程的编码转换后，那我们自己如果转换编码该如何实现呢？这里就得使用两个内置方法 encode编码和decode解码。

例如：

# coding:utf-8

s = "我要学Python"

s.encode("utf-8")   # 编码

s.decode("utf-8")   # 解码

上面是方法的简单运用，但是执行上面代码，第3行就会出现编解码过程中常见的一个报错

UnicodeDecodeError: 'ascii' codec can't decode byte 0xe6 in position 0: ordinal not in range(128)

简单分析下，明明执行的encode方法，为什么会抛decode错误呢？这就要从上面介绍的python执行过程来分析了。

在执行encode方法编码时，python先要解码，而Python解码默认用unicode格式，而文件开头指定的编码格式为ascii，这就导致编码格式与解码格式不一致，从而产生了报错 ascii 不能解码成 unicode。

要解决这个问题，只需要在编码前，用utf-8格式解码就可以了

s = "我要学Python"

s.decode("utf-8").encode("utf-8")   # 编码

s.decode("utf-8")   # 解码

中文乱码解决方法

在了解编解码过程后，我们来解决实际遇到的问题：接口响应中文乱码！

比如：在接口测试中，有些响应类似 "\u9875\u9762\u4e0d\u5b58\u5728" 的响应内容，看起来就像乱码

注意看乱码前面有个u ，这表示使用的unicode编码字符。可用以下方法进行解码：

# 直接在 unicode 字符串前加u  ===> 使用Python机制自动解码

s = u"\u9875\u9762\u4e0d\u5b58\u5728"

print(s)   # 打印：页面不存在。因为字符串为unicode编码格式，python在执行过程中，默认就是使用的unicode解码，编解码类型一致，就看到了中文打印内容

# 使用 decode 方法解码成中文 ===> 主动解码

s = "\u9875\u9762\u4e0d\u5b58\u5728"

print(s.decode("unicode_escape"))

常见问题

格式化带有中文的字符串报错

格式拼接的字符串包含中文，会抛错：UnicodeDecodeError: 'ascii' codec can't decode byte 0xe5 in position 0: ordinal not in range(128)

# coding:utf-8

s = "\u9875\u9762\u4e0d\u5b58\u5728"

# 拼接的字符串 不包含 中文字符===>正常

print("result: %s" % s.decode("unicode_escape"))

# 拼接的字符串 包含 中文字符串===>异常

print("结果： %s" % s.decode("unicode_escape"))

问题分析：

解决方法：

统一编码格式

# coding:utf-8

s = "\u9875\u9762\u4e0d\u5b58\u5728"

# 方法1：将右边变为 ascii 编码

print("结果:%s" % s.decode("unicode_escape").encode("utf-8"))

# 方法2：将左边变为 unicode 编码

print(u"结果:%s" % s.decode("unicode_escape"))

带有中文的字符串反转后乱码

带有中文的字符串使用列表反转方式后乱码，使用decode("utf-8") 解码，报错：UnicodeDecodeError: 'utf8' codec can't decode byte 0xa0 in position 0: invalid start byte

# coding:utf-8

s = "qta_baseline_test_勿删"[::-1]

print(s)

print(s.decode("utf-8"))

问题分析：

中文被Python解析后，先转换成ascii码

当使用列表反转方式后，实际把ascii反转

这就导致了反转后的乱码无法被decode("utf-8")正常解码

解决方法：

因为采用的utf-8编码，所以先使用utf-8解码，解码后再反转

# coding:utf-8

s = "qta_baseline_test_勿删"[::-1]

print(s)

s = "qta_baseline_test_勿删".decode("utf-8")[::-1]

print(s)

s = s.encode("utf-8")       # 为了后续字符串能正常使用，建议在按原编码方式编码

print(s)

Python_关于python2的encode（编码）和decode（解码）的使用的更多相关文章

python编码问题 decode与encode
参考: http://www.jb51.net/article/17560.htm 如果要在python2的py文件里面写中文,则必须要添加一行声明文件编码的注释,否则python2会默认使用ASCI ...
pyhton字符编码问题--decode和encode方法
1 decode和encode方法字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成uni ...
python2.x 默认编码问题
python2.x中处理中文,是一件头疼的事情.网上写这方面的文章,测次不齐,而且都会有点错误,所以在这里打算自己总结一篇文章. 我也会在以后学习中,不断的修改此篇博客. 这里假设读者已有与编码相关的 ...
Python2.7字符编码详解
目录 Python2.7字符编码详解声明一. 字符编码基础 1.1 抽象字符清单(ACR) 1.2 已编码字符集(CCS) 1.3 字符编码格式(CEF) 1.3.1 ASCII(初创) 1.3. ...
一篇文章助你理解Python2中字符串编码问题
前几天给大家介绍了unicode编码和utf-8编码的理论知识,没来得及上车的小伙伴们可以戳这篇文章:浅谈unicode编码和utf-8编码的关系.下面在Python2环境中进行代码演示,分别Wind ...
python2和python3编码问题
欢迎加入python学习交流群 667279387 一.什么是编解码 1.什么是unicode 2.编码方式二.python中的编解码 1.python2 (1).encode() 和 .decod ...
在python2中的编码
在python2中的编码 #_author:star#date:2019/10/29'''字符编码:ASCII:只能存英文和拉丁字符,gb2312:只能6700中文,1980年gbk1.0:存了200 ...
Python2 和 Python3 编码问题
基本存储单元位(bit, b):二进制数中的一个数位,可以是0或者1,是计算机中数据的最小单位. 字节(Byte,B):计算机中数据的基本单位,每8位组成一个字节. 1B = 8b 各种信息在计算机 ...
javascript处理HTML的Encode(转码)和Decode(解码)总结
HTML的Encode(转码)和解码(Decode)在平时的开发中也是经常要处理的,在这里总结了使用javascript处理HTML的Encode(转码)和解码(Decode)的常用方式一.用浏览器 ...

随机推荐

时间同步之pxe，cobbler,dhcp
ntpdate 时间同步同步方法 ntpdate ntp服务器IP 例: ntpdate 192.168.37.11 自动运行同步时间脚本 crontab -e * */1 * * * /usr/s ...
【Linux】【Services】【SaaS】Docker+kubernetes（2. 配置NTP服务chrony）
1. 简介 1.1. 这次使用另外一个轻量级的NTP服务,chrony.这是openstack推荐使用的ntp服务. 1.2. 官方网站:https://chrony.tuxfamily.org/ 2 ...
【Service】【Database】【Cache】Redis
1. 简介: 1.1. redis == REmote DIctionary Server 1.2. KV cache and store, in-memory, 持久化,主从(sentinel实现一 ...
Windows10常用快捷键+cmd常见命令码
Windows10常用快捷键+cmd常见命令码 1.Ctrl快捷键 Ctrl+C: 复制 Ctrl+V: 粘贴 Ctrl+A: 全选内容 Ctrl+S: 保存 Ctrl+X: 剪切 Ctrl+Z: 撤 ...
Table.FirstN保留前面N….First…（Power Query 之 M 语言）
数据源: "姓名""基数""个人比例""个人缴纳""公司比例""公司缴纳"&qu ...
Vue中this.$router.push（参数）实现页面跳转
很多情况下,我们在执行点击按钮跳转页面之前还会执行一系列方法,这时可以使用 this.$router.push(location) 来修改 url,完成跳转. push 后面可以是对象,也可以是字符串 ...
🏆【CI/CD技术专题】「Docker实战系列」（1）本地进行生成镜像以及标签Tag推送到DockerHub
背景介绍 Docker镜像构建成功后,只要有docker环境就可以使用,但必须将镜像推送到Docker Hub上去.创建的镜像最好要符合Docker Hub的tag要求,因为在Docker Hub注册 ...
[源码解析] PyTorch 分布式之弹性训练(1) --- 总体思路
[源码解析] PyTorch 分布式之弹性训练(1) --- 总体思路目录 [源码解析] PyTorch 分布式之弹性训练(1) --- 总体思路 0x00 摘要 0x01 痛点 0x02 难点 0 ...
UVA11951 Area 题解
Content 小 S 想买下一块地.他所在的城市可以看成一个 $n\times m$ 的网格,要购买所处在 $(i,j)$ 的网格需要缴税 $c_{i,j}$ 元,如果一块地里面有多个网 ...
ViewModel的创建
ViewModel的创建 ViewModel本身只是ViewModel这个类的子类: class MainViewModel: ViewModel() { } 在屏幕旋转UI重建的时候, 它是如何拥有 ...

Python_关于python2的encode（编码）和decode（解码）的使用