python2和python3的编码encode解码decode函数

python比较坑的一个点；意义完全变了的两个函数

首先常用的编码方式有3种，utf-8: 常用的传输和存储格式，Unicode的一种简化

Unicode：包括了所有可能字符的国际统一编码

GBK：中文的一种编码标准，包括中文和英文

在python2中 解码函数decode是其他编码（utf-8或GBK或其他）——>Unicode编码用法：u=str.decode('utf-8') 括号里是原编码格式

encode是 Unicode编码——>其他编码（utf-8或GBK或其他）用法：g=u.encode('gbk') u是Unicode编码格式，括号里是目标编码格式

在python3中:python3中不用再考虑Unicode也不用考虑字符串的原编码类型, 文件读入str后都是Unicode编码，文件处理后，想写到文件用什么编码方式，在函数中用变量定义就好。

字符串有两种数据类型，一种是字符串str，另一种是字节数据bytes

编码函数还是encode，但意义完全不同了，编码函数是字符串str——>目标编码格式的字节类型bytes

s = "中文"

t=s.encode(encoding='utf-8')

p=s.encode(encoding='gbk')

print(t)

print(p)

输出：

b'\xe4\xb8\xad\xe6\x96\x87'

b'\xd6\xd0\xce\xc4'

解码函数还是decode，但意义完全不同了，解码函数是字节类型bytes——>字节编码类型的字符串str

s = "中文"

p=s.encode(encoding='gbk')

sp=p.decode(encoding='gbk')

print(p)

print(sp)

b'\xd6\xd0\xce\xc4'

中文

这里要注意以什么格式编码就要以什么格式解码，要不然会报错

s = "中文"

p=s.encode(encoding='gbk')

sp=p.decode(encoding='utf-8')

print(p)

print(sp)

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd6 in position 0: invalid continuation byte

举个大栗子

s = "中文"

g=s.encode(encoding='gbk')  #从utf-8转成gbk字节码

gg=g.decode(encoding='gbk') #从gbk字节码转成gbk字符串

u=gg.encode(encoding='utf-8')#从gbk转成utf-8

uu=u.decode(encoding='utf-8')

k=uu.encode(encoding='gbk')  #从utf-8转成gbk

kk=k.decode(encoding='gbk')

print(g)

print(gg)

print(u)

print(uu)

print(k)

print(kk)

输出：

b'\xd6\xd0\xce\xc4'

中文

b'\xe4\xb8\xad\xe6\x96\x87'

中文

b'\xd6\xd0\xce\xc4'

中文

注意：在python3中，str全部都是Unicode编码，所以看str变量的编码没有什么意义，而如果encode了，自然要encode里的变量参数来按编码类型编码

python2和python3的编码encode解码decode函数的更多相关文章

day008 字符编码之字符编码、Python2和Python3字符编码的区别
计算机基础(掌握) 启动应用程序的流程双击qq 操作系统接受指令然后把该操作转化为0和1发送给CPU CPU接受指令然后把指令发送给内存内存接受指令把指令发送给硬盘获取数据 qq在内存中运行文本 ...
python3中编码与解码的问题
python3中编码与解码的问题 ASCII .Unicode.UTF-8 ASCII 我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串.每一个二进制位(bit)有0和1两种状态,因此 ...
字符编码 + python2和python3的编码区别(day08整理)
目录昨日回顾二十三.元组内置方法二十四.散列表二十五.字典内置方法二十六.集合内置方法二十七.深浅拷贝拷贝浅拷贝深拷贝今日内容二十八.字符编码 1.文本编辑器存储信息的过程 2. ...
关于base64编码Encode和Decode编码的几种方式
关于base64编码Encode和Decode编码的几种方式 Base64是一种能将任意Binary资料用64种字元组合成字串的方法,而这个Binary资料和字串资料彼此之间是可以互相转换的,十分方便 ...
python encode和decode函数说明【转载】
python encode和decode函数说明字符串编码常用类型:utf-8,gb2312,cp936,gbk等. python中,我们使用decode()和encode()来进行解码和编码在p ...
Python2 与 Python3 的编码对比
在 Python 中,不论是 Python2 还是 Python3 中,总体上说,字符都只有两大类: 通用的 Unicode 字符: (unicode 被编码后的)某种编码类型的字符,比如 UTF-8 ...
最简单的服务器和客户机（python3的编码与解码问题）
在学习python的过程中,我越来越感觉到python2和python3之间有很多不同点,最近发现的一点就是编码问题. 在代码清单14-1和14-2中,因为作者是用python2来写得,然后我是用py ...
关于Python字符编码encode和decode
(注:本文部分内容摘自互联网,由于作者水平有限,不足之处,还望留言指正.) 记得几天前,部门的一个小姑娘问我,怎么她Python打印出来的中文信息都乱码了?我走过去,略思一二,瞬间给她搞定,其实这是字 ...
Python2与Python3字符编码的区别
目录字符编码应用之Python(掌握) 执行Python程序的三个阶段 Python2与Python3字符串类型的区别(了解) Python2 str类型 Unicode类型 Python3 字符编 ...

随机推荐

FastDFS整合SpringBoot(五)
pom.xml <dependencies> <dependency> <groupId>org.springframework.boot</groupId& ...
Linux的磁盘分区
大于2T分区 Linux-GCAPP1:/ # parted /dev/sdb GNU Parted 2.3 Using /dev/sdb Welcome to GNU Parted! Type 'h ...
js里面常用的正则表达式
在工作中经常碰到关于表单的验证,一般采取正则表达是比较简洁,代码量少,但是却经常忘记一些正则的用法.下面记录工作中经常用到的正则表达式. * 代表0次或者多次 +代表1次或者多次 ?代表0次或者 ...
codeforces 380A Sereja and Prefixes （递归）
题目: A. Sereja and Prefixes time limit per test 1 second memory limit per test 256 megabytes input st ...
第九届ECNU Coder A.足球锦标赛
题目链接:http://acm.ecnu.edu.cn/contest/16/problem/A/ 题目: A. 足球锦标赛 Time limit per test: 2.0 seconds Time ...
前端二倍图的思考（涉及Retina）
EXCELL格式 1 csv格式导出来之后不能用EXCELL打开,会乱码.用记事本打开,然后将"(英文的引号出掉),就可以了. 关于二倍图的操作概念: 设备像素:也叫物理像素,显示设备上最 ...
127、TensorFlow 计算图执行(二)
import tensorflow as tf # Define a placeholder that expects a vector of three floating-point values ...
PostgreSQL 在视频、图片去重，图像搜索业务中的应用
摘要: PostgreSQL 在视频.图片去重,图像搜索业务中的应用作者digoal日期2016-11-26标签PostgreSQL , Haar wavelet , 图像搜索 , 图片去重 , 视频 ...
java.io.NotSerializableException错误解决方法
运行tomcat下面的 ssh项目,启动,打开某页面(让session起作用),停止:再启动,有可能会报类似如下的错误: org.apache.catalina.session.StandardMan ...
c++内存布局与c程序的内存布局
c/c++的内存布局:堆,栈,自由存储区(与堆的区别),全局/静态存储区,常量存储区(字符串常量,const常量) http://www.cnblogs.com/QG-whz/p/5060894.ht ...

python2和python3的编码encode解码decode函数

python2和python3的编码encode解码decode函数的更多相关文章

随机推荐

热门专题