python基础之六：编码简介以及python3中的编码

1、常见的四种编码方式的编码过程：

ascii
　　　　A : 00000010 8位一个字节
unicode

　　　　 A : 00000000 00000001 00000010 00000100 32位四个字节
中：00000000 00000001 00000010 00000110 32位四个字节
utf-8

　　　　 A : 00100000 8位一个字节
　　　　中 : 00000001 00000010 00000110 24位三个字节
gbk

　　　　 A : 00000110 8位一个字节
　　　　中 : 00000010 00000110 16位两个字节
1)，各个编码之间的二进制，是不能互相识别的，会产生乱码。
2)，文件的储存，传输，不能是unicode（只能是utf-8 utf-16 gbk,gb2312,asciid等）

3)，简单描述就是：

　　ascii : 8位 1字节表示1个字符
　　unicode 32位 4个字节表示一个字符
　　utf- 8 1个英文 8位，1个字节
　　欧洲 16位两个字节表示一个字符
　　亚洲 24位三个字节表示一个字符

　　gbk 1个英文 8位，1个字节
　　亚洲 16位两个字节表示一个字符

2、python3 中的编码

　　str类型的数据，是以unicode（32位表示一个字符）的形式存储到内存中，但是该方式编码不能存储到硬盘或者在网上传输，
于是就可以介绍3中的另外一个数据类型bytes，使用encode('utf-8/gbk/gb2132/等')函数，将str转换成bytes类型，
实际上就是将unicode代码转换成其他方便传输和存储的编码方式

演示代码：

 # 英文

 s1 = 'Beijing'

 s2 = b'Beijing'

 print(type(s1), type(s2))

 # 中文

 s3 = '北京'

 # s4 = b'北京'  # 报错，不能如此写

 # 需要编码

 s5 = s3.encode('utf-8')

 s6 = s3.encode('GBK')

 print(s6)  # 4个字节

 s4 = b'\xe5\x8c\x97\xe4\xba\xac' # 看到是6个字节表示2个中文，这是utf-8的特性，如果是GBK，就是4个字节了

 print(s4)

python基础之六：编码简介以及python3中的编码的更多相关文章

转 python3中SQLLIT编码与解码之Unicode与bytes
#########sample########## sqlite3.OperationalError: Could not decode to UTF-8 column 'logtype' with ...
python3中的编码与解码（超好理解）
编码和解码是针对数据而言的,数据能干什么呢?无非就是用来显示,储存和传输的: 储存和传输数据当然是希望数据越小越好,所以发明了utf-8这种数据编码显示:它智能将英文用一个字节表示,欧洲的字符用两个字 ...
python3中的编码
python2字符串编码存在的问题: 使用 ASCII 码作为默认编码方式,对中文处理不友好把字符串分为 unicode 和 str 两种类型,将unicode作为唯一内码,误导开发者 python ...
Python3中的编码问题
编码方式介绍我们首先来熟悉一下常见的一些编码方式,按照时间轴来划分,共有以下几种编码方式(常见): ASCII编码方式:对127个常见字符进行编码,其中包含了10个阿拉伯数字,共52个大小写英文字母 ...
在python3中的编码
在python3中的编码 #_author:Administrator#date:2019/10/29import sysprint(sys.getdefaultencoding())#utf-8 打 ...
python基础(5):格式化输出、基本运算符、编码问题
1. 格式化输出现在有以下需求,让⽤户输入name, age, job,hobby 然后输出如下所⽰: ------------ info of Alex Li ----------- Name : ...
Python基础系列----语法、数据类型、变量、编码
1.基本语法 Python ...
Python基础篇 -- 小数据池和再谈编码
小数据池 1. id() 通过id()可以查看到一个变量表示的值在内存中的地址 s = "Agoni" print(id(s)) # 2410961093272 2. is 和 = ...
一篇文章助你理解Python3中字符串编码问题
前几天给大家介绍了unicode编码和utf-8编码的理论知识,以及Python2中字符串编码问题,没来得及上车的小伙伴们可以戳这篇文章:浅谈unicode编码和utf-8编码的关系和一篇文章助你理解 ...

随机推荐

Visual Studio 2019(VS2019)正式版注册码秘钥
Visual Studio 2019 EnterpriseBF8Y8-GN2QH-T84XB-QVY3B-RC4DF Visual Studio 2019 ProfessionalNYWVH-HT4X ...
SWIG 3 中文手册——1. 前言
目录 1 前言 1.1 引言 1.2 SWIG 版本 1.3 SWIG 许可证 1.4 SWIG 资源 1.5 前提要求 1.6 本手册的组织构成 1.7 如何避免阅读手册 1.8 向后兼容 1.9 ...
MYSQL思维导图（转载）
图片来源:https://www.cnblogs.com/mutudou/p/11858477.html
Aliplayer视频点播加密播放
Aliplayer视频播放器填坑 aliplayer视频点播分为Flash和HTML5两个版本,移动端不支持Flash播放器.Flash播放器兼容IE8+,HTML5播发器支持比较新的浏览器,对浏览器 ...
[转帖]SQL Server DBCC命令大全
SQL Server DBCC命令大全原文出处:https://www.cnblogs.com/lyhabc/archive/2013/01/19/2867174.html DBCC DROPC ...
axios解决跨域问题
最近把我自己的网站升级生成前后端分离的项目(vue+springBoot),不可避免的就遇到了跨域问题.从中学到了许多知识,随便分享出来,也巩固下所学. 谈到跨域,首先得了解CORS(Cross or ...
《 .NET并发编程实战》阅读指南 - 第2章
先发表生成URL以印在书里面.等书籍正式出版销售后会公开内容.
.net持续集成cake篇之常见文件及路径操作
系列目录 Cake常见文件和路径操作在自动化构建任务里,很多操作都是跟文件打交道,比如文件打包,文件压缩,文件归档,文件传输,目录清理等.本节介绍一些cake里常见的文件操作方法 Cake相对路径问 ...
模板模式创建一个poi导出功能
之前的导出都很乱,直接写在代码中,等到下回还使用导出功能时又不知如何下手,今天用模板模式重写了一个导出功能,方便以后使用: package com.sf.addrCheck.util.export.p ...
SpringBoot 整合MyBatis 统一配置bean的别名
所谓别名, 就是在mappper.xml配置文件中像什么resultType="xxx" 不需要写全限定类名, 只需要写类名即可. 配置方式有两种: 1. 在 applicatio ...

python基础之六：编码简介以及python3中的编码

python基础之六：编码简介以及python3中的编码的更多相关文章

随机推荐

热门专题