Python学习日记(五) 编码基础
初始编码
ASCII最开始为7位,一共128字符。最后确定8位,一共256个字符,最左边的为拓展位,为以后的开发做准备。
ASCII码的最左边的一位为0。
基本换算:8位(bit) = 1字节(byte)
1024byte = 1 KB
1024KB = 1MB
1024MB = 1GB
1024GB = 1TB
电脑的传输还有存储实际上都是以二进制的形式进行的。
Unicode:美国最初是使用ASCII编码,后来为了解决全球化的文字问题,创建了万国码(Unicode)
开端:
一个中文最初给两个字节(16位)来表示,后来发现中文就将近十万字,不够,所以之后Unicode用4个字节(32位)来表示一个中文。
一个英文给四个字节(32位)来表示。
升级后:
UTF-8:
一个中文用3个字节(24位)表示
一个英文用1个字节(8位)表示
一个欧洲文字用2个字节(16位)表示
国内使用编码:
GBK:
一个中文用2个字节(16位)表示
一个英文用1个字节(8位)表示
(1)各个编码之间的二进制是不能互相是别的,会产生乱码
(2)Unicode 的字符要用4个字节(32位)来表示,占用了太多内存。因此文件的储存、传输不能是Unicode类型,只能是UTF-8、UTF-16、GBK、GB2312、ASCII等类型
UTF-8和GBK的转变要借助Unicode
(3)在Python3中str在内存中是用Unicode存储的
而bytes类型是以(UTF-8、GB2312等编码)
对于英文:
str的表现形式:
s = 'abc'
str的编码方式:
以Unicode的01010101形式
bytes的表现形式:
b_s = b'abc'
bytes的编码方式:
以UTF-8、GBK等的01010101形式
对于中文:
str的表现形式:
s = '中国'
str的编码方式:
以Unicode的01010101形式
bytes的表现形式:
以UTF-8的b'\xe4\xb8\xad\xe5\x9b\xbd'形式
bytes的编码方式:
以UTF-8、GBK等的01010101形式
编码(将str->bytes):
中文:
s1= '中国'
s2 = s1.encode('utf-8')
print(s2) #b'\xe4\xb8\xad\xe5\x9b\xbd'
s2 = s1.encode('gbk')
print(s2) #b'\xd6\xd0\xb9\xfa'
英文:
s1 = 'abc'
s2 = s1.encode('utf-8')
print(s2) #b'abc'
s2 = s1.encode('gbk')
print(s2) #b'abc'
解码(将bytes->str):
b = b'\xe4\xb8\xad\xe5\x9b\xbd'
s = b.decode('utf-8')
print(s) #中国
b = b'abc'
s = b.decode('utf-8')
print(s) #abc
其他:
1.Python2和Python3的区别:
Python2 Python3
<1>.print 可以加括号,也可以不加括号
print('abc') print('abc')
print 'abc'
<2>.xrange()生成器 range()
range()
<3>.raw_input() input()
2.
= 是赋值
is 是比较内存地址
== 比较值是否相等
id(内容)
3.小数据池
在Python中数字和字符串存在着小数据池,它的作用是在一个数据范围内节省内存空间,共用一个内存地址
list、dict、set、tuple没有小数据池这一概念
int:
只要数值在范围(-5 - 256),它们都共用一个相同的内存地址
例1:
例2:
例3:
str:
<1>.当字符串长度为0或1时默认使用小数据池,当长度大于1时且没有含有特殊字符(包括加减乘除)时也将使用小数据池
<2>.一个字符串长度小于等于20用的还是同一个内存地址,长度大于20以后用的是2个内存地址
当乘数为1时:
仅含字符串、数字、下划线,默认使用小数据池:
含其他字符,长度<=1时,默认使用小数据池
含其他字符,长度>1时,默认使用小数据池
当乘数大于1时:
字符长度小于等于20将使用小数据池
Python学习日记(五) 编码基础的更多相关文章
- python学习日记(编码再回顾)
当想从一种编码方式转换为另一种编码方式时,执行的就是以上步骤. 在python3里面,默认编码方式是unicode,所以无需解码(decode),直接编码(encode)成你想要的编码方式就可以了. ...
- python学习日记(基础数据类型及其方法01)
数字 int 主要是用于计算的,常用的方法有一种 #既十进制数值用二进制表示时,最少使用的位数i = 3#3的ASCII为:0000 0011,即两位 s = i.bit_length() print ...
- python学习之路-day2-pyth基础2
一. 模块初识 Python的强大之处在于他有非常丰富和强大的标准库和第三方库,第三方库存放位置:site-packages sys模块简介 导入模块 import sys 3 sys模 ...
- Python 学习日记(第三周)
知识回顾 在上一周的学习里,我学习了一些学习Python的基础知识下面先简短的回顾一些: 1Python的版本和和安装 Python的版本主要有2.x和3.x两个版本这两个版本在语法等方面有一定的区别 ...
- Python学习一:序列基础详解
作者:NiceCui 本文谢绝转载,如需转载需征得作者本人同意,谢谢. 本文链接:http://www.cnblogs.com/NiceCui/p/7858473.html 邮箱:moyi@moyib ...
- Python学习日记 --day2
Python学习日记 --day2 1.格式化输出:% s d (%为占位符 s为字符串类型 d为数字类型) name = input('请输入姓名') age = int(input('请输入年龄 ...
- Python学习二:词典基础详解
作者:NiceCui 本文谢绝转载,如需转载需征得作者本人同意,谢谢. 本文链接:http://www.cnblogs.com/NiceCui/p/7862377.html 邮箱:moyi@moyib ...
- python学习第五次笔记
python学习第五次笔记 列表的缺点 1.列表可以存储大量的数据类型,但是如果数据量大的话,他的查询速度比较慢. 2.列表只能按照顺序存储,数据与数据之间关联性不强 数据类型划分 数据类型:可变数据 ...
- Python学习第五堂课
Python学习第五堂课推荐电影:华尔街之狼 被拯救的姜哥 阿甘正传 辛德勒的名单 肖申克的救赎 上帝之城 焦土之城 绝美之城 #上节内容: 变量 if else 注释 # ""& ...
随机推荐
- web服务器请求代理方式
1 通信数据转发程序:代理.网关.隧道 代理:是一种有转发功能的应用程序,他扮演了位于服务器和客户端“中间人”的角色,接收客户端发送的请求并转发给服务器:同时也接收服务器返回的响应并转发给客户端. 使 ...
- ubuntu16.04安装wkhtmltopdf参考
wkhtmltopdf是一款Html转pdf的工具, 下载地址:https://wkhtmltopdf.org/downloads.html 安装步骤: ----下载ubuntu下的wkhtmltop ...
- Spark程序进行单元测试-使用scala
Spark 中进行一些单元测试技巧:最近刚写了一点Spark上的单元测试,大概整理了一些 rdd测试 spark程序一般从集群中读取数据然后通过rdd进行转换,这其中涉及到集群,每次修改bug,上传到 ...
- 必须要注意的 C++ 动态内存资源管理(六)——vector的简单实现
必须要注意的 C++ 动态内存资源管理(六)——vector的简单实现 十六.myVector分析 我们知道,vector类将其元素存放在连续的内存中.为了获得可接受的性能,vetor ...
- DEPICT实现基因优化(gene prioritization)、gene set富集分析(geneset enrichment)、组织富集分析(tissue enrichment)
全基因组关联分析除了找到显著的关联位点,我们还可以做基因优化.geneset富集分析.组织富集分析,下面具体讲一讲怎么利用GWAS的summary数据做这个分析. summary数据就是关联分析的结果 ...
- Spring MVC -- 验证器
输入验证是Spring处理的最重要Web开发任务之一.在Spring MVC中,有两种方式可以验证输入,即利用Spring自带的验证框架,或者利用JSR 303实现.本篇博客将介绍这两种输入验证方法. ...
- mysql or条件查询优化
当使用or的时候是不会用到索引的 explain SELECT * FROM aladdin_resource WHERE state = 1 OR state = 2; 解决办法就是用union替换 ...
- C#中标准的IDispose模式
C#实现IDispose接口 .net的GC机制有两个问题:首先GC并不能释放所有资源,它更不能释放非托管资源.其次,GC也不是实时的,所有GC存在不确定性.为了解决这个问题donet提供了析构函 ...
- sql 表的连接 inner join、full join、left join、right join、natural join
一.内连接-inner jion : SELECT * FROM table1 INNER JOIN table2 ON table1.field1 compopr table2.field2 INN ...
- C语言函数库帮助文档
C语言函数库帮助文档 安装 1.C语言库函数基本的帮助文档 sudo apt-get install manpages sudo apt-get install manpages-de sudo ap ...