Python基础—编码(Day2)
一、字符编码
1.ASCII码:包含英文、数字、特殊字符,8位=1字节byte =1个字符,如: 0010 1010
ASCII码表里的字符总共有256个,前128个为常用的字符如运算符,后128个称为扩展ASCII码。
2. Unicode(万国码):将所有国家的语言全部包含在这个密码本中。
初期:16位,两个字节,表示一个字符。
A : 00010000 00010010
中: 00010010 00010010
升级:32位,四个字节,表示一个字符。(32位造成资源浪费)
A : 00010000 00010010 00010000 00010010
中: 00010010 00010010 00010010 00010010
Python2x,unicode默认是两个字节表示一个字符,可以编译安装时调整。
Python3x, unicode统一是四个字节表示一个字符。
3. utf-8:最少用8位表示字符
英文:8位表示1个字符,如:00010000
欧洲:16位表示两个字节表示一个字符,如:00010000 01000100
亚洲:24位三个字节表示一个字符,如:00010000 01000100 00010000
4.GBK:国标,只包含英文、中文
英文:8位,1个字节表示一个字符,如:000 0001
中文:16位,两个字节表示一个字符,如:0000 0001 0000 0001
二、单位换算
- 8 bit = 1 byte
- 1024 byte = 1 kb
- 1024 kb = 1 MB
- 1024 MB = 1 GB
- 1024 GB = 1 TB
三、编码之间的转换
1.编码之间的二进制是互不相识的。
2.用于存储和传输的010101不能是unicode的010101。(utf-8和gbk是在unicode基础上写出来的)
3.数据类型bytes:与str的用法相同。
python3x中的str在内存中的编码方式是unicode,不能直接存储和发送,bytes的编码方式是非unicode(utf- 8、gbk.....等)。


4.str与bytes类型的表现形式和内部编码
对于英文:
str 表现形式:s='laonanhai'
内部编码:unicode
bytes 表现形式:s=b'laonanhai'
内部编码:非unicode(utf-8,gbk等)
对于中文:
str 表现形式:s='中国'
内部编码:unicode
bytes 表现形式:s1=b'\xe4\xb8\xad\xe5\x9b\xbd'
内部编码:非unicode(utf-8,gbk等)
5.str与bytes之间的转换
str---->bytes s.encode('gbk') 编码
bytes---->str s.decode('gbk') 解码
s='alex'
s1=s.encode('utf-8') #编码
s2=s1.decode('utf-8') #解码
print(s2)
执行结果:alex
6.编码的转换
utf-8不能直接转换成gbk,要通过unicode转换

四、小数据池
int和str有小数据池,目的是为了节省空间。
1. int: -5—256在同一内存地址
2.str:如果含有特殊字符不存在小数据池。
str*int int>20不存在小数据池(单个str)
五、 is和==
==是数值的比较
is是内存地址的比较
Python基础—编码(Day2)的更多相关文章
- Python 基础 编码
Python 基础 编码 咱们的电脑,存储和发送文件,发送的是什么?电脑里面是不是有成千上万个二极管,亮的代表是1,不亮的代表是0,这样实际上电脑的存储和发送是不是都是010101啊 我们发送的内容都 ...
- Python基础篇-day2
主要内容: for循环 while循环 格式化输出(2) 数据统计及记录 ############################################################# 1 ...
- Python基础-编码与解码
一.什么是编码 编码是指信息从一种形式或格式转换为另一种形式或格式的过程. 在计算机中,编码,简而言之,就是将人能够读懂的信息(通常称为明文)转换为计算机能够读懂的信息.众所周知,计算机能够读懂的 ...
- 【转】python基础-编码与解码
[转自:https://www.cnblogs.com/OldJack/p/6658779.html] 一.什么是编码 编码是指信息从一种形式或格式转换为另一种形式或格式的过程. 在计算机中,编码,简 ...
- python基础之day2
python基本数据类型 1.数字 int(整型) 在32位机器上,整数的位数为32位,取值范围为-2**31-2**31-1,即-2147483648-2147483647 在64位系统 ...
- python基础-编码_if条件判断
一.第一句Python代码 在 /home/dev/ 目录下创建 hello.py 文件,内容如下: [root@python-3 scripts]# cat hello.py #!/usr/bin/ ...
- python基础1 day2
一.上节课回顾1. 编译型: 将源码一次性全部编译成二进制. C 优点:执行效率高. 缺点:开发效率慢,不可跨平台使用. 解释型: 当程序执行时,代码一行一行的去解释成二进制. python 优点:开 ...
- python基础 (编码进阶,文件操作和深浅copy)
1.编码的进阶 字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码. 即先将其他编码的字符串解码(decode)成unicode,再从uni ...
- Python基础,day2
程序练习 程序:购物车程序 需求: 启动程序后,让用户输入工资,然后打印商品列表 允许用户根据商品编号购买商品 用户选择商品后,检测余额是否够,够就直接扣款,不够就提醒 可随时退出,退出时,打印已购买 ...
随机推荐
- js对象方法
Number对象方法 toFixed() 方法 toFixed()方法返回的是具有指定位数小数的数字的字符串表示.例如: var oNumberObject = new Number(68); ale ...
- Presto 在字节跳动的内部实践与优化
在字节跳动内部,Presto 主要支撑了 Ad-hoc 查询.BI 可视化分析.近实时查询分析等场景,日查询量接近 100 万条.本文是字节跳动数据平台 Presto 团队-软件工程师常鹏飞在 Pre ...
- Bootstrap实战 - 注册和登录
一.介绍 注册和登录在社交和商业网站中是必不可少的一个部分. 二.知识点 2.1 标签页 2.1.1 基础标签页 标签页的使用与导航栏类似,同时都依赖于基础样式 nav,不同的是附加样式变成了 nav ...
- R语言服务器程序 Rserve详解
R语言服务器程序 Rserve详解 R的极客理想系列文章,涵盖了R的思想,使用,工具,创新等的一系列要点,以我个人的学习和体验去诠释R的强大. R语言作为统计学一门语言,一直在小众领域闪耀着光芒.直到 ...
- 进程池与线程池基本使用、协程理论与实操、IO模型、前端、BS架构、HTTP协议与HTML前戏
昨日内容回顾 GIL全局解释器锁 1.在python解释器中 才有GIL的存在(只与解释器有关) 2.GIL本质上其实也是一把互斥锁(并发变串行 牺牲效率保证安全) 3.GIL的存在 是由于Cpyth ...
- golang gin框架中使用protocol buffers和JSON两种协议
首先,我使用protobuf作为IDL,然后提供HTTP POST + JSON BODY的方式来发送请求. 能不能使用HTTTP POST + PB序列化后的二进制BODY呢? 做了一下尝试,非常简 ...
- Docker 与 K8S学习笔记(十八)—— Pod的使用
Pod 是一组紧密关联的容器集合,它们共享IPC.Network和UTS namespace,是 Kubernetes 调度的基本单元.Pod 的设计理念是支持多个容器在一个 Pod 中共享网络和文件 ...
- VUE3 之 多个 v-model 绑定及 v-model 修饰符的使用 - 这个系列的教程通俗易懂,适合新手
1. 概述 洛克定律告诉我们: 当我们的目标很远大,远到我们都看不到终点时,放弃几率就会很大,就像跑马拉松比赛,由于时间长.距离长,很多选手都会选择在中途放弃. 其实有个好办法,就是拆分,把大目标拆分 ...
- linux中awk命令(最全面秒懂)
目录 一:linux中awk命令 1.awk命令简介 2.awk作用 3.awk的语法格式 4.解析awk使用方法 5.参数 6.awk的生命周期 二:awk中的预定义变量 三:awk运行处理规则的执 ...
- 深度评测丨 GaussDB(for Redis) 大 Key 操作的影响
本文分享自华为云社区<墨天轮评测:GaussDB(for Redis)大Key操作的影响>,作者: 高斯 Redis 官方博客. 在前一篇文章<墨天轮评测:GaussDB(for R ...