字符编码 + python2和python3的编码区别(day08整理)
目录
昨日回顾
二十三、元组内置方法
不可更改的列表,其他的和列表一摸一样
二十四、散列表
二十五、字典内置方法
乱序
python2中字典是乱序的,但是python3做了优化
(本来是乱序的,但是在c这个层面做了不不乱序的优化)
key为什么是不可变的
假设是可变的,在哈希处理时,除留余数法会导致存储的位置发生变化
二十六、集合内置方法
- 去重
- 乱序(差值是按照某种哈希算法随机插的)
- 交集&/并集|/差集-/补集^
二十七、深浅拷贝
拷贝
a是b的拷贝对象,则b内部所有的数据类型变化,则a也变化
浅拷贝
a是b的浅拷贝对象,b内部的可变数据类型变化,a变化;b内部的不可变数据类型变化,a不变化
深拷贝
a为b的深拷贝对象,a内部无论何数据类型变化,b都不改变
今日内容
二十八、字符编码
1.文本编辑器存储信息的过程
unicode编码(识别所有代码)
因为unicode存储占用空间,所以用utf8来存储
utf8只和unicode对应识别
内存中unicode取,存用utf8存(硬盘),全世界的人写代码都是用utf8
内存中为什么不用utf8?
utf8和其他编码都没有转换关系,因此都要用unicode
未来迟早有一天,内存要用utf8
2.gb2312和gbk的区别
gb2312:一些常用词,不包括繁体字
gbk:所有的字
用什么编码写,就用什么编码读
如果写用utf8,存用gbk,会导致在存储的时候就会乱码
如果写用utf8,存用utf8,但是读用gbk,也会乱码
3.编码和解码
编码:内存中unicode编码,从内存到硬盘utf8
解码:Unicode从硬盘到内存
现在内存只有unicode编码
4.python解释器解释python代码的流程
读入python代码(字符编码)
python2默认是ascill,python默认是utf8
可以使用coding规定解决
# coding:gbk # 告诉python解释器用gbk去完成第一步,读入字符 中文
识别代码 (语法识别)
终端产生结果(字符编码)
终端是什么编码,就按照什么编码来
windows终端是utf8
二十九、python2和python3的编码区别
python2
python2有两种存储变量的形式:Unicode和按照coding头
假设python2用utf8存储中文,当你打印时,终端接受gbk的变量,但是windows终端编码时utf8,就会乱码
假设python2用unicode存储,因为unicode可以和任何的编码转换,所以此时终端编码是什么就不重要了, 不会乱码
# coding:gbk lt1 = '中文' # utf存储的 # lt1 = ['中文'] # []让他不用终端的编码转化,显示01010101001 print lt1 # ['\xe4\xb8\xad\xe6\x96\x87'] lt2 = u'中文' # u'中文'让他变成unicode # 早期用python2定义中文,必须得加上u,让他变成unicode存储 # lt2 = [u'中文'] print lt2 # '中文'
python3
python3只有一种存储变量的形式:unicode
因此,windows终端编码无论是什么都不会乱码,算是一种优化
字符编码 + python2和python3的编码区别(day08整理)的更多相关文章
- 字符编码 python2与python3的区别
目录 1. 字符编码 2. 文本编辑器存储信息的过程 3. 编码: 1. 编码的历史 2. gb2312和gbk的区别 3. 编码和解码 4. python解释器 解释代码的流程 1. 读取文本到解释 ...
- while 运算符 初始编码 python2和python3的区别
1.while 循环 2.运算符 3.初始编码 4.python2 和python3的区别 1.while循环: 关键词:while[循环] break[跳出循环] c ...
- Python2 与 Python3 的编码对比
在 Python 中,不论是 Python2 还是 Python3 中,总体上说,字符都只有两大类: 通用的 Unicode 字符: (unicode 被编码后的)某种编码类型的字符,比如 UTF-8 ...
- [python]python2与python3版本的区别
python2和python3的区别 区别: print函数 整数相除 Unicode 异常处理 xrange map函数 不支持has_key print函数: Python 2: print是语句 ...
- python版本坑:md5例子(python2与python3中md5区别)
对于一些字符,python2和python3的md5加密出来是不一样的. Python2 和Python3MD5加密 # python2.7 pwd = "xxx" + chr(1 ...
- python2和python3的编码问题
python2中有两种类型 str字符串和unicode字符串 python3则改成了 bytes和str字符串 在python2中‘xxx’和b‘xxx’都是str字符串,u‘xxx’是unicod ...
- python2和python3的编码encode解码decode函数
python比较坑的一个点:意义完全变了的两个函数 首先 常用的编码方式有3种,utf-8: 常用的传输和存储格式,Unicode的一种简化 Unicode:包括了所有可能字符的国际统一编码 GBK ...
- 转 python2 与 python3 的编码
原文链接:https://blog.csdn.net/xufive/article/details/102726739 引文如下: 无论是py2还是py3,都使用unicode作为内存编码,简称内码. ...
- (个人记录)Python2 与Python3的版本区别
现在还有些开源模块还没有更新到python3 ,不了解版本区别,无法对不合适的地方进行更改. 由于只追求向Python3靠近,所以对于python2的特别用法不探究. 此文不补全所有版本区别,仅作档案 ...
随机推荐
- Centos6安装MySQL5.7(yum方式)
1. 下载并安装用来配置mysql的yum源的rpm包 # 下载 wget http://repo.mysql.com/mysql57-community-release-el6-10.noarch. ...
- Kurskal算法
Kruskal算法是以边为主要关注对象的最小生成树算法,是最小生成树最佳的算法实现. 其时间复杂度为O(ElogE)(E为边的数量),而Prime算法采用邻接矩阵的方法是O(V^2)(V为顶点数量). ...
- 23种设计模式之抽象工厂(Abstract Factory Pattern)
抽象工厂 当想创建一组密不可分的对象时,工厂方法似乎就不够用了 抽象工厂是应对产品族概念的.应对产品族概念而生,增加新的产品线很容易,但是无法增加新的产品.比如,每个汽车公司可能要同时生产轿车.货车. ...
- Sentinel Cluster流程分析
前面介绍了sentinel-core的流程,提到在进行流控判断时,会判断当前是本地限流,还是集群限流,若是集群模式,则会走另一个分支,这节便对集群模式做分析. 一.基本概念 namespace:限 ...
- Maven 梳理 - Maven中的dependencyManagement 意义
1.在Maven中dependencyManagement的作用其实相当于一个对所依赖jar包进行版本管理的管理器. 2.pom.xml文件中,jar的版本判断的两种途径 1:如果dependenci ...
- javascript中数组常用的方法和属性
前言 在javascript中,数组是一种非常重要的数据类型,我们时常会和它打交道,最近在开发项目中频繁的使用到数组,但是自己对数组的众多方法已经是非常模糊了,为了方便自己以后能够更好的使用数组中的属 ...
- C#2匿名方法中的捕获变量
乍一接触"匿名方法中的捕获变量"这一术语可能会优点蒙,那什么是"匿名方法中的捕获变量"呢?在章节未开始之前,我们先定义一个委托:public delegate ...
- python的__name__ == \'__main__\' 意义
转自http://www.jb51.net/article/51892.htm 很多新手刚开始学习python的时候经常会看到python 中__name__ = \'__main__\' 这样的代码 ...
- Java基础学习笔记(六) - 数据结构和集合
一.认识数据结构 1.数据结构有什么用? 合理的使用数据结构,可以更方便的查找存储数据. 2.常见的数据结构 数据存储常用结构有:栈.队列.数组.链表和红黑树. 栈:堆栈(stack),它是运算受限的 ...
- AlexNet模型的解析及tensorflow实现
AlexNet是ImageNet LSVRC 2012比赛中分类效果第一的深度神经网络模型,点击链接下载论文http://papers.nips.cc/paper/4824-imagenet-clas ...