python-day10--字符编码
1.回顾:
软件→操作系统→硬件
2.文本编辑器:
启动:硬盘→内存→运行(cpu)
读文件:硬盘→内存→CPU读
存文件:保存到硬盘中
3.python解释器
启动:硬盘→内存→运行(cpu)
读文件:硬盘→内存→CPU读
(这两阶段与文本编辑器相同,但第三阶段就不同了,关系到语法等问题)
解释执行:这个阶段就要在内存中开辟新的空间
4.字符编码:顾名思义就是编码字符的
①字符编码的作用:把人能识别的字符通过一种标准翻译成计算能识别的二进制,翻译过程的标准就是字符编码表
②不同的字符编码表
ASCII
用8个位表示一个字节bytes,共可表示2**8=256种
GBK
用2个bytes表示1个字符,共2**16种
Unicode(万国码)
用2个bytes表示1个字符(但是在保存英文字符的时候就浪费空间)
UTF-8(万国码)
对英文存1个bytes,中文存3个bytes
5.计算机内存中用Unicode(速度快),硬盘中用UTF-8(占用空间小,传输稳定)
6.保存文件过程:内存Unicode → encode → 硬盘UTF-8/或其他字符编码
读取文件过程:硬盘UTF-8/或其他字符编码 → decode → 内存Unicode
7.以上总结:
①存文件的时候用的什么编码(encode)取的时候就要用什么编码取(decode)
②python3解释器默认的字符编码是UTF-8,可以更改: #coding:gbk或其他
③python2解释器默认的字符编码是ASCII,可以更改: #coding:uft-8或其他
8.python解释器第三阶段才用到字符串,执行中遇到字符串就会开辟新的内存空间存起来。
在python3中字符串都是unicode格式的二进制存放在内存中,而在python2中字符串都是已经encode后的结果,即bytes。
9.Unicode → encode → bytes
bytes → decode → Unicode
10.python3中有两种形式的字符串:
①.Unicode(解释器自动控制)
②.bytes(Unicode→encode→bytes)(人为控制)
11.python2的字符串有两种:
①. str = bytes(Unicode→encode→bytes)(解释器自动控制)
②. u' 字符串 ' (相当于python3中的Unicode)
12.为什么要有bytes:
计算机最基本的传输信号就是二进制,就相当说最基本的传输信号就是bytes,所以数据要传输就要用bytes。
python-day10--字符编码的更多相关文章
- Python基础-字符编码与转码
***了解计算机的底层原理*** Python全栈开发之Python基础-字符编码与转码 需知: 1.在python2默认编码是ASCII, python3里默认是utf-8 2.unicode 分为 ...
- Python的字符编码
Python的字符编码 1. Python字符编码简介 1. 1 ASCII Python解释器在加载.py文件的代码时,会对内容进行编码,一般默认为ASCII码.ASCII(American St ...
- Python常用字符编码(转)
Python常用字符编码 字符编码的常用种类介绍 第一种:ASCII码 ASCII(American Standard Code for Information Interchange,美国信息交 ...
- Python常见字符编码间的转换
主要内容: 1.Unicode 和 UTF-8的爱恨纠葛 2.字符在硬盘上的存储 3.编码的转换 4.验证编码是否转换正确 5.Python bytes类型 前 ...
- python 3字符编码
python 3字符编码 官方链接:http://legacy.python.org/dev/peps/pep-0263/ 在Python2中默认是ascii编码,Python3是utf-8编码 在p ...
- Python 的字符编码
配置: Python 2.7 + Sublime Text 2 + OS X 10.10 本文意在理清各种编码的关系并以此解决 Python 中的编码问题. 1 编码基本概念 只有先了解字符表.编码字 ...
- 转:Python常见字符编码及其之间的转换
参考:Python常见字符编码 + Python常见字符编码间的转换 一.Python常见字符编码 字符编码的常用种类介绍 第一种:ASCII码 ASCII(American Standard Cod ...
- Python之字符编码(Day10)
1. python解释器执行py文件的原理 ,例如python test.py 第一阶段:python解释器启动,此时就相当于启动了一个文本编辑器 第二阶段:python解释器相当于文本编辑器, ...
- Python遇到字符编码出问题的一个相对万能的办法
在使用Python做爬虫的过程中,经常遇到字符编码出问题的情况. UnicodeEncodeError: 'ascii' codec can't encode character u'\u6211' ...
- Python:字符编码详解
相关文章 Python中文编码问题:为何在控制台下输出中文会乱码及其原理 1. 字符编码简介 1.1. ASCII ASCII(American Standard Code for Informati ...
随机推荐
- iOS可执行文件__TEXT段限制 以及 Android 65K函数限制
1.先看下苹果关于 .ipa上传的大小规定: 最大构建版本文件大小 解压 XXX.ipa size Payload/xxx.app/xxx 32位 32位 + 64位 有些2dx.u3d游戏 或是 ...
- linux查看文件夹大小,备份文件夹zip压缩解压
linux查看文件夹大小,备份文件夹zip压缩解压 du -sh : 查看当前目录总共占的容量.而不单独列出各子项占用的容量 du -lh --max-depth=1 : 查看当前目录下一级子文件和子 ...
- C/C++之全局、static对象/变量的初始化问题
关于全局.static对象/变量的初始化问题 1. 全局变量.static变量的初始化时机:main()函数执行之前(或者说main中第一个用户语句执行之前). 2. 初始化顺序. 1)全局对象.外部 ...
- 安全测试工具之Burpsuite
端口即服务,每一个服务对应一个或多个端口.端口扫描即通过一些方法检测到一台主机的一段特定端口是否提供相应的服务.利用这些扫描结果,正常用户可以访问系统所提供的服务,而黑客却可以利用这些服务中的漏洞对系 ...
- C#对两种类型动态库的使用
一.托管:如果一个动态库本身是基于.NET的,那么可以直接在工程引用里右键添加引用,如微软的COM技术[因为你依托的是微软的框架,所以需要regsvr32注册] 二.非托管:如果不是基于.NEt的,那 ...
- GNU C 中零长度的数组【转】
原文链接:http://www.cnblogs.com/dolphin0520/p/3752492.html 在标准C和C++中,长度为0的数组是被禁止使用的.不过在GNU C中,存在一个非常奇怪的用 ...
- Maven可用setting.xml
最简单的可用阿里镜像配置 <?xml version="1.0" encoding="UTF-8"?> <settings> <l ...
- VS中自动选择x86或x64的dll
http://www.cnblogs.com/lzjsky/archive/2010/09/06/1819321.html 原来使用Win7的32位系统,进行C#工程的开发,后来重装系统,换成了win ...
- C#学习笔记(六):循环嵌套、复杂数据类型和枚举
复杂数据类型 默认情况:0,1,2,3 赋值情况:0,3,4,5://修改初始值,后面都会改变 定义在class外面,作用域更大 定义在class里面(类种类),只能在类里使用 枚举作用:方便把不同角 ...
- hdu 1014 Uniform Generator 数论
摘取于http://blog.csdn.net/kenden23/article/details/37519883: 找到规律之后本题就是水题了,不过找规律也不太容易的,证明这个规律成立更加不容易. ...