ASCII码 标准ASCII码使用7位二进制数表示大写或小写字母,数字0到9标点符号以及在美式英语中使用的特殊控制字符. 在标准ASCII码中,最高位(b7)用作奇偶校验位,所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分寄校验和偶校验两种.奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1:偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1. 后128个称为扩展ASCII码.许多基于x86的系统都支持使用扩展(…
1.在计算机处理的程序中,对字符的处理有两种方式:编码或译码(encoding),解码(decoding)     encoding:将字符串中的字符转换到对应编码字符集对应的代码点              每一个代码点对于了一些数字,计算机真正存的是这些数字         如:             "python",转换到unicode码的对应为: P y t h o n 0x50 00 00 00 79 00 00 00 74 00 00 00 68 00 00 00 6f…
字符编码和Python代码操作文件 读写模式之a模式 # a模式 只追加模式 # 路径不存在:自动创建 with open(r'a.txt','a',encoding='utf8') as f: pass # 路径存在:不会清空文件 在文件末尾添加内容 with open(r'a.txt', 'a', encoding='utf8') as f: f.write('\n今天周四了 马上又要放假了 好开心!') """ 我们所学习的r w a读写模式都只能操作文本文件,其他模式…
字符编码与python文件处理 ---------------- 字符编码 1.常见的编码 ASCII: 美国人发明的,只编码英文字母和符号,1个字节. GB2312: 中国人发明的,增加了中文汉字和符号,2个字节. Unicode: 为了把所有语言都统一到一套编码里,一般是2个字节,生僻字4个字节. UTF-8: 为了节省英文字符内存空间,UTF-8可变长编码,常用的英文字母被编码成1个字节,汉字通常是3个字节,生僻的字符编码成4-6个字节. 2.关于字符编码需要记住的结论 (1)内存固定使用…
字符编码与encode.decode的问题:  用8个开关表示世界万物   ASCII :  American Standard Code for Information Interchange,美国信息互换标准代码,只用了前7位,127个状态   GB2312:是对ASCII的中文扩展(前127不变,大于127的+后边另一个大于127的表示中文)两个字节表示一个汉字   GBK:包括了GB2312 的所有内容,增加了近20000个新的汉字(包括繁体字)和符号   GB18030:加了几千个新的…
前言: 我们知道,计算机是以二进制为单位的,也就是说计算机只识别0和1,也就是我们平时在电脑上看到的文字,只有先变成0和1,计算机才会识别它的意思.这种数据和二进制的转换规则就是编码.计算机的发展中,有ASCII码,GBK,Unicode,utf-8编码.我们先从编码的发展史了解一下编码的进化过程. 编码发展史 美国人发明了计算机,用八位0和1的组合,一一对应英文中的字符,整出了一个表格,ASCII表. 计算机传入中国,中国地大物博,繁体字和简体字多,8位字节最多表示256个字符,满足不了,于是…
字符编码和文件操作 目录 字符编码和文件操作 1. 字符编码 1.1 什么是字符编码 1.2 字符编码的发展史 1.2.1 ASCII码 1.2.2 各国编码 1.2.3 Unicode 1.3 字符编码练习 1.4 编码和解码 2. 文件操作 2.1 open()使用方法: 2.2 上下文管理with() 2.3 追加模式 2.4 文件操作之读系列 2.5 文件操作之写系列 2.6 文件操作模式 2.7 文件内移动光标seek() 2.8 当前在文件内的位置tell() 2.9 文件内容修改…
目录 1. 编码: 1.字符编码 2. 编码的历史 3. 编码和解码 2. python解释器 解释代码的流程 1. 读取文本到解释器 2. 识别代码(检查语法问题) 3. 往终端打印 1. 编码: 1.字符编码 定义:就是存储了信息的东西 2. 编码的历史 发明国家:美国 第一种编码语言:ACILL ​ 但是随着世界各国的发展,计算机的使用逐渐增加,但是各国之间的编码不一致,便会出现乱码的现象 所以就有了新的编码 Unicode:是一种可以识别各个国家万国编码,它为每种语言中的每个字符设定了统…
字符(存储了信息的东西)编码(): 键盘发送的是电流-->主机(内存)接受到电流(当作010100110101)-->显示屏 接受电流(当作010100110101------->键盘) 编码:01001010101-->键盘 字符编码 文本编辑器存储信息的过程 文本编辑器-->写文本-->存储信息 显示屏(内存)--->(转换)硬盘 中文-->0101010101 English-->01010111101010 日本語-->010110101…
转载地址:http://www.imkevinyang.com/2010/06/%E5%85%B3%E4%BA%8E%E5%AD%97%E7%AC%A6%E7%BC%96%E7%A0%81%EF%BC%8C%E4%BD%A0%E6%89%80%E9%9C%80%E8%A6%81%E7%9F%A5%E9%81%93%E7%9A%84.html 字符编码的问题看似很小,经常被技术人员忽视,但是很容易导致一些莫名其妙的问题.这里总结了一下字符编码的一些普及性的知识,希望对大家有所帮助. 还是得从ASC…