字符编码:

  1. 什么是字符编码?

    字符编码是将人识别的字符转换成计算机能识别的二进制字符(01),转换的规则就是编码表。 

    人能识别的字符串  与  计算机能识别的二进制字符 两者之间对应关系构成的结构称为:编码表

    1.   ASCII码:  字母、数字、英文符号与计算机01标识符的对应关系
    2. 中国(研究汉字与01标识符之间关系):GB2312---->GBK----->GB18030
    3. 日本:shift_JIS
    4. 韩国:Euc-Kr
    5. 万国码(unicode): 目的是创造出一个可以完成各国字符与计算机的01标识符对应的编码表——————>UTF-8
  1.   注意:
    1.   python2 中 使用的是 ASCII码,原因是在python2 诞生之前,没有万国码
    2. python3中使用的是UTF-8,采用万国编码来解释文本内容
    3. UTF-8 与unicode关系:
      1.   unicode 是用两个字节存储汉字,也是用两个自己存储英文字符的,(长度不可变)占用空间较多,但是读取效率高。
      2. UTF-8是用三到六个字节存储汉字,用一个字节来存储英文字符的,(长度可变)占用空间较小,但是读取效率较低。
      3. unicode 与UTF-8都是采用一张编码表,UTF-8是 unicode的体现方式(变长传输,提高传输效率),由于多数数据都是以英文形式存在,所以UTF-8所占空间更小,传输速度更快。
  2. 乱码问题:本质上存数据与读取的数据采用的编码表不同。
  3. 理解文件传输过程中的字符编码的变化:
    1.   在硬盘中,文件可以以各种形式的编码来存储,在传输过程中,即在硬盘往内存中传输文件的过程中,文件都是以UTF-8编码形式传输的,读取到内存后,内存中存储数据是采用的是unicode,然后由内存读到cpu 过程中,也是UTF-8编码形式传输的,读到cup的文件的编码形式也就是UTF-8。
  4. 编码与解码:
s1 = u'abc你好\n不好'  # 万国字符串
print(s1)
s2 = b'abc23\xb7\xb7' # 字节字符串
print(s2)
s3 = r'abc你好\n不好' # 原义字符串
print(s3)

  

# 编码与解码:
s = '123呵呵'
b = bytes(s, encoding='utf-8')
n_b = str(b, encoding='utf-8')
n_b1 = str(b, encoding='GBK')
print(b, n_b, n_b1) # 将u字符串编码成b字符串
print(u'你好'.encode('utf-8')) # 将b字符串解码成u 字符串
print(b'123\xe5\x91\xb5\xe5\x91\xb5'.decode('utf-8'))

文件操作:

    计算机中的文件:本质上是硬盘上存储的一块空间的虚拟文件

     文件操作:根据文件名来操作硬盘中的存储空间的虚拟文件,操作方式有:读(read)写(write)

     操作文件的流程: 打开文件——————操作文件(读写)———————关闭文件

    1.   基本读写操作:

     

# 一使用文件的三步骤:
# 1.打开文件
# 变量名 = 文件空间
# 文件路径 操作模式(读|写) 编码
f = open('123.txt', 'r', encoding='utf-8') # 此处路径是相对路径,因为在同一个文件夹下的操作
# 2.操作文件
data = f.read(10) # 将所有内容读取出来,如果设置读取长度,按照规定长度读取数据 # 一行一行读取
line = f.readline()
print(line)
lines = f.readlines()
print(lines)
print(data) 按行一次性全部读出
l = []
for line in f:
# print(line)
l.append(line)
print(l) set1 = set()
for line in f:
# print(line)
set1.add(line)
print(set1) # 3.关闭文件
f.close() # 释放操作系统对文件的持有,变量f还被应用程序持有 # del f # 不需要该操作,系统自动回收
# 基础写
# 文件不存在:会新建文件,再操作文件
# 文件存在:先清空文件,再操作文件
w = open('b.txt', 'w', encoding='utf-8')
w.write('')
w.close()

day07----字符编码解码、文件操作(1)的更多相关文章

  1. Python之字符编码与文件操作

    目录 字符编码 Python2和Python3中字符串类型的差别 文件操作 文件操作的方式 文件内光标的移动 文件修改 字符编码 什么是字符编码? ''' 字符编码就是制定的一个将人类的语言的字符与二 ...

  2. Python-字典、集合、字符编码、文件操作整理-Day3

    1.字典 1.1.为什么有字典: 有个需求,存所有人的信息 这时候列表就不能轻易的表示完全names = ['stone','liang'] 1.2.元组: 定义符号()t = (1,2,3)tupl ...

  3. DAY07、字符编码和文件操作

    一.字符编码 1.什么是字符编码? 人类能识别的是字符等高级标识符,电脑只能识别0,1组成的标识符,要完成人与机器之间的信息交流,              一定需要一个媒介,进行两种标识符的转化(两 ...

  4. Python 字符编码及其文件操作

    本章节内容导航: 1.字符编码:人识别的语言与机器机器识别的语言转化的媒介. 2.字符与字节:字符占多少个字节,字符串转化 3.文件操作:操作硬盘中的一块区域:读写操作 注:浅拷贝与深拷贝 用法: d ...

  5. Python全栈开发之路 【第三篇】:Python基础之字符编码和文件操作

    本节内容 一.三元运算 三元运算又称三目运算,是对简单的条件语句的简写,如: 简单条件语句: if 条件成立: val = 1 else: val = 2 改成三元运算: val = 1 if 条件成 ...

  6. DAY7 字符编码和文件操作

    一.软件与python解释器打开文件的方法 1.软件打开文件读取数据的流程: 1. 打开软件 2. 往计算机发生一个打开文件的指令,来打开文件 3. 读取数据渲染给用户(存取编码不一致:乱码) 2.p ...

  7. Day 07 字符编码,文件操作

    今日内容 1.字符编码:人识别的语言与机器识别的语言转换的媒介 2.字符与字节:字符占多少字节,字符串转换 3.文件操作:操作硬盘的一块区域 字符编码 重点:什么是字符编码 人类能识别的字符等高级标识 ...

  8. Python 入门基础6 --字符编码、文件操作1

    今日内容: 1.字符编码 2.字符与字节 3.文件操作 一.字符编码 了解: cpu:将数据渲染给用户 内存:临时存放数据,断电消失 硬盘:永久存放数据,断电后不消失 1.1 什么是编码? 人类能够识 ...

  9. python基础——6(字符编码,文件操作)

    今日内容: 1.字符编码: 人识别的语言与机器识别的语言转化的媒介 *****     2.字符与字节: 字符占多少字节,字符串转化 ***     3.文件操作: 操作硬盘中的一块区域:读写操作  ...

  10. python字符编码与文件操作

    目录 字符编码 字符编码是什么 字符编码的发展史 字符编码实际应用 编码与解码 乱码问题 python解释器层面 文件操作 文件操作简介 文件的内置方法 文件的读写模式 文件的操作模式 作业 答案 第 ...

随机推荐

  1. margin:0 auto是什么意思

    一.margin设置对象外边距 二.margin后面如果只有两个参数的话,第一个表示top和bottom,第二个表示left和right 因为0 auto

  2. centos7学习笔记-安装配置apache

    我的邮箱地址:zytrenren@163.com欢迎大家交流学习纠错! 1.安装apache #yum install httpd 2.配置开机启动 systemctl enable httpd 3. ...

  3. Vue2 几种常见开局方式

    在SF问题中看到了一个关于vue-cli中的template问题,问题是这样的:用vue-cli工具生成的main.js中: import Vue from 'vue' import App from ...

  4. Shell中判断语句if中-z至-d的意思

    [ -a FILE ] 如果 FILE 存在则为真. [ -b FILE ] 如果 FILE 存在且是一个块特殊文件则为真. [ -c FILE ] 如果 FILE 存在且是一个字特殊文件则为真. [ ...

  5. Android string.xml 添加特殊字符

    解决项目中在string.xml 中显示特殊符号的问题,如@号冒号等.只能考虑使用ASCII码进行显示: @号 @ :号 : 空格   以下为常见的ASCII十进制交换编码: --> <- ...

  6. C# 代码中调用 Javascript 代码段以提高应用程序的配置灵活性(使用 Javascript .NET 与 Jint)

    一般来说,我们需要在开发应用软件的配置文件中,添加一些参数,用于后续用户根据实际情况,自行调整. 配置参数,可以放在配置文件中.环境变量中.或数据库表中(如果使用了数据库的话).通常,配置数据,以 k ...

  7. ASP.NET Core 应用发布与部署指南

    一.前言 本篇主要包含哪些内容? 将项目发布到本地目录 将项目传输到服务器并配置启动&开机自动启动 将Nginx作为访问入口,配置反向代理 本篇环境信息 开发环境: 用途 工具&版本 ...

  8. 使用VSTS的Git进行版本控制(七)——管理仓库

    使用VSTS的Git进行版本控制(七)--管理仓库 在团队项目中创建Git repo管理项目的源代码.每个Git repo都有自己的权限和分支,可以与项目中的其他工作隔离开来. 任务1:从web门户创 ...

  9. spark RDD,reduceByKey vs groupByKey

    Spark中有两个类似的api,分别是reduceByKey和groupByKey.这两个的功能类似,但底层实现却有些不同,那么为什么要这样设计呢?我们来从源码的角度分析一下. 先看两者的调用顺序(都 ...

  10. PowerDesigner 12.5 汉化包-CSDN下载

    来源 csdn积分下载的. 人们太小家子气,随随便便文件要那么多积分. 地址 链接: https://pan.baidu.com/s/1cwc24Y 密码: cr9k