一、代码块

if True:
print(333)
print(666) for i in "":
print(i)

虽然上面的缩进的内容都叫代码块,但是他不是python中严格定义的代码块。
python中真正意义的代码块是什么?

块是一个python程序的文本,他是作为一个单元执行的。
代码块:一个模块,一个函数,一个类,一个文件等都是一个代码块

而对于一个文件中的两个函数,也分别是两个不同的代码块:

def func():
print(333) class A:
name = 'xiaojing'

交互模式下,每一行是一个代码块。

什么叫交互方式?就是咱们在cmd中进入Python解释器里面,每一行代码都是一个代码块
>>> i1 = 520  可以理解为这一行在一个文件中。
>>> i2 = 520  可以理解为这一行在另一个文件中。

二、id is ==

在Python中,id是什么?id是内存地址,== 是比较的两边的数值是否相等,而 is 是比较的两边的内存地址是否相等。

如果内存地址相等,那么这两边其实是指向同一个内存地址。

name = 'shuaige'  # 赋值
print('shuaige' == 'shuaige') # True, 数值相同 name2 = 'abc123'
name3 = 'abc123'
print(id(name2), id(name3)) # 2370269674608 2370269674608
print(name2 is name3) # True

在内存中id都是唯一的,如果两个变量指向的值的id相同,就证明他们在内存中是同一个。
is 判断的是两个变量的id值是否相同。
如果is是True, == 一定是True。== 是True,is不一定是True

三、小数据池(缓存机制,驻留机制)

1、介绍

小数据池的应用的数据类型: 一定范围内的整数,一定规则的字符串,bool值

小数据池是python对内存做的一个优化:
python将 -5 ~256 的整数,以及一定规则的字符串,bool值,进行了缓存,就是提前在内存中创建了池(容器),
在这些容器里固定的放了这些数据。

为什么这么做???

  1. 节省内存。
  2. 提高性能与效率。

2、一定范围内的整数

对于整数来说,小数据池的范围是 -5~256 ,如果多个变量都是指向同一个(在这个范围内的)数字,他们在内存中指向的都是一个内存地址。

3、一定规则的字符串

1,字符串的长度为0或者1,默认都采用了驻留机制(小数据池)

2,字符串的长度>1,且只含有大小写字母,数字,下划线时,才会默认驻留。

3,用乘法得到的字符串,分两种情况。

     3.1 乘数为1时:仅含大小写字母,数字,下划线,默认驻留。

3.1.2含其他字符,长度<=1,默认驻留。

3.1.3含其他字符,长度>1,默认驻留

3.2 乘数>=2时:仅含大小写字母,数字,下划线,总长度<=20,默认驻留。

4,指定驻留。

from sys import intern
a = intern('hello!@'*20)
b = intern('hello!@'*20)
print(a is b)
#指定驻留是你可以指定任意的字符串加入到小数据池中,让其只在内存中创建一个对象,多个变量都是指向这一个字符串。

四、代码块与小数据池的关系

同样一段代码,为什么在交互方式中(cmd命令的终端)执行,和通过pycharm执行结果不同呢?

# pycharm 通过运行文件的方式执行下列代码:
i1 = 520
i2 = 520
print(i1 is i2) # 结果为True
通过交互方式中执行下面代码:
>>> i1 = 520
>>> i2 = 520
>>> print(i1 is i2) #结果为False

那为什么结果会不同呢?

对于pycharm:

在同一个代码块中的变量(数字,字符串),初始化对象的命令时,首先会从小数据池中找,如果没有找到,它会将变量与值的对应关系放到一个字典中,
同一个代码块中的其他变量遇到初始化对象的命令,他会先从字典中寻找,如果存在相同的值,他会复用,指向的都是同一个内存地址。

所以,在pycharm中的两行变量赋值中(实际上在同一个代码块中的赋值):
(注意:如果这个变量不是数字或者字符串,那么值相同,地址也是不同的)

s1 = 1000
s2 = 1000
print(s1 is s2) # True l1 = [1,2]
l2 = [1,2]
print(id(l1), id(l2)) # 1745841050760 1745840183304
print(l1 == l2) # True
print(l1 is l2) # False

对于cmd命令行:

而在cmd命令的终端中(交互模式),每一行都是一个代码块,因此在cmd命令的终端中,s1和s2是在不同的代码块,因此s1 is s2 是False

在不同的代码块:初始化对象的命令时,首先从小数据池中寻找,如果在小数据池,那么地址相同,如果不在小数据池中,则创建新的地址。

不同代码块中:

def func():
i1 = 1000
print(id(i1)) # def func1():
i2 = 1000
print(id(i2)) #
func()
func1()
# 一个函数是一个代码块,因此这里的i1的地址跟i2的地址不是同一个地址

总结:
同一代码块中:
如果变量在小数据池,那么地址相同,
如果不在小数据池,那么如果变量是数字或者字符串,也会复用地址,地址也相同,
如果变量不是数字或者字符串,那么地址不同。

不同一代码块中:
如果变量在小数据池,那么地址相同,
如果不在小数据池,那么地址不同。

五、编码二

"""
位:计算机时间里面的二进制
字节:8位二进制 等于 1个字节 # 这是不变的
字符:就是我们平常可以看到的文字、字母之类的,比如: ABC,我爱python等。
"""
ASCII: 只包含字母,数字,特殊字符。
8位二进制(bit)等于1个字节(Bytes),1个字节代表一个字符
A: 0000 0010
B: 0000 0011 unicode: 万国码,包含世界上所有的文字。
创建之初:16位二进制(bit)[即2个字节(Bytes)]代表1个字符
A :0001 0010 0000 0010
中:0011 0010 0000 0110
缺点:还不能完全覆盖世界上的所有文字 升级:32位二进制(bit)[即4个字节(Bytes)]代表1个字符
A :0000 0010 0100 0010 0000 0010 1000 0010
中:0001 0010 0010 0010 0000 0010 0010 0010
缺点:虽然能够覆盖全世界的文字,但是浪费资源。 对unicode升级 --> utf-8:最少用8位表示一个字符。
A :0000 0010 # 字母,数字,特殊字符按照ASCII规则,8位(1个字节)代表1个字符
欧:0000 0010 0100 0010 # 对于欧洲文字,使用16位(2个字节)代表1个字符
中:0000 0010 0001 0010 0000 0010 # 对于中文,使用24位(3个字节)代表1个字符 我国特有的编码 --> GBK(国标):字母,数字,特殊字符,中文。
A :0000 0010 # 字母,数字,特殊字符按照ASCII规则,8位(1个字节)代表1个字符
中:0000 0010 0001 0010 # 对于大部分中文,使用16位(2个字节)代表1个字符
# 国标只包含绝大部分我们日常使用的中文,对于一些比较偏的中文是没有的 1, 编码之间不能互相识别。
2, 网络传输,或者硬盘存储的010101,必须是以非uniocde编码方式的01010101. 3,大环境python3x:
str:内存(内部)编码方式为Unicode,因此python3中的字符串不能直接用于网络传输和硬盘存储,为了解决这个问题,就出现了bytes
bytes:python的基础数据类型之一,他和str相当于双胞胎,str拥有的所有方法,bytes类型都适用。 区别:
英文字母:
str:
表现形式:s1 = 'xiaohei'
内部编码方式:unicode bytes:
表现形式:b1 = b'xiaohei'
内部编码方式:非unicode 中文:
str:
表现形式:s1 = '小黑'
内部编码方式:unicode bytes:
表现形式:b1 = b'\xe5\xb0\x8f\xe9\xbb\x91'
内部编码方式:非unicode 如何使用:
你想将一部分内容(字符串)写入文件,或者通过网络socket传输,这样这部分内容(字符串)必须转化成bytes才可以进行。
在平时的代码中,可以直接使用字符串。 具体使用方法:encode编码 decode解码(bytes拥有str的所有方法) encode()不写参数,默认编码成utf-8 str ---> bytes encode 编码
非中文可以使用encode(),也可直接在字符串前加一个 b 表示bytes
s1 = 'xiaohei' b1 = b'xiaohei' # 等于 b1 = s1.encode()
b2 = b1.upper() print(s1, type(s1)) # xiaohei <class 'str'> print(b1, type(b1)) # b'xiaohei' <class 'bytes'>
print(b2, type(b2)) # b'XIAOHEI' <class 'bytes'> 中文只能使用encode()
s1 = '小黑'
b1 = s1.encode('utf-8')
b2 = s1.encode('gbk')
print(b1) # b'\xe5\xb0\x8f\xe9\xbb\x91'
print(b2) # b'\xd0\xa1\xba\xda' bytes ---> str decode 解码
b1 = b'\xd0\xa1\xba\xda' # gbk的bytes
s2 = b1.decode('gbk') # 对应用gbk的解码
print(s2) # 小黑

六、字节单位之间的换算

位(bit,缩写为b)是存储器的最小单位,可以表示一位二进制数。1字节(Byte,缩写为B)由8个位组成,即1Byte=8bit,是存储器的基本单位,通常被作为一个存储单元。通常情况下,把B称为字节、b称为字位、KB称为千字节、MB称为兆字节、GB称为吉字节。

1字位(bit)=1个二进制数

1字节(Byte)=8字位=8个二进制数

1B=8b
1KB=1024B
1MB=1024KB
1GB=1024MB

python基础之小数据池、代码块、编码和字节之间换算的更多相关文章

  1. python基础之小数据池、代码块、编码

    一.代码块.if True: print(333) print(666) while 1: a = 1 b = 2 print(a+b) for i in '12324354': print(i) 虽 ...

  2. python基础之小数据池

    一,id,is,== 在Python中,id是什么?id是内存地址,比如你利用id()内置函数去查询一个数据的内存地址: name = '太白' print(id(name)) # 158583128 ...

  3. python基础之小数据池,is和==区别 编码问题

    主要内容 小数据池,is和==区别 编码问题 小数据池 一种缓存机制,也称为驻留机制,是为了能更快提高一些字符串和整数的处理速度is 和 == 的区别 == 主要指对变量值是否相等的判断,只要数值相同 ...

  4. Python基础篇 -- 小数据池和再谈编码

    小数据池 1. id() 通过id()可以查看到一个变量表示的值在内存中的地址 s = "Agoni" print(id(s)) # 2410961093272 2. is 和 = ...

  5. python之路--小数据池,再谈编码,is和 == 的区别

    一 . 小数据池 # 小数据池针对的是: int, str, bool 在py文件中几乎所有的字符串都会缓存. # id() 查看变量的内存地址 s = 'attila' print(id(s)) 二 ...

  6. 百万年薪python之路 -- 小数据池和代码块

    1.小数据池和代码块 # 小数据池 -- 缓存机制(驻留机制) # == 判断两边内容是否相等 # a = 10 # b = 10 # print(a == b) # is 是 # a = 10 # ...

  7. 百万年薪python之路 -- 小数据池和代码块练习

    1.请用代码验证 "alex" 是否在字典的值中? info = {'name':'王刚蛋','hobby':'铁锤','age':'18',...100个键值对} info = ...

  8. python 浅谈小数据池和编码

    ⼀. ⼩数据池 在说⼩数据池之前. 我们先看⼀个概念. 什么是代码块: 根据提示我们从官⽅⽂档找到了这样的说法: A Python program is constructed from code b ...

  9. Python细节(二)小数据池

    3.8小数据池 python是由代码块构成的 代码块,一个模块.一个函数,一个类,一个文件,eval(),exec()执行的时候也是一个代码块 1.内存地址 id() 通过id() 我们可以查看到一个 ...

随机推荐

  1. mathjs,math.js解决js运算精度问题

    <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...

  2. WPF:使用TypeConverter

    所谓TypeConverter就是类型转换器,支持两种类型之间相互转换 你可以重写转换逻辑,只要你清楚转换的协议,就可以实现类型互转. 定义一个Person类型,具有一个int类型的Age属性: pu ...

  3. 【NodeJS】Node.JS 开发环境安装

    1.前言 简单的说 Node.js 就是运行在服务端的 JavaScript. Node.js 是一个基于Chrome JavaScript 运行时建立的一个平台. Node.js是一个事件驱动I/O ...

  4. DAS、SAN和NAS三种存储方式

    DAS存储 DAS存储在我们生活中是非常常见的,尤其是在中小企业应用中,DAS是最主要的应用模式,存储系统被直连到应用的服务器中,在中小企业中,许多的数据应用是必须安装在直连的DAS存储器上. DAS ...

  5. iOS MVVM架构总结

    为什么使用MVVM iOS中,我们使用的大部分都是MVC架构.虽然MVC的层次明确,但是由于功能日益的增加.代码的维护,使得更多的代码被写在了Controller中,这样Controller就显得非常 ...

  6. hrbust1140 数字和问题

    题目: 定义一种操作为:已知一个数字,对其各位数字反复求和,直到剩下的数是一位数不能求和为止.例如:数字2345,第一次求和得到2 + 3 + 4 + 5 = 14,再对14的各位数字求和得到1 + ...

  7. sqlserver数据库导出表结构和表数据生成创建表和insert语句

    问题描述: 有时候我们只需要导出一张表和表数据到另外一个数据库,如果是备份整个库的话,就会很麻烦那样,没法满足需求. 解决方法: 以sqlserver2014为例:把MGActivity数据库的bat ...

  8. 我认知的javascript之作用域和闭包

    说到javascript,就不得不说javascript的作用域和闭包:当然,还是那句老话,javascript在网上都说得很透彻了,我也就不过多的强调了: 作用域:javascript并没有像其他的 ...

  9. isinstance_issubclass

    isinstance和issubclass分别是检验是不是对象是不是类的实例化,和子类是不是这个父类的子类 class A:pass class B(A):pass a = A() print(isi ...

  10. centos7下git版本升级及gitlab安装

    centos系统自带的git版本过低,当使用git拉取.推送.克隆的时候可能会报错,常见的错误: error: The requested URL returned error: 401 Unauth ...