python代码是如何执行的?
解释运行程序
回忆上次内容
py
文件的程序是按照顺序- 一行行挨排解释执行的
- 我们可以
python3 -m pdb hello.py
来对程序调试 - 调试的目的是去除
bug
- 别害怕
bug
bug
会有提示- 我们也就知道如何
debug
调试
顺序执行
- 程序在文本中从上到下是一行行写的
- 调试的时候也是从头到尾一行行执行的
- 但是执行的时候是如何把代码一行行解释执行的呢?
说到底
python3
到底是个啥呢?python3
又是怎么解释hello.py
的?- 这两这节课相当复杂
- 如果感觉太过复杂
- 可以直接跳过
- 不影响后面的理解
- 我们先要看看python3对Guido.py做了些什么???
tokenize
- 首先把字符分组成词
- 词法分析(lexical analysis)中
编辑
- 把原来的字符流
变成了词的流
- token(令牌)流
编辑
- 词法分析之后输出的是一个token流
什么是token流呢?
- 首先要知道什么是token
token
token
- 令牌
编辑
古人说听我号令
- 号指的是号角
令指的是令牌
- 急急如律令
- 令行禁止
- 怎么把源文件变成一个token流呢?
python3模块
- 这个东西是python3的一个模块
正在上传…重新上传取消
- 具体怎么运行呢?
token流
我们尝试运行
- python3 -m tokenize guido.py
- 对guido.py进行词法分析
- 分析出来的词(token)流长什么样子呢?
编辑
- 这个词怎么理解呢?
token流
- 第0行设置了编码格式
第1行[0,5)字符是第1行第1个token
- print是一个Name(名字)
第1行[5,6)字符是第1行第2个token
- (
- (是一个Operator(操作符)
第1行[6,30)字符是第1行第3个token
- "1982------Guido in cwi"
- 这是一个String(字符串)
第1行[30,31)字符是第1行第4个token
- )
- )是一个Operator(操作符)
第1行[31,32)字符是第1行第5个token
- \n
- \n是一个NewLine(换行符)
- 换行符意味着第一行结束
- 第2行...
编辑
- 词分析出来之后呢?
组词
词分析出来就是怎么组词的问题
- 哪些词和哪些词先组合
- 哪些词和哪些词后组合
生成一棵抽象语法树
- AST(Abstract Syntax Tree)
编辑
- 具体怎么生成这棵ast树呢?
引入ast模块
编辑
- 具体怎么做呢?
流程
- 先把这个ast模块导入(import)进来
- 然后读取guido.py并送到s
- 然后对于s进行语法分析(parse)
编辑
- 不过这乱七八糟堆一起怎么理解呢?
缩进换行
- 把分析的结果进行dump(转储)
编辑
- 目前lanqiao.cn上面的python是3.8
- 这个换行需要在3.9以上完成
- 只能在本地演示一下
缩进演示
编辑
- 这个就是把词组成语法树的样子
- 但是语法树还不能直接执行
- 什么才能直接执行呢?
翻译成字节码
- 字节码(指令)才能真正执行
- 怎么把ast转化为字节码(指令)呢?
- 需要编译
从一种语言到另一种语言
- 从py文件
- 到字节码(指令)
编辑
- 我可以看看这个编译过程么?
compile
编辑
编辑
- 这个东西完全是乱码
- 我看不懂啊?
- vi打开这个这个pyc文件
二进制形态
- :set wrap设置换行
编辑
- 可以看到他的二进制形态么?
二进制
:%!xxd
- 把文件转化为二进制
编辑
- 实在是看不懂啊
- 能把这个字节码(指令)变成我们人能看懂的么?
反编译
disassembler这个词由两部分组成
- dis (反着来的)
- assembler (汇编语言)
整体就是
- 把py源文件编译成的字节码(指令)
- 反编译(disassembler)成这些字节码对应的助记符(指令的含义)
编辑
- 这可以用么?
- 去试试!
反编译(dis)
- python3 -m dis guido.py
编辑
我们可以看见
- 前面是行号
每行对应4条指令
- LOAD_NAME 装载函数名
- LOAD_CONST 装载参数
- CALL_FUNCTION 调用函数
- POP_TOP 弹栈返回
- 每条指令对应一个字节码
- 那具体这个LOAD_NAME是什么意思呢?
指令
- 指令对应着一个字节码状态
编辑
- 但是LOAD_NAME这条指令
- 具体对应什么二进制字节状态呢?
二进制状态
编辑
- 我们找找程序中的4条指令对应的字节状态
4条指令
指令助记符 | 指令含义 | 十进制状态 | 十六进制状态 |
---|---|---|---|
LOAD_NAME | 装载函数名称 | 101 | 0x65 |
LOAD_CONST | 装载参数 | 100 | 0x64 |
CALL_FUNCTION | 调用函数 | 142 | 0x8e |
POP_TOP | 弹栈返回 | 1 | 0x01 |
- 可以找到源代码的对应关系么?
编辑
- 好像找到了
- 但是0x83 对应的是 GET_AWAITABLE
- 显然00 83是从表中的0号位置取得字符串变量
- 01 83是从表中的1号位置取字符串
- 以此类推,直到05 83
那这些代码究竟是什么指令集的呢?
- 龙芯
- intel
- 还是arm呢?
虚拟机的虚拟cpu
- 这些字节码(bytecode)对应的是python虚拟机上面虚拟cpu的指令集
编辑
- 怎么还有虚拟机
- 虚拟cpu呢?
- 我们先把这节课总结一下
总结
我们把python源文件
- 词法分析 得到 词流(token stream)
- 语法分析 得到 抽象语法树(Abstract Syntax Tree)
- 编译 得到 字节码 (bytecode)
- 反编译 得到 指令文件
编辑
- 不过这个指令文件是基于虚拟机的虚拟cpu的指令集
- 怎么这么虚呢?
- 我们下次再说
本文章来自于《oeasy教您玩转python》(https://www.lanqiao.cn/courses/3584)中第6个实验。
python代码是如何执行的?的更多相关文章
- JAVA,Python代码是编译执行还是解释执行?
转载地址:http://blog.csdn.net/zv3e189os5c0tsknrbcl/article/details/78661641 有人在讨论 Python 代码是编译执行还是解释执行?这 ...
- 关于python代码是编译执行还是解释执行
Python 是编译型语言还是解释型语言?回答这个问题前,应该先弄清楚什么是编译型语言,什么是解释型语言. 所谓编译执行就是源代码经过编译器编译处理,生成目标机器码,就是机器能直接运行的二进制代码,下 ...
- 交互模式下测试python代码及变量的四则运算
在交互模式下,python代码可以立即执行,所以这很方便我们进行代码测试 1.命令窗口,输入python (如果没配置环境变量则需带python安装目录的绝对路径) >>> 这个就是 ...
- 深入理解 GIL:如何写出高性能及线程安全的 Python 代码
深入理解 GIL:如何写出高性能及线程安全的 Python 代码 本文由 伯乐在线 - 郑芸 翻译.未经许可,禁止转载!英文出处:A. Jesse.欢迎加入翻译组. GIL对多线程的影响:http:/ ...
- python代码块,小数据池,驻留机制深入剖析
一,什么是代码块. 根据官网提示我们可以获知: 根据提示我们从官方文档找到了这样的说法: A Python program is constructed from code blocks. A blo ...
- 一种部署 Python 代码的新方法
在Nylas,我们喜欢使用Python进行开发.它的语法简单并富有表现力,拥有大量可用的开源模块和框架,而且这个社区既受欢迎又有多样性.我们的后台是纯用 Python 写的,团队也经常在 PyCon ...
- 用Pylint规范化Python代码,附PyCharm配置
Pylint一个可以检查Python代码错误,执行代码规范的工具.它还可以对代码风格提出建议. 官网:https://pylint.readthedocs.io pip install pylint ...
- Python代码的编译
Python代码的编译 Python代码在解释执行之前,是会被编译成.pyc或者.pyo文件的,它们是中间字节码表示的文件,之后Python虚拟机才会去解释执行它们. 1.pyc文件 ======== ...
- Python基础:27执行环境
一:可调用对象 可调用对象,是任何能通过函数操作符“()”来调用的对象.Python 有4 种可调用对象:函数,方法,类,以及一些类的实例. 1:函数 python 有 3 种不同类型的函数对象. a ...
随机推荐
- HAVING,多表查询思路,可视化软件navicat,多表查询练习题,
HAVING "where"是一个约束声明,在查询数据库的结果返回之前对数据库中的查询条件进行约束,即在结果返回之 前起作用,且"where"后面不能写&quo ...
- 以点类 Point 及平面图形类 Plane 为基础设计三角形类 Triangle
学习内容:以点类 Point 及平面图形类 Plane 为基础设计三角形类 Triangle 代码示例: import java.util.Scanner; class Point{ private ...
- 浏览器上写代码,4核8G微软服务器免费用,Codespaces真香
欢迎访问我的GitHub 这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos 一图胜千言 先上图,下面是欣宸在自己的iPad Pro ...
- Unity-自定义事件派发器的两次尝试
一.前言: 在游戏开发的很多时候,需要引用其他类的方法,但是一旦类多起来了,相互引用会导致引用关系混乱,极其难以阅读. 以前初次做抖音小游戏时,和一位经验老道的cocos程序员合作,看到我写的代码他不 ...
- vue组件传参的方法--bus事件总线
定义:事件总线是实现vue任意组件之前传递参数的一种编程技巧,本质上就是组件的自定义事件.事件总线有很多种写法,具体的思路就是创造一个大家都可以访问到的公共的属性,在这个公共的属性上面可以调用$on, ...
- 树莓派使用Docker部署EdgeX(jakarta版本)
使用Docker部署EdgeX 老师安排我搞边缘计算,搞了很久都没能明白边缘计算是什么,甚至对其兴趣不大,前一阵弄好了lorawan网关,该做网关内部的边缘计算了,发现自己已经慢慢地学了进去,总是想要 ...
- PostgreSQL 13支持增量排序(Incremental Sorting)
PostgreSQL 13支持增量排序(Incremental Sorting) PostgreSQL 13一个重要的功能是支持增量排序,使用order by 时可以加速排序,SQL如下 select ...
- 【Azure 应用服务】NodeJS Express + MSAL 应用实现AAD集成登录并部署在App Service Linux环境中的实现步骤
问题描述 实现部署NodeJS Express应用在App Service Linux环境中,并且使用Microsoft Authentication Library(MSAL)来实现登录Azure ...
- Linux离线包管理器RPM
Linux离线包管理器RPM RPM 是RedHat Package Manager(RedHat软件包管理工具). 1.rpm常用参数介绍 查看rpm是否安装 rpm -q rpm包名 [root@ ...
- CSRF跨站请求伪造与XSS跨域脚本攻击讨论
今天和朋友讨论网站安全问题,聊到了csrf和xss,刚开始对两者不是神明白,经过查阅与讨论,整理了如下资料,与大家分享. CSRF(Cross-site request forgery):跨站请求伪造 ...