[oeasy]python0022_ python虚拟机_反编译_cpu架构_二进制字节码_汇编语言
程序本质
回忆上次内容
python3
的程序是一个 5.3M 的可执行文件
- 我们通过which命令找到这个python3.8的位置
- 将这个python3.8复制到我们的用户目录下
- 这个文件还是能够执行的
- 将这个文件转化为字节形态
- 确实可以转化
- 但是这个文件我们看不懂啊!!!
编辑
- 怎么才能看懂这些东西呢?
- 这个东西我们确实看不懂
- 但是有人能看懂
- 谁呢?
真实的cpu
- 无论手机还是计算机
- 最核心器件的器件就是cpu
编辑
- 这个东西是个实实在在存在的实体
- 这个cpu就能看懂这些字节码吗?
cpu
- cpu能看懂这些字节码!!!
- 这些字节码
- 我们看不懂的
- cpu能看懂
- 这是属于cpu的机器语言
- 这就是cpu的一条条的机器指令(instruction)
编辑
- 机器指令码都是二进制字节形式的
- 我们尝试把python3.8转化为字节表现形式
反汇编-汇编语言助记符
#先把~/python3对应的机器语言输出为汇编指令形式(反汇编)
objdump -d python3.8 > python3.8.asm
vi python3.8.asm
- 这次真的可以看懂了
- 减法(sub)
- 移动(mov)
- 这些指令
编辑
- 可以发现当前系统的架构(指令集)是x86-64
- 这些和我们刚才的字节形态有关系吗?
对比
- 用vi分窗口分别打开打开python3 和 python3.asm
vi -o python3.8hex python3.8.asm
- 下图中上半部分是机器语言
编辑
- 上图下半部分是机器语言对应的汇编指令助记符
- ctrl+j、ctrl+k可以上下窗口切换
- 我们来试着找找
- python3.8文件中
- 机器语言的0101和cpu的汇编指令的对应关系
找到了
- 下面窗格
- 先跳到第8行
- endbr64 意味着 64位结束分支
- 下面就是第9行
编辑
- 第9行
-
/48 83
找到上下的对应关系 - 也就是第一条执行的汇编指令sub
- sub对应substract 是减法
- 汇编指令是计算机 cpu 机器指令的助记符
查找对应关系
-
423000
就是初始化(init)的 cpu 开始执行指令的地址 - 我们在上面查找48 83
- 看有没有对应的字节
- /4883 ec08 488b...
- 在上面的窗格中
- 搜索这些字节形态
编辑
- 好像找到了对应关系
- 具体怎么对应的呢?
- 这台计算机用的是什么指令集呢?
- 什么是指令集来着?
指令集
- 指令集就是指令的集合
编辑
- 指令集也叫计算机的架构
- 不同架构的 cpu 有不同的指令集
- 我们目前的这个浏览器里面的系统用的是
x86-64
- 除此之外
arm
、MIPS
、RISC-V
也是常用的指令集
- 指令助记符和机器语言到底是则怎么对应的呢?
回到代码
- 代码会有不同的
section
模块
- 入口是
init
- 作用是初始化
initialization
编辑
- 模块里面是具体的指令
- 比如第一句
48 83 ec 08
- 为什么48 83 就可以代表减法
- 这是谁规定的呢?
查看指令集
- 这是cpu架构规定的
- 首先要明确到当前机器的cpu的架构
- 反汇编里面说是x86-64
编辑
- 到shell里面验证一下
编辑
- 当前机器所用的架构指令集确实是x86-64
- 这是谁的架构呢?
搜索
- 不会了就去搜索
编辑
- 去intel官网找指令集
查询x86_64指令集
- 找到cpu的手册
- 可以找到指令和二进制状态之间的关系么?
- 先要找到x86-64指令集中 48 83 这条指令
编辑
- 注意上图中
- 100B中的B是0或1
- 100B可以是1000
- 也可以是1001
- 这确实是一条减法指令
- 而且是8位立即数和寄存器的减法运算
逐步搜索
编辑
- 找起来真的很费劲
-
48 83 ec 08
对应 sub $0x8,%rsp
- 确实是一条减法指令
- 确实是8位立即数和寄存器的减法运算
编辑
- 和objdump的结果是一致的
- 废话!!!
- 除了减法指令sub之外
- 还有什么别的指令呢?
更多cpu指令
- 指令那可还有很多的
- 有运算的
- 有移位的
- 加减乘除都有
编辑
- 这些指令的集合就是指令集
- 指令集就是cpu运行的基础!
- 这些机器语言的指令不能在别的指令集架构上运行么?
移植 port
- 想在别的指令集架构上运行程序
- 就需要移植(port)
- 移植(port)指的是从一种指令集移植到另一种指令集
- 从这个词的词源
- 可以看出欧美的航海文化基础
- port 港口
- 也可以看出我们的农耕文化基础
- 移植
编辑
- 不移植会如何呢?
不移植
- 这是playstation2的架构图
- cpu是mips架构的
编辑
- 不移植的话
- 就是让x86架构的pc
- 去直接执行这些基于mips架构的的0101... 字节码
- 就像让一个意大利泥瓦匠看一份中文写成的烹饪书来砌墙
- 鸡同鸭讲
- 驴唇不对马嘴
- 0101的文件执行出来全是乱的
- 完全不能用
- 而且不全是软件的问题
- 也涉及到硬件等方面
- 可能某个寄存器在新架构中根本就不存在
架构师
- 这个时候架构师要解决相当多的问题
- 很不容易的
编辑
- 落实到我们的python3.8游乐场
- 我们的python3.8就是这样的一系列的cpu指令
- 可以解释py文件的
- python3.8 又是如何解释py文件的来着?
python3 执行过程
- 不管是python3.8这个游乐场
- 还是hello.py这个python程序
- 都在我们的硬盘上
编辑
- 先得把文件从硬盘读到内存
python3 执行的过程大致是这样
- 先把python3.8这个主解释器加载到内存中
- 然后在x86-64的cpu上执行
- 模拟出一台python虚拟机
编辑
- 对py文件解释执行
- 那为什么py程序可以跨架构跨平台呢?
架构的层次
- 不同架构的 cpu 都可以运行 python
- risc-v
- arm
- x64
- mips
- 龙芯
编辑
- 不同系统的环境都可以运行 python
- win
- mac
- linux
- freebsd
跨架构跨平台原理
- 由于python3.8 的源文件
- 被不同的架构的编译器 编译后
- 被部署到 不同的cpu架构和系统上
- 所以同样的py文件被加载之后
- python程序可以对py文件跨架构、跨系统进行解释执行
- 一次编写到处运行
编辑
- 不同的架构下
- 汇编指令都不一样
- 怎么能正确解释执行同样的python程序呢?
跨架构跨平台原理
/usr/bin/python3.8
本身是二进制文件
- 是基于当前操作系统当前架构编译出来的
- 可执行二进制文件
- 不同的架构有不同的编译器
- 不同的编译器编译出来的python3.8
- 是不同的二进制指令序列
编辑
python3.8
构建了一个运行时环境
- 这个环境可以解释读到的
python语句
- 把
python语句
翻译成系统能读懂输入输出 - 翻译成当前架构能够执行的代码
- 然后边解释边执行
- 恭喜您完成了非常烧脑一个实验!
- 我们去总结吧!!!
总结
python3
的程序是一个 5.3M 的可执行文件
-
python3
里面全都是 cpu 指令 - 可以执行的那种
- 我们可以把指令对应的汇编找到
-
objdump -d ~/python3 > python3.asm
- 汇编语句是和当前机器架构的指令集相关的
-
uname -a
可以查询指令集
- 我们执行的过程其实就
- 系统执行
python3
这个可执行文件 - 给了
python3
一个参数hello.py
-
python3
对于hello.py
一句句的解释执行 - 在显示器输出了
hello world
-
python3
执行完毕 - 把控制权交回给 shell
- 这就是我们执行
hello.py
的过程 - 我想输出个稍微复杂点的东西
- 可以做下面这个框架标题吗?
编辑
- 我们下次再说!
- 蓝桥->https://www.lanqiao.cn/teacher/3584
- github->https://github.com/overmind1980/oeasy-python-tutorial
- gitee->https://gitee.com/overmind1980/oeasypython
- 视频->https://www.bilibili.com/video/BV1CU4y1Z7gQ 作者:oeasy
[oeasy]python0022_ python虚拟机_反编译_cpu架构_二进制字节码_汇编语言的更多相关文章
- python的exe反编译
目录 python的exe反编译 方法一.使用archive_viewer.py提取pyc 方法二.使用pyinstxtractor.py提取pyc python的exe反编译 驱动人生样本为pyth ...
- C#代码反编译 得到项目可运行源码
C#代码反编译 得到项目可运行源码 摘自:http://www.cnblogs.com/know/archive/2011/03/15/1985026.html 谈到"C#代码反编译&quo ...
- Android逆向之旅---反编译利器Apktool和Jadx源码分析以及错误纠正
Android逆向之旅---反编译利器Apktool和Jadx源码分析以及错误纠正 http://blog.csdn.net/jiangwei0910410003/article/details/51 ...
- 解决AndroidKiller APK 反编译失败,无法继续下一步源码反编译!
报错背景 今天使用AndroidKiller V1.3.1,反编译一个APK,遇到如下报错: 当前 Apktool 使用版本:Android Killer Default APKTOOL 正在反编译 ...
- ubuntu下把python脚本转为二进制字节码文件
ubuntu下把python脚本转为二进制字节码文件 听语音 原创 | 浏览:354 | 更新:2017-12-22 14:48 1 2 3 4 5 6 7 分步阅读 自己拥有个几个python脚本文 ...
- python调用java&反编译地址
反编译工具地址: https://github.com/java-decompiler/jd-gui/releases 你想知道的JPype全在这里∞ 先总结自己趟的坑 1. python进程是6 ...
- Java逆向武器库_反编译工具
1.反编译工具之_jd-gui 官网下载地址:http://java-decompiler.github.io/#jd-gui-download 使用: 下载后解压直接使用即可. jd-gui的优势是 ...
- class文件直接修改_反编译修改class文件变量
今天笔者同事遇到一个问题,客户同事的数据库连接信息直接写在代码中,连接的密码改了,但是又没有源代码,所以只能直接修改Java class文件. 记录一下修改步骤: 1.下载JClassLib_wind ...
- 使用Eclipse中的反编译插件jadClipse查看Class源码
功安装完插件jadClipse 之后便可以查看源码class文件了 但是对于自己代码的class文件,直接复制过来却看不到,需要以下操作. 将此文件以及文件夹直接拷贝到Eclipse中发现 右击项目- ...
- Python - 浅谈Python的编译与反编译
1 - Python编译过程涉及的文件 py 源代码文件,由python.exe解释,可在控制台下运行,可用文本编辑器进行编辑: pyc 源代码文件经过编译后生成的二进制文件,无法用文本编辑器进行编辑 ...
随机推荐
- 在友晶DE10-Lite开发板实现8051单片机
在友晶DE10-Lite开发板实现8051单片机 1. 移植过程 利用FPGA片内资源构建51系统.软核来自https://www.oreganosystems.at/.还需要添加rom.ram和ra ...
- 解决”将公司Linux服务器上的脚本导出到windows上打开串行的“问题
目录 一.前期准备 二.回车转换 一.前期准备 1.在linux服务器上写一个简单的脚本. [root@node5 ~]# vim linux脚本.sh [root@node5 ~]# cat lin ...
- Vue——基本使用
Vue.js 的核心是一个允许采用简洁的模板语法来声明式地将数据渲染进 DOM 的系统.我们不再和 HTML 直接交互了.一个 Vue 应用会将其挂载到一个 DOM 元素上 (对于这个例子是 #app ...
- 小程序的文件结构及配置 小程序配置 app.json
程序包含一个描述整体程序的 app 和多个描述各自页面的 page. 一个小程序主体部分由三个文件组成,必须放在项目的根目录,如下: 文件 必填 作用 app.js 是 小程序逻辑-小程序入口文件 a ...
- The model backing the 'MainDbContext' context has changed since the database was created. Consider using Code First Migrations to update the database (http://go.microsoft.com/fwlink/?LinkId=238269).
The model backing the 'MainDbContext' context has changed since the database was created. Consider u ...
- 手把手教你搭建Docker私有仓库Harbor
1.什么是Docker私有仓库 Docker私有仓库是用于存储和管理Docker镜像的私有存储库.Docker默认会有一个公共的仓库Docker Hub,而与Docker Hub不同,私有仓库是受限访 ...
- mysql ON DUPLICATE KEY UPDATE 演示
<e>查询:INSERT INTO member_test(mem_no,flag)VALUE('111','1') 错误代码: 1062Duplicate entry '111' for ...
- thinkpad t490触摸板失灵解决方法
笔记本电脑之前触摸板使用正常,可能在某次更新之后,发现失灵不可用. 解决方法: 更新或滚动触摸板驱动程序 当您在设备管理器中时,右键单击列表中的触摸板(可能称为Dell TouchPad,Lenovo ...
- Java编码规范-字符串与Integer的比较,BigDecimal非空参数
Java编码规范-字符串与Integer的比较,BigDecimal非空参数 package com.example.core.mydemo; import java.math.BigDecimal; ...
- C# .NET core Avalonia 11.0版本,发布linux和MAC的简单记录
.net core 7.0+centos 7.0 cetnos目前运行在hyper V虚拟机里 虚拟机部署的注意事项 1 需要配置网络环境, 确保在同一局域网下 如果sftp无法连接 ctrl+shi ...