Win32汇编:算数运算指令总结
整理复习汇编语言的知识点,以前在学习《Intel汇编语言程序设计 - 第五版》时没有很认真的整理笔记,主要因为当时是以学习理解为目的没有整理的很详细,这次是我第三次阅读此书,每一次阅读都会有新的收获,这次复习,我想把书中的重点,再一次做一个归纳与总结(注:16位汇编部分跳过),并且继续尝试写一些有趣的案例,这些案例中所涉及的指令都是逆向中的重点,一些不重要的我就直接省略了,一来提高自己,二来分享知识,转载请加出处,敲代码备注挺难受的。
汇编中常用的运算符,加减乘除等,另外包括了移位运算等,移位又分为,算数移位,逻辑移位,循环移位,双精度移位等。
再次强调:该笔记主要学习的是汇编语言,不是研究编译特性的,不会涉及到编译器的优化与代码还原。
ADD/SUB指令: ADD/SUB指令将将同尺寸的源操作数和目的操作数相加,且不改变原操作数,相加后的结果存入目的操作数中.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include kernel32.inc
includelib kernel32.lib
.data
MyList DWORD 10h,20h,30h,40h
.code
main PROC
; 将eax于ebx 两数相加: 将相加后的结果放入eax
mov eax,1024
mov ebx,2048
add eax,ebx
; 同样两数相减,将结果放到eax中
mov eax,1024
sub eax,512
; 针对数组的相加同样可以
mov esi,offset MyList ; 获取到首地址
mov eax,0
mov ebx,0
mov eax,dword ptr ds:[esi] ; 找到第一个元素
mov ebx,dword ptr ds:[esi + 1 * 4] ; 找到第二个元素
add eax,ebx ; 相加操作
invoke ExitProcess,0
main ENDP
END main
NEG 取反指令: 该指令通过将数字转换为对应的补码而求出其值的相反数,结合上面的加法与减法案例,我们来模拟编译器处理特定语句的写法Rval = -Xvar + (Yvar - Zvar)
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include kernel32.inc
includelib kernel32.lib
.data
Rval SDWORD ?
Xval SDWORD 26
Yval SDWORD 30
Zval SDWORD 40
.code
main PROC
; 1.写出: Rval = -Xvar + (Yvar - Zvar) 汇编格式
; 首先将Xval的值通过neg取反
mov eax,dword ptr ds:[Xval]
neg eax
; 然后将Yval与Zval相减后复制到Yval
mov ebx,dword ptr ds:[Yval]
sub ebx,dword ptr ds:[Zval]
;最后将两个子项相加后放入到Rval中
add eax,ebx
mov dword ptr ds:[Rval],eax
; 2.写出: Rval = (Xval+Yval) - (Yval+Zval)
mov eax,dword ptr ds:[Xval]
add eax,dword ptr ds:[Yval]
mov dword ptr ds:[Rval],eax
mov ebx,dword ptr ds:[Yval]
add ebx,dword ptr ds:[Zval]
sub dword ptr ds:[Rval],ebx
invoke ExitProcess,0
main ENDP
END main
AND/OR/XOR 布尔指令: AND指令是对数据进行与运算,OR指令则是对数据进行或运算,XOR则是异或,这三个指令都是将操作值保存在目的操作数中,需要注意的是这些运算符都是针对二进制数进行操作的.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include kernel32.inc
includelib kernel32.lib
.data
Rval DWORD ?
String BYTE "hello LYSHARK",0dh,0h
.code
ToString proc
mov ecx,lengthof String
mov esi,offset String
s: ;and byte ptr [esi],11011111b ; 清除第五位,小写变大写
or byte ptr [esi],00100000b ; 设置第五位,大写变小写
inc esi
loop s
ret
ToString endp
main PROC
; and 逻辑与运算
xor eax,eax
mov al,00111011b
and al,00001111b ; 运算后去除al中的0
mov eax,00401024h
and eax,0ffh ; eax = 00000024h
mov eax,00401024h
and eax,0ffffh ; eax = 00001024h
mov eax,00401024h
and eax,0ffff0000h ; eax = 00400000h
; or 逻辑或运算
xor edx,edx
mov dl,5 ; 二进制值
or dl,30h ; 转为有ASCII码
; xor 异或运算
mov eax,0ffh
xor eax,0ffh ; eax = 0
mov eax,4
xor eax,5 ; eax = 1
mov eax,0401000h
xor eax,0400000h ; eax = 00001000h
mov eax,0401000h
xor eax,01000h ; eax = 00400000h
; 异或可用于检查标志位
xor eax,eax
mov eax,00001111h
xor eax,0 ; 检查基偶标志
mov eax,00100101h
xor eax,0 ; 影响PF标志
call ToString
invoke ExitProcess,0
main ENDP
END main
SHL/SHR 逻辑移位: SHL常用于对目标操作数执行逻辑左移(无符号数)操作,其左移后最低位以0填充,而移动出去的最高位则会送入CF(进位标志)中,而SHR则相反,对目标操作数执行逻辑右移(无符号数)操作,移出的数据位用0代替,最低位被复制到CF(进位标志)中,原来的进位标志位丢失.
Intel处理器中定义,执行移位的源操作数的范围必须在0-255
之间,在任何处理器上都可以使用CL寄存器
存放移位位数,例如在下面的指令中,AL寄存器
被左移一位,最高位被复制到了进位标志中,最低位被清零:
01251006 | B3 8F | mov al,10001111b | AL = 10001111b
01251008 | D0E3 | shl al,1 | CF = 1,AL = 00011110b
01251006 | B0 01 | mov al,10000000b | AL = 10000000b
01251008 | C0E0 02 | shl al,2 | CF = 0,AL = 00000000b
01251006 | B0 01 | mov al,10000000b | AL = 10000000b
01251008 | C0E0 01 | shl al,1 | CF = 1,AL = 00000000b
01251006 | B0 01 | mov al,10100000b | AL = 10100000b
01251008 | C0E0 03 | shl al,2 | CF = 0,AL = 10000000b
另外使用SHL指令还可以进行2的次幂的高速乘法
运算,任何操作数左移动N位,就相当于该操作数乘以2的N次方,如下例子:
01311002 | B0 05 | mov al,5 | AL 左移动1位
01311004 | D0E0 | shl al,1 | al * 2 = 10
01311007 | B0 05 | mov al,5 | AL左移2位
01311009 | C0E0 02 | shl al,2 | al * 4 = 20
01311007 | B0 05 | mov al,5 | AL左移3位
01311009 | C0E0 03 | shl al,3 | al * 8 = 40
下面是一个左移计算的案例,我们通过汇编来计算Rval = ((Xval + Yval) - (Yval + Zval)) * 8
的结果.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include kernel32.inc
includelib kernel32.lib
.data
Rval SDWORD ?
Xval SDWORD 50
Yval SDWORD 100
Zval SDWORD 10
.code
main PROC
; Rval = ((Xval + Yval) - (Yval + Zval)) * 8
mov eax,dword ptr ds:[Xval]
add eax,dword ptr ds:[Yval]
mov ebx,dword ptr ds:[Yval]
add ebx,dword ptr ds:[Zval]
sub eax,ebx
; 乘以8也就是左移3位 1=>2 2=>4 3=>8 4=>16 5=>32 6=>64 7=>128
shl eax,3
mov dword ptr ds:[Rval],eax
invoke ExitProcess,0
main ENDP
END main
对目标操作数执行SHR逻辑右移(无符号数)
操作,移出的数据位用0代替,最低位被复制到CF进位标志
中,原来的进位标志位丢失.
0131100D | B0 01 | mov al,10001111b | AL = 10001111b
0131100F | D0E8 | shr al,1 | CF = 1,AL = 01000111b
0131100D | B0 01 | mov al,10001111b | AL = 10001111b
0131100F | D0E8 | shr al,2 | CF = 1,AL = 00100011b
另外任何无符号操作数逻辑右移N位,就相当于该操作数除以2的N次方
,如下例子:
01311012 | B2 20 | mov dl,20 | DL 右移1位
01311014 | D0EA | shr dl,1 | dl/2 = 10
01311012 | B2 20 | mov dl,20 | DL 右移2位
01311014 | D0EA | shr dl,2 | dl/4 = 5
下面是一个右移计算的案例,我们通过汇编来计算Rval = (Xval / 8) + (Yval * 16) - (Zval * 4)
的结果.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include kernel32.inc
includelib kernel32.lib
.data
Rval SDWORD ?
Xval SDWORD 200
Yval SDWORD 50
Zval SDWORD 10
.code
main PROC
; Rval = (Xval / 8) + (Yval * 16) - (Zval * 4)
; 混合移位计算: 1=>2 2=>4 3=>8 4=>16 5=>32 6=>64 7=>128
; 8=>256 9=>512 10=>1024 11=>2048 12=>4096 13=>8192 14=>16384
; 先通过右移3位,计算除法
mov eax,dword ptr ds:[Xval] ; Xval / 8
shr eax,3
; 再通过左移4位和2位分别计算乘法
mov ebx,dword ptr ds:[Yval] ; Yval * 16
shl ebx,4
mov ecx,dword ptr ds:[Zval] ; Zval * 4
shl ecx,2
add eax,ebx
sub eax,ecx
mov dword ptr ds:[Rval],eax
invoke ExitProcess,0
main ENDP
END main
上面的这种计算方式属于乘数刚好是2的次幂,如果不是2的次幂则需要拆分后计算,如下案例,为了计算无符号乘以36,可以把36分解成2的5次方和2的2次方,然后利用移位命令高效计算.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include kernel32.inc
includelib kernel32.lib
.data
Rval SDWORD ?
.code
main PROC
; 次方表: 1=>2 2=>4 3=>8 4=>16 5=>32 6=>64 7=>128
; 次方表: 8=>256 9=>512 10=>1024 11=>2048 12=>4096 13=>8192 14=>16384
; 计算 123 * 36
; 等式拆分 EAX * 36 => EAX * (32 + 4) => (EAX * 32) + (EAX * 4)
mov eax,123
mov ebx,eax ; 拷贝出一份
shl eax,5 ; 计算 (EAX * 32)
shl ebx,2 ; 计算 (EAX * 4)
add eax,ebx ; 最后相加
mov dword ptr ds:[Rval],eax
; 计算 123 * 24
; 等式拆分: EAX * 24 => EAX * (16 + 8) => (EAX * 16) + (EAX * 8)
mov eax,123
mov ebx,eax
shl eax,4 ; 计算 (EAX * 16)
shl ebx,3 ; 计算 (EAX * 8)
add eax,ebx
mov dword ptr ds:[Rval],eax
; 计算 123 * 21
; 等式拆分: EAX * 21 => EAX * (16 + 4 + 1) => (EAX * 16) + (EAX * 4) + (EAX * 1)
mov eax,123
mov ebx,eax
mov ecx,eax ; 得到 (EAX * 1)
shl eax,4 ; 计算 (EAX * 16)
shl ebx,2 ; 计算 (EAX * 4)
add eax,ebx
add eax,ecx
mov dword ptr ds:[Rval],eax
invoke ExitProcess,0
main ENDP
END main
下面是我通过寻找一些规律,能够在不查表的情况下逆推出其左移或者是右移中乘数或除数的具体值,如果比较复杂的话还是直接查表来的容易一些,此处只是一种思考方式.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include kernel32.inc
includelib kernel32.lib
.data
Rval DWORD ?
.code
main PROC
; 次方表: 1=>2 2=>4 3=>8 4=>16 5=>32 6=>64 7=>128
; 次方表: 8=>256 9=>512 10=>1024 11=>2048 12=>4096 13=>8192 14=>16384
; 乘法逆推: 28/7=4
mov eax,7 ; eax=7
shl eax,2 ; 求0x2是乘以几,乘以4
mov dword ptr ds:[Rval],eax ; eax = 28 计算出: 0x2 => 28/7=4
; 乘法逆推: 96/6 = 16 => 4*4=16
mov eax,6 ; eax = 6
shl eax,2 ; 4
shl eax,2 ; 4
mov dword ptr ds:[Rval],eax ; eax = 96
; 乘法逆推: 4*4*8
mov eax,4 ; eax = 4
shl eax,2 ; 运行到此处 eax=16 通过16/4 = 4 故乘以4
shl eax,3 ; 运行到此处 eax =128 通过 128/4=32 , 32/4=8 故乘以8
mov dword ptr ds:[Rval],eax
; 除法逆推: 7/1.75 = 4
mov eax,7 ; eax = 7
shr eax,2 ; 此处乘以4
mov dword ptr ds:[Rval],eax ; eax = 1.75 => 7/1.75=4
invoke ExitProcess,0
main ENDP
END main
SAL/SAR 算数移位: SAL指令与SHL指令等价,SAR指令可以对有符号数进行快速除以2的次幂操作,也可以将一个AX寄存器中的值进行扩展,扩展成EAX.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include kernel32.inc
includelib kernel32.lib
.code
main PROC
; SAR => 算数右移
mov al,0f0h ; AL = 11110000b (-16)
sar al,1 ; AL = 11111000b (-8)
; SAR => 有符号除法 计算-128的,2的3次方
; 2次方 => -32 3次方 => -16 4次方 => -8 5次方 => -4
mov eax,-128 ; AL = 10000000b
sar eax,3 ; AL = 11110000b EAX = -16
; SAR => 符号扩展AX扩展到EAX
; 先左移EAX 16位,然后算术右移EAX 16位
mov ax,-128 ; EAX = ????FF80h
shl eax,16 ; EAX = FF800000h
sar eax,16 ; EAX = FFFFFF80h
invoke ExitProcess,0
main ENDP
END main
ROL/ROR 循环移位: ROL位循环左移,其左移1位后会把最高位同时复制到进位标志位和最低位中,而ROR则是循环右移,其右移1位后,把最低位同时复制到进位标志位和最高位中.
循环移位和普通移位不同之处在于前者并不会丢失任何数据位,从一端走的数据位会从另一端出现,如循环左移会将高位复制到低位中,循环右移则将低位复制到高位中,但需要注意不论是左移/右移,都是对二进制格式进行操作的.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include kernel32.inc
includelib kernel32.lib
.code
main PROC
; ROL => 循环左移
mov al,40h ; AL = 01000000b
rol al,1 ; AL = 10000000b , CF = 0
rol al,1 ; AL = 00000001b , CF = 1
rol al,1 ; AL = 00000010b , CF = 0
mov al,00100000b
rol al,3 ; AL = 00000001b , CF = 1
; ROR => 循环右移
mov al,01h ; AL = 00000001b
ror al,1 ; AL = 10000000b , CF = 1
ror al,1 ; AL = 01000000b , CF = 0
mov al,00000100b
ror al,3 ; AL = 10000000b , CF = 1
; ROL => 循环左移,交换位组
; 交换 高半部分(位4-7) 低半部分(位0-3)
mov al,26h
rol al,4 ; rol 与 ror 结果一致
ror al,4
invoke ExitProcess,0
main ENDP
END main
RCL/RCR 标志移位: RCL指令在每位左移1位后,把CF进位标志复制到最低有效位中,最高有效位复制到进位标志中, RCR则相反,右移后把CF进位标志复制到最高有效位中,并把最低有效位复制到进位标志中.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include kernel32.inc
includelib kernel32.lib
.code
main PROC
; RCL 左移
clc ; 将CF进位标志置0
mov bl,88h ; CF = 0 , BL = 10001000b
rcl bl,1 ; CF = 1 , BL = 00010000b
rcl bl,1 ; CF = 0 , BL = 00100001b
; RCR 右移
stc ; 将CF进位标志置1
mov ah,10h ; CF = 1 , ah = 00010000h
rcr ah,1 ; CF = 1 , ah = 10001000h
invoke ExitProcess,0
main ENDP
END main
让数组整体左移或右移.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include kernel32.inc
includelib kernel32.lib
.data
Rval SDWORD ?
ArraySize = 3
Array DWORD ArraySize DUP(99999999h)
ByteArray BYTE 81h,20h,33h
WordArray WORD 810dh,0c064h,93abh
.code
main PROC
; 多双字同时右移
mov esi,0
shr Array[esi + 8],1 ; 高双字
rcr Array[esi + 4],1 ; 中间双字
rcr Array[esi],1 ; 低双字
; 多双字同时左移
mov esi,0
shl Array[esi+8],1
rcl Array[esi+4],1
rcl Array[esi],1
; 让数组整体右移 (从高字节到低字节)
shr [ByteArray + 2],1
rcr [ByteArray + 1],1
rcr [ByteArray],1
; 让数组整体左移 (从低字节到高字节)
shl [ByteArray],1
rcl [ByteArray + 2],1
rcl [ByteArray + 4],1
invoke ExitProcess,0
main ENDP
END main
MUL/IMUL 乘法指令: MUL/IMUL分别可进行有符号与无符号的乘法运算,通常该指令都接受寄存器操作数,也接受内存操作数,但是不接受立即数,且乘数与被乘数大小必须相同,乘基尺寸是乘数/被乘数的两倍.
MUL乘法指令有三种格式: 第一种将8位操作数与AL相乘,结果放入AX中,第二种将16位操作数与AX相乘,结果的高16位放入DX低16位放入AX,第三种将32位操作数与EAX相乘,结果高32位放入EDX第32位放入EAX中.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include kernel32.inc
includelib kernel32.lib
.data
Rval DWORD ?
VarWordA WORD 2000h
VarWordB WORD 0100h
.code
main PROC
; 执行8位乘法运算 al = al*bl
mov al,5h
mov bl,10h
mul bl
mov byte ptr ds:[Rval],al
; 执行16位乘法运算
xor eax,eax
xor edx,edx
mov ax,word ptr ds:[VarWordA]
mul word ptr ds:[VarWordB]
mov word ptr ds:[Rval],ax ; 低半部分
mov word ptr ds:[Rval],dx ; 高半部分 DX:AX = 00000020h
; 执行32位乘法运算
xor eax,eax
xor edx,edx
mov eax,12345h
mov ebx,1000h
mul ebx
mov dword ptr ds:[Rval],eax ; 低半部分
mov dword ptr ds:[Rval],edx ; 高半部分 EDX:EAX = 0000000012345000h
invoke ExitProcess,0
main ENDP
END main
IMUL指令主要用于执行有符号整数的乘法运算,并保留乘积的符号位,且在32位汇编中有三种格式:但操作数格式,双操作数格式,三操作数格式,首先是单操作数模式,该模式把乘积存储在累加器AX中,或者将符号位放入EDX将结果放入EAX中.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include kernel32.inc
includelib kernel32.lib
.data
EDX_Rval DWORD ?
EAX_Rval DWORD ?
.code
main PROC
; 执行8位乘法运算: 48*8 得到的积+192 溢出
xor eax,eax
mov al,48
mov bl,4
imul bl ; CF 进位 = 1 OF 溢出 = 1
xor eax,eax
mov al,-4
mov bl,4
imul bl ; AX=FFF0h OF=0
; 执行16位乘法运算: 48*4 得到的积 +192
xor eax,eax
mov ax,48
mov bx,4
imul bx
mov word ptr ds:[EDX_Rval],dx
mov word ptr ds:[EAX_Rval],ax ; DX:AX = 000000C0h OF=0
; 执行32位乘法运算: +4823424 *(-423)
xor eax,eax
xor ebx,ebx
mov eax,+4823424
mov ebx,-423
imul ebx
mov dword ptr ds:[EDX_Rval],edx ; EDX为符号位
mov dword ptr ds:[EAX_Rval],eax ; EDX:EAX = FFFFFFFF86635D80h OF=0
invoke ExitProcess,0
main ENDP
END main
接着就是乘法语句的双操作数与三操作数模式了,在双操作数中第一个操作数必须是寄存器,第二个操作数可以是寄存器或内存等,在三操作数模式中,把乘积存储在第一个操作数中,其他与双操作数类似.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include kernel32.inc
includelib kernel32.lib
.data
wordp SWORD 4
dwordp SDWORD 4
Rval DWORD ?
.code
main PROC
; 双操作数乘法运算
xor eax,eax
xor ebx,ebx
mov ax,-16 ; ax = -16
mov bx,2 ; bx = 2
imul bx,ax ; bx = bx * ax
imul bx,2 ; bx = bx * 2
imul bx,word ptr ds:[wordp] ; bx = bx * wordp
mov word ptr ds:[Rval],bx ; 放入变量中保存
; 三操作数乘法运算
xor eax,eax
xor ebx,ebx
imul bx,wordp,-16 ; bx = wordp * -16
imul ebx,dwordp,-16 ; ebx = dwordp * -16
imul ebx,dwordp,-20 ; ebx = dwordp * -20
mov dword ptr ds:[Rval],ebx ; 放入变量中
invoke ExitProcess,0
main ENDP
END main
到此为止我们学会了通过移位的方式实现快速乘法
运算,也学过使用MUL指令进行乘法计算,接下来我们可以编写两个案例分别通过移位和MUL计算EAX与36相乘的结果,看看哪一个效率更高一些.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include kernel32.inc
includelib kernel32.lib
.code
shl_proc proc
mov ecx,10
s:
push eax
mov ebx,eax
shl eax,5
shl eax,2
add eax,ebx
pop eax
loop s
ret
shl_proc endp
mul_proc proc
mov ecx,10
s:
push eax
mov ebx,36
mul ebx
pop eax
loop s
ret
mul_proc endp
main PROC
mov eax,10
call shl_proc
mov eax,10
call mul_proc
invoke ExitProcess,0
main ENDP
END main
DIV/IDIV 除法指令: DIV是无符号除法指令,该指令支持8/16/32位无符号整数的除法运算,指令中唯的寄存器或内存操作数是除数,IDIV则是有符号除法指令,该指令与无符号除法几乎一致,唯一的不同在于有符号除法在进行相除操作时需要符号扩展.
首先我们先来学习一下DIV无符号除法运算的使用技巧,分别演示8/16/32位无符号除法的使用方式.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include kernel32.inc
includelib kernel32.lib
.data
Rval DWORD ?
DivIdend QWORD 0000000800300020h
DivIsor DWORD 00000100h
Div_Eax DWORD ?
Div_Edx DWORD ?
.code
main PROC
; 执行8位除法: 83/2 商al是41h 余数ah是1
xor eax,eax
mov ax,0083h ; 被除数
mov bl,2 ; 除数
div bl ; ax = ax / bl
mov byte ptr ds:[Rval],ah ; ah = 01h
mov byte ptr ds:[Rval],al ; al = 41h
; 执行16位除法: 8003h/100h 商是80h 余数是3
xor edx,edx ; 清除edx寄存器
mov ax,8003h ; 被除数
mov cx,100h ; 除数
div cx ; ax = ax / cx
mov word ptr ds:[Rval],ax ; ax = 0080h
mov word ptr ds:[Rval],dx ; dx = 0003h
; 执行32位除法
mov edx,dword ptr DivIdend + 4 ; 高双字
mov eax,dword ptr DivIdend ; 低双字
div DivIsor ; 与被除数相除
mov dword ptr ds:[Div_Eax],eax ; eax = 08003000h
mov dword ptr ds:[Div_Edx],edx ; edx = 00000020h
invoke ExitProcess,0
main ENDP
END main
针对IDIV有符号数的除法运算,需要对被除数进行除法操作之前,对其进行符号扩展,汇编中有三条扩展命令.
CBW 指令 将字节符号扩展至字,扩展AL的符号位至AH中,保留了数字的符号.
CWD 指令 将字符号扩展至双字,指令扩展AX的符号位至DX中.
CDQ 指令 双字符号扩展至八字节,指令扩展EAX的符号位至EDX中.
当使用符号扩展指令扩展后,寄存器就可以被用来计算有符号除法了,代码如下所示:
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include kernel32.inc
includelib kernel32.lib
.data
ByteVal SBYTE -48
WordVal SWORD -5000
DworeVal SDWORD +50000
Rval DWORD ?
.code
main PROC
; 字节扩展至字 -48/5
xor eax,eax
mov al,byte ptr ds:[ByteVal] ; al = D0 取出 -48
cbw ; ax = FFD0 将al扩展至ax
mov bl,5 ; bl = 05
idiv bl ; ax=ax/bl
mov word ptr ds:[Rval],ax ; 结果: ax = FDF7
mov byte ptr ds:[Rval],al ; AL保存商 -9
mov byte ptr ds:[Rval],ah ; AH保存余数 -3
; 字扩展至双字
xor eax,eax
mov ax,word ptr ds:[WordVal] ; 除数
cwd ; 扩展至双字(扩展AX至DX)
mov bx,+256 ; 被除数
idiv bx ; ax = ax/bx
mov word ptr ds:[Rval],ax ; 商AX=-19
mov word ptr ds:[Rval],dx ; 余数DX=-136
; 双字符号扩展至八字节
mov eax,dword ptr ds:[DworeVal]
cdq ; 扩展EAX到EDX
mov ebx,-256
idiv ebx
mov dword ptr ds:[Rval],eax ; 商 EAX = -195
mov dword ptr ds:[Rval],edx ; 余数 EDX = +80
invoke ExitProcess,0
main ENDP
END main
学习了前面的这几种计算方式以后,我们就可以将其总结起来实现计算复杂的表达式了,先来三个练手的.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include kernel32.inc
includelib kernel32.lib
.data
Rval DWORD ?
var1 DWORD 10
var2 DWORD 15
var3 DWORD 20
var4 DWORD 25
.code
main PROC
; 实现计算: var4 = (var1 * 5) / (var2 - 3)
mov eax,dword ptr ds:[var1] ; 先计算左边 (var1 * 5)
mov ebx,5
mul dword ptr ds:[ebx] ; EDX:EAX 乘积
mov ebx,dword ptr ds:[var2] ; 计算右边 (var2 - 3)
sub ebx,3
div dword ptr ds:[ebx] ; 计算两者的除法
mov dword ptr ds:[var4],eax ; 最后赋值操作
; 实现计算: var4 = (var1+var2) * var3
mov eax,dword ptr ds:[var1]
add eax,dword ptr ds:[var2] ; 计算前半部分
mov ebx,dword ptr ds:[var3] ; 计算后半部分
mul ebx
mov dword ptr ds:[var4],eax ; 最后赋值操作
; 实现计算: var1 = (var2/var3) * (var1+var2)
mov eax,var2
cdq ; 扩展为EDX:EAX
idiv dword ptr ds:[var3] ; 计算除法,存入eax
mov ebx,dword ptr ds:[var1] ; 计算加法
add ebx,dword ptr ds:[var2]
imul dword ptr ds:[ebx] ; 最后计算乘法
mov dword ptr ds:[var1],eax ; 在eax中取值
invoke ExitProcess,0
main ENDP
END main
最后我们来实现一个相对复杂的案例,总体的复习一下,该案例计算var4 = (var1 * -5) / (-var2 % var3)
返回值,我们可以从右边开始计算,并把右边的值存储到EBX中,然后把被除数符号扩展到EDX,最后使用IDIV计算除法.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include kernel32.inc
includelib kernel32.lib
.data
Rval DWORD ?
var1 DWORD 54
var2 DWORD 56
var3 DWORD 5
var4 DWORD 52
.code
main PROC
; 实现计算: var4 = (var1 * -5) / (-var2 % var3)
mov eax,dword ptr ds:[var2]
neg eax ; 将var2反转
cdq ; 将被除数符号扩展
idiv var3 ; 除以var3 则 EDX=余数
mov ebx,edx ; 将余数给EBX
mov eax,-5
imul var1 ; 计算 var1 * -5 结果给EAX
idiv ebx ; eax = eax/ebx
mov dword ptr ds:[var4],eax ; 最后将结果给var4
invoke ExitProcess,0
main ENDP
END main
ADC/SBB 扩展加减法: 扩展加减法是指任意尺寸大小数字的加减法,其中ADC指令主要用户实现带进位加法,SBB指令则实现带进位减法,起作用都是将源操作数与目的操作数以及进位等相加减.
以扩展加法为例,计算两个8位整数相加(FFh+FFh)
产生的16位结果将被存放在DL:AL (01feh)
中,如果是计算两个32位整数相加(FFFFFFFFh+FFFFFFFFh)
,则会在EDX和EAX中分别存放00000001h:FFFFFFFEh
这两个值,扩展SBB同理.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include kernel32.inc
includelib kernel32.lib
.data
Rval DWORD ?
.code
main PROC
; 计算8位加法操作
xor edx,edx
xor eax,eax
mov dl,0 ; 清0
mov al,0ffh ; 设置加数
add al,0ffh ; al = al + 0ffh
adc dl,0 ; 进位加法
mov byte ptr ds:[Rval],dl ; 存放高位
mov byte ptr ds:[Rval],al ; 存放低位
; 计算32位加法操作
xor edx,edx
xor eax,eax
mov edx,0
mov eax,0ffffffffh
add eax,0ffffffffh
adc edx,0
mov dword ptr ds:[Rval],edx ; 存放高位
mov dword ptr ds:[Rval],eax ; 存放低位
; 计算32位减法操作
xor edx,edx
xor eax,eax
mov edx,1 ; 设置高半部分
mov eax,0 ; 设置低半部分
sub eax,1 ; eax减去1
sbb edx,0 ; 减去1则高半部分为0
mov dword ptr ds:[Rval],edx ; 存放高位
mov dword ptr ds:[Rval],eax ; 存放低位
invoke ExitProcess,0
main ENDP
END main
LEA指令计算: Lea指令的使用初衷是取出某个内存的地址,但在汇编手册中可以发现其不止可以取地址同样可以实现算数运算,但这个运算与移位运算符一样只能计算2的次幂,当需要计算一个非次幂数字是,则需要对其进行分析与拆分,来实现对算数的计算.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include user32.inc
includelib user32.lib
include kernel32.inc
includelib kernel32.lib
include msvcrt.inc
includelib msvcrt.lib
.data
x DWORD ?
y DWORD ?
szFmt BYTE '计算结果: %d',0dh,0ah,0
.code
main PROC
; 针对加法的lea指令优化
mov dword ptr ds:[x],5
mov dword ptr ds:[y],3
mov eax,dword ptr ds:[x]
mov ebx,dword ptr ds:[y]
lea eax,dword ptr ds:[eax + 3] ; eax = edx + 3
invoke crt_printf,addr szFmt,eax
lea eax,dword ptr ds:[eax + ebx + 2] ; eax = eax + ebx + 2
invoke crt_printf,addr szFmt,eax
; 针对减法的lea指令优化
mov dword ptr ds:[x],6
mov eax,dword ptr ds:[x]
lea eax,dword ptr ds:[eax - 2] ; eax = eax - 2
invoke crt_printf,addr szFmt,eax
; 针对乘法的lea指令优化
mov dword ptr ds:[x],5
mov dword ptr ds:[y],3
mov eax,dword ptr ds:[x]
xor ebx,ebx
lea ebx,dword ptr ds:[eax * 8 + 2] ; ebx = eax * 8 + 2
invoke crt_printf,addr szFmt,ebx
; 如果使用lea计算乘法,则乘数必须是2/4/8
mov eax,dword ptr ds:[y] ; eax = 3 => 计算 15 * eax
lea edx,dword ptr ds:[eax * 4 + eax] ; edx = 4eax + eax => 5eax
lea edx,dword ptr ds:[edx * 2 + edx] ; edx = 5eax * 2 + 5eax => 15eax
invoke crt_printf,addr szFmt,edx ; edx = eax * 15 = 45
; 如果计算乘法时乘数非2的次幂,则此时需要减
mov eax,dword ptr ds:[y] ; eax = 3 => 计算 eax * 7 + 10
lea edx,dword ptr ds:[eax * 8] ; edx = eax * 8
sub edx,eax ; edx = edx - 1eax
add edx,10 ; edx = edx + 10
invoke crt_printf,addr szFmt,edx ; edx = eax * 7 + 10
mov eax,dword ptr ds:[y] ; eax = 3 => 计算 eax * 3 - 7
lea edx,dword ptr ds:[eax * 2] ; edx = eax * 2
add edx,eax ; edx = edx + eax
sub edx,7 ; edx = edx - 7
invoke crt_printf,addr szFmt,edx ; edx = eax * 3 - 7
invoke ExitProcess,0
main ENDP
END main
除法变乘法: 相比较于乘法运算,除法运算则显得略微复杂些,当计算中被除数为正数时,则可以直接使用sar(算数右移)
快速计算除法,如果被除数为负数,则需要使用cdq
符号扩展后,然后and edx,xxx
之后才能进行相除运算.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include user32.inc
includelib user32.lib
include kernel32.inc
includelib kernel32.lib
include msvcrt.inc
includelib msvcrt.lib
.data
x DWORD ?
y DWORD ?
z DWORD ?
szFmt BYTE '计算结果: %d',0dh,0ah,0
.code
main PROC
mov dword ptr ds:[x],5
mov dword ptr ds:[y],-3
mov dword ptr ds:[z],-10
; 除数为2的优化方式
; 被除数为正数(无需扩展): eax => 5 / 2 = 2
mov eax,dword ptr ds:[x] ; 被除数
sar eax,1 ; 算数右移
invoke crt_printf,addr szFmt,eax
; 被除数为负数(需要扩展): eax => -3 / 2 = -1
mov eax,dword ptr ds:[y] ; 被除数
cdq ; 符号扩展
sub eax,edx ; 被除数减去edx符号扩展
sar eax,1 ; 算数右移
invoke crt_printf,addr szFmt,eax
; 除数为4的优化方式
; 被除数为正数(无需扩展): eax => 5 / 4 = 1
mov eax,dword ptr ds:[x]
sar eax,2
invoke crt_printf,addr szFmt,eax
; 被除数为负数(需要扩展): eax => -10 / 4 = -2
; 抽取出公式来: (x + y - 1) / y
mov eax,dword ptr ds:[z] ; eax = x
cdq
and edx,3 ; edx = y-1
add eax,edx ; eax = eax + edx => x + (y - 1)
sar eax,2 ; 2 => y
invoke crt_printf,addr szFmt,eax
; 除数为8的优化方式
; 被除数为正数(无需扩展): eax => 5 / 8 = 1
mov eax,dword ptr ds:[x]
sar eax,3
invoke crt_printf,addr szFmt,eax
; 被除数为负数(需要扩展): eax => -10 / 8 = -1
mov eax,dword ptr ds:[z]
cdq
and edx,7
add eax,edx
sar eax,3
invoke crt_printf,addr szFmt,eax
invoke ExitProcess,0
main ENDP
END main
除法中的除数与被除数都可以分为有符号与无符号,两种计算方式均有一定差异,其差异如下所示.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include user32.inc
includelib user32.lib
include kernel32.inc
includelib kernel32.lib
include msvcrt.inc
includelib msvcrt.lib
.data
x DWORD ?
y DWORD ?
z DWORD ?
szFmt BYTE '计算结果: %d',0dh,0ah,0
.code
main PROC
mov dword ptr ds:[x],5
mov dword ptr ds:[y],10
mov dword ptr ds:[z],-10
; 除数为(无符号)正2的次幂的计算过程
mov eax,dword ptr ds:[x]
shr eax,1 ; eax = 5 / 2
mov eax,dword ptr ds:[x]
shr eax,2 ; eax = 5 / 4
mov eax,dword ptr ds:[x]
shr eax,3 ; eax = 5 / 8
; 被除数为(有符号)的计算过程
mov eax,dword ptr ds:[z]
cdq
sub eax,edx
sar eax,1 ; eax = -10 / 2
;neg eax ; 将eax取反
invoke crt_printf,addr szFmt,eax
mov eax,dword ptr ds:[z]
cdq
and edx,3
add eax,edx
sar eax,2 ; eax = -10 / 4
;neg eax
invoke crt_printf,addr szFmt,eax
mov eax,dword ptr ds:[z]
cdq
and edx,7
add eax,edx
sar eax,3 ; eax = -10 / 8
;neg eax
invoke crt_printf,addr szFmt,eax
; 除数为(有符号)负2的次幂的计算过程
mov eax,dword ptr ds:[y] ; y = 10
cdq
sub eax,edx
sar eax,1 ; eax = 10 / -2
neg eax ; 将正数 eax翻转为负数 = -5
invoke crt_printf,addr szFmt,eax
mov eax,dword ptr ds:[y] ; y = 10
cdq
and edx,3
add eax,edx
sar eax,2 ; eax = 10 / -4
neg eax ; eax = -2
invoke crt_printf,addr szFmt,eax
mov eax,dword ptr ds:[z] ; z = -10
cdq
and edx,7
add eax,edx
sar eax,3 ; eax = -10 / -8
neg eax ; eax = 1 (负负得正)
invoke crt_printf,addr szFmt,eax
invoke ExitProcess,0
main ENDP
END main
上方的除法运算被除数均为2的次幂,除数的范围也被限定在了2/4/8
这样的范围之内,如果是计算非2的次幂该怎么写呢,如下是计算非2的次幂的计算方式,通常情况下编译器会将除法运算转换为乘法,如果需要知道除数是多少则可以使用公式2^(32+n) / M
计算后得出.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include user32.inc
includelib user32.lib
include kernel32.inc
includelib kernel32.lib
include msvcrt.inc
includelib msvcrt.lib
.data
x DWORD ?
y DWORD ?
z DWORD ?
szFmt BYTE '计算结果: %d',0dh,0ah,0
.code
main PROC
mov dword ptr ds:[x],5
mov dword ptr ds:[y],10
mov dword ptr ds:[z],-10
; 除法(有符号)非2的幂转换为乘法
mov ecx,dword ptr ds:[y] ; 被除数 ecx = 10 / 3 = 3
mov eax,055555556h ; eax = M值 1431655766
imul ecx
mov eax,edx ; edx = n 计算: 2^(32+n) / M
shr eax,01fh ; 计算出除数为 2.9999 => 3
add edx,eax
invoke crt_printf,addr szFmt,edx
mov ecx,dword ptr ds:[y] ; ecx = 10 / 5 = 2
mov eax,066666667h ; 此处的M模值是编译器计算后得到的
imul ecx
sar edx,1 ; 想要知道除数是多少,只需要
mov eax,edx ; 2^(32 + edx) / M = 2^33 / 66666667 = 4.999
shr eax,01fh
add edx,eax
invoke crt_printf,addr szFmt,edx
mov ecx,dword ptr ds:[y] ; ecx = 10 / 6 = 1
mov eax,02AAAAAABh ; eax = 715827883
imul ecx
mov eax,edx ; 2^(32 + edx) / M = 2^32 / 2AAAAAAB = 6
shr eax,01fh
add edx,eax
invoke crt_printf,addr szFmt,edx
mov ecx,dword ptr ds:[y] ; ecx = 10 / 9 = 1
mov eax,038E38E39h ; eax = 954437177
imul ecx
sar edx,1 ; 2^(32 + edx) / M = 2^33 / 38E38E39 = 9
mov ecx,edx
shr ecx,01fh
add edx,ecx
invoke crt_printf,addr szFmt,edx
invoke ExitProcess,0
main ENDP
END main
上方代码中的除法计算是针对有符号数进行的,如果是针对无符号数
则需要以下方式计算.
.386p
.model flat,stdcall
option casemap:none
include windows.inc
include user32.inc
includelib user32.lib
include kernel32.inc
includelib kernel32.lib
include msvcrt.inc
includelib msvcrt.lib
.data
x DWORD ?
y DWORD ?
z DWORD ?
szFmt BYTE '计算结果: %d',0dh,0ah,0
.code
main PROC
mov dword ptr ds:[x],-5
mov dword ptr ds:[y],10
mov dword ptr ds:[z],20
; 除法(无符号)非2的次幂(正数)转换为乘法
xor edx,edx
mov ecx,dword ptr ds:[y] ; ecx = 10
mov eax,0AAAAAAABh ; ecx / 3 = 3
mul ecx
shr edx,1
invoke crt_printf,addr szFmt,edx
; 还原除数: 2 ^(32 + n) / M => 2 ^ (32+2) / 0CCCCCCCDh = 5
xor edx,edx
mov ecx,dword ptr ds:[y] ; ecx = 10 => 计算: 10/5
mov eax,0CCCCCCCDh ; eax = M
mul ecx
shr edx,2 ; edx= n
invoke crt_printf,addr szFmt,edx
; 还原除数: 2 ^(32 + n) / M => 2 ^ (32+2) / 0AAAAAAABh = 6
xor edx,edx
mov ecx,dword ptr ds:[y] ; ecx = 10 => 计算:10/6
mov eax,0AAAAAAABh ; eax = M
mul ecx
shr edx,2 ; edx = n
invoke crt_printf,addr szFmt,edx
;还原除数: 2 ^(32 + n) / M => 2 ^ 33 / 038E38E39h = 9
xor edx,edx
mov ecx,dword ptr ds:[z] ; ecx = 20 => 计算: 20/9
mov eax,038E38E39h ; eax = M
mul ecx
shr edx,1 ; edx = n
invoke crt_printf,addr szFmt,edx
; 除法(无符号)非2的次幂(负数)转换为乘法
; 还原除数: 2 ^(32 + n) / M => 2 ^ 33 / 0AAAAAAABh = nge(3) => -3
xor edx,edx
mov ecx,dword ptr ds:[z] ; ecx = 20 => 计算: 20/-3
mov eax,0AAAAAAABh ; eax = M
mul ecx
shr edx,1 ; edx = n
neg edx ; edx=6 结果neg取反
invoke crt_printf,addr szFmt,edx
; 还原除数: 2 ^(32 + n) / M => 2 ^ 63 / 080000003h = nge(5) => -5
xor edx,edx
mov ecx,dword ptr ds:[x] ; ecx = -5 => 计算: -5 / -5
mov eax,080000003h ; eax = M
mul ecx
shr edx,01fh ; edx = n
invoke crt_printf,addr szFmt,edx
invoke ExitProcess,0
main ENDP
END main
Win32汇编:算数运算指令总结的更多相关文章
- Win32汇编环境配置
放假了,发现自己知识面窄,趁有时间就打算折腾下Win32汇编.其实在学校也上过汇编课,是基于dos的.那时老师不务正业,老跟我们讲政治经济文化,唯独不怎么讲课;再加上自己的问题,导致了dos汇编学得好 ...
- Win32汇编开始 Hello Asm
今天开始学习Win32汇编 因为自己很多都是Windows方面 所以 接触一下Win32汇编 . ;.386指令集 .model flat,stdcall ;工作模式 option casemap:n ...
- Win32汇编学习(5):绘制文本2
这次我们将学习有关文本的诸多属性如字体和颜色等. 理论: Windows 的颜色系统是用RGB值来表示的,R 代表红色,G 代表绿色,B 代表蓝色.如果您想指定一种颜色就必须给该颜色赋相关的 RGB ...
- Win32汇编学习(4):绘制文本
这次,我们将学习如何在窗口的客户区"绘制"字符串.我们还将学习关于"设备环境"的概念. 理论: "绘制"字符串 Windows 中的文本是一 ...
- Win32汇编学习(1):基本概念
背景知识 Windows 把每一个 Win32 应用程序放到分开的虚拟地址空间中去运行,也就是说每一个应用程序都拥有其相互独立的 4GB 地址空间,当然这倒不是说它们都拥有 4GB 的物理地址空间,而 ...
- 如何构建Win32汇编的编程环境(ONEPROBLEM个人推荐)
如何构建Win32汇编的编程环境(ONEPROBLEM个人推荐)1.首先要下载我提供的软件包(里面已经包含所有所需软件); 2.把它解压到D盘根目录下(如果需要安装在其它的地方,请注意设好路径); ...
- 罗云彬win32汇编教程笔记 子函数的声明, 定义与调用
在主程序中用call指令来调用子程序. Win32汇编中的子程序也采用堆栈来传递参数,这样就可以用invoke伪指令来进行调用和语法检查工作. 一. 子程序的定义 子程序的定义方式如下所示. 子程序名 ...
- 【Win32汇编】编译环境配置
开始学习[Win32汇编],编译过程较为繁琐,做个记录. 使用 MASM32 提供的 ml.exe 和 link.exe,以及 VS2013 中的 nmake.exe 和资源编辑器. ml.exe: ...
- 8086汇编和Win32汇编
8086汇编是指在某环境下汇编编译产生的程序,用机器去执行每条指令的长度为16位(可小于16),如DOS操作系统:WIN32汇编是32位环境下的汇编,如Windows(Windows也有64位的,XP ...
- win32汇编基础
win32汇编基础知识 Debug 版本|Release 版本 Debug 是"调试"的意思,Debug 版本就是为调试而生的,编译器在生成 Debug 版本的程序时会加入调试辅助 ...
随机推荐
- Linux--修改会话超时时间
控制用户在一段时间内没有活动时会话的自动注销时间 1.修改ssh配置文件(适用于SSH会话) vim /etc/ssh/sshd_config ClientAliveInterval 1800 #秒 ...
- Mysql--编译安装5.6版本
1 下载编译工具 yum -y install cmake gcc gcc-c++ ncurses-devel autoconf 2 创建用户 目录 useradd -s /sbin/nologin ...
- CMake + Protobuf 自动生成 cpp 文件(pb.h, pb.cc)
[Protoc]VS2019 (VS平台) 使用 CMake 编译安装.使用 Protobuf 库 本文介绍在 macOS 系统下 cmake 和 protobuf 一起使用的一种方式--使用 cma ...
- 【调试】sysRq按键使用方法
SysRq键简介 SysRq键是一个魔术案件,只要在内核没有完全卡死的情况下,内核都会相应SysRq 键的输入,使用这些组合键都可以搜集包括系统内存使用.CPU任务处理.进程运行状态等系统运行信息. ...
- Vue 大屏可视化 铺满全屏
https://blog.csdn.net/u011097323/article/details/106728221?utm_medium=distribute.pc_aggpage_search_r ...
- 简易机器学习笔记(八)关于经典的图像分类问题-常见经典神经网络LeNet
前言 图像分类是根据图像的语义信息对不同类别图像进行区分,是计算机视觉的核心,是物体检测.图像分割.物体跟踪.行为分析.人脸识别等其他高层次视觉任务的基础.图像分类在许多领域都有着广泛的应用,如:安防 ...
- POJ
//poj 2080//题目大意:给定天数,从2000年1月1日经过这些天后的 年 月 日 及 星期几//代码参照大牛的写的,本人还是处于菜鸟阶段,思路很好#include<stdio.h> ...
- VUE - 配置跨域
'/api': { target: 'http://localhost:8088/', //这里后台的地址模拟的;应该填写你们真实的后台接口 changOrigin: true, //允许跨域 pat ...
- [SpringMVC] - 解决 RequestMappingHandlerAdapter 报红的错误
<bean class="org.springframework.web.servlet.mvc.method.annotation.RequestMappingHandlerAdap ...
- [转帖]Java 提速之 Large pages【译】
https://juejin.cn/post/7011002046899978253 一.前言 最近花了很多时间在 JVM 的内存预留代码上.它开始是因为我们得到了外部贡献,以支持在 Linux 上使 ...