最近在学着写bootloader,由于汇编太繁杂,希望可以使用C语言完成一部分,然后转成NASM汇编代码,经过摸索,最终找到了一个解决方案,记录于此,留作参考。

核心步骤

  • 使用gcc编译得到.o文件

    这一步需要加上一些参数对编译行为进行控制。具体自行参考gcc文档。

    我最终使用的命令参数为

    shell gcc -fno-pic -fno-asynchronous-unwind-tables -m32 -O2 -s -c -o $@ $<

    具体含义我也没有深入了解,-m32是生成32位代码,-O2是一种优化级别,-fno-pic似乎是必要,要不然每个文件最终都会生成一个额外的函数。

  • 使用objconv程序将.o文件转换成汇编代码

    1. objconv -fnasm $<

    objconv可以将.o文件转成多种形式的汇编,具体自行查阅,上面的参数是要转成NASM代码。

  • 问题

    还有一个问题是,这样直接转换成的汇编代码包含多个段,以及各种对齐指令,以及enbdrXX指令,需要自己根据需要进行删减。

    我所做的是只保留.text段,并删减对齐指令、enbdrXX指令。

我的需求及实现

最终我需要的是将使用C语言完成的函数转换成汇编形式的函数,并去掉编译器相关、对齐相关的一些代码。我的Makefile如下。

  1. all : $(subst .c,.func,$(wildcard *.c))
  2. %.func : %.asm
  3. ./extractFunc.py $<
  4. %.asm : %.o
  5. ./objconv -fnasm $<
  6. %.o : %.c
  7. gcc -fno-pic -fno-asynchronous-unwind-tables -m32 -O2 -s -c -o $@ $<
  8. clean :
  9. rm -rf *.asm *.o *.func

其功能是将当前目录中的所有C语言文件转换成NASM汇编语言文件。

C函数文件示例:

  1. //filename : stripe.c
  2. #define DISPLAY_MEMORY_BASE 0xa0000
  3. #define WIDTH 320
  4. #define HEIGHT 200
  5. void stripe()
  6. {
  7. for (int i = DISPLAY_MEMORY_BASE; i <= DISPLAY_MEMORY_BASE+WIDTH*HEIGHT/2; i++)
  8. {
  9. *((int *)i) = (0b11111100 & i);
  10. }
  11. }

使用make命令得到的结果如下:

  1. ; filename : stripe.func
  2. stripe: ; Function begin
  3. mov eax, 655360 ; 0004 _ B8, 000A0000
  4. ; Filling space: 7H
  5. ; Filler type: lea with same source and destination
  6. ; db 8DH, 0B4H, 26H, 00H, 00H, 00H, 00H
  7. ?_001: mov edx, eax ; 0010 _ 89. C2
  8. add eax, 1 ; 0012 _ 83. C0, 01
  9. and edx, 0FCH ; 0015 _ 81. E2, 000000FC
  10. mov dword [eax-1H], edx ; 001B _ 89. 50, FF
  11. cmp eax, 687361 ; 001E _ 3D, 000A7D01
  12. jnz ?_001 ; 0023 _ 75, EB
  13. ret ; 0025 _ C3
  14. ; stripe End of function

gcc和objconv已经在前面提到过了,那个python脚本的作用删掉一些我所不需要的代码,只保留.text部分,并删除其中的对齐指令和enbdrXX指令。内容如下:

  1. #!/usr/bin/python3
  2. #filename : extractFunc.py
  3. import os
  4. import sys
  5. def extractFunc(filename):
  6. fin = open(filename)
  7. lines = fin.readlines()
  8. start = 0
  9. end = 0
  10. lineNum = -1
  11. for line in lines:
  12. lineNum += 1
  13. if line.startswith(f'SECTION .text'):
  14. start = lineNum + 1
  15. continue
  16. if line.startswith(f'SECTION .data'):
  17. end = lineNum
  18. break
  19. funcLines = lines[start:end]
  20. cleanFuncLines = []
  21. for line in funcLines:
  22. if line.startswith(' endbr32') or line.startswith('ALIGN'):
  23. continue
  24. cleanFuncLines.append(line)
  25. fout = open(f'{filename[:-4]}.func', 'w')
  26. fout.writelines(cleanFuncLines)
  27. print(filename)
  28. if __name__ == '__main__':
  29. extractFunc(sys.argv[1])

参考链接

  1. https://stackoverflow.com/questions/20737947/how-to-generate-a-nasm-compilable-assembly-code-from-c-source-code-on-linux
  2. https://stackoverflow.com/questions/1647359/is-there-a-way-to-get-gcc-to-output-raw-binary

C语言程序转汇编代码的更多相关文章

  1. 分析一个C语言程序生成的汇编代码-《Linux内核分析》Week1作业

    署名信息 郭春阳 原创作品转载请注明出处 :<Linux内核分析>MOOC课程 http://mooc.study.163.com/course/USTC-1000029000 C源码 这 ...

  2. 解析c语言背后的汇编代码

    源码 很简单的c语言代码,作用是交换两个数: #include <stdio.h> void swap(int * a, int * b) { *a = *a + *b - (*b = * ...

  3. 一个简单C程序的汇编代码分析

    几个重要的寄存器 eip - 用于存放当前所执行的指令地址 esp - 栈(顶)指针寄存器 ebp - 基址(栈底)指针寄存器 简单的C程序 int g(int x) { ; } int f(int ...

  4. 从C简单程序的汇编代码入手,以理解计算机工作原理。

    贺邦  原创作品转载请注明出处 <Linux内核分析>MOOC课程 http://mooc.study.163.com/course/USTC-1000029000#/info 知识准备 ...

  5. 如何在Visual Studio里面查看程序的汇编代码?

    开发工具:Visual Studio 2015 1,在源代码中设置至少一个断点,目的让我们进入调试模式. 2,启动调试,当程序进入调试模式,停留在我们设定的断点处时候,使用快捷键"ALT+8 ...

  6. 如何在Delphi里面查看程序的汇编代码?

    开发工具:Delphi 10 Update2 1,在源代码中设置至少一个断点,目的让我们进入调试模式. 2,启动调试,当程序进入调试模式,停留在我们设定的断点处时候,使用快捷键"CTRL+A ...

  7. 通过汇编一个简单的C程序,分析汇编代码理解计算机是如何工作的

    秦鼎涛  <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 实验一 通过汇编一个简单的C程序,分析汇编代码 ...

  8. Ubuntu16.04 中 Vscode 如何断点调试C语言程序

    个人博客链接:Ubuntu16.04 中 Vscode 如何断点调试C语言程序 问题:环境是 Ubuntu16.04,如何使用 Vscode 断点调试C语言程序. 写代码没有调试环境是不能忍受的,所以 ...

  9. 《Linux内核分析》week1作业-分析一个简单c语言的汇编代码

    1.C语言源码 #include <stdio.h> int g(int x){ ; } int f(int x){ return g(x); } int main(){ )+; } 2. ...

随机推荐

  1. NumPy排序

    numpy.sort()函数 该函数提供了多种排序功能,支持归并排序,堆排序,快速排序等多种排序算法 使用numpy.sort()方法的格式为: numpy.sort(a,axis,kind,orde ...

  2. 在python中使用redis 初识

    一.下载redis模块 pip3 install -i https://pypi.douban.com/simple redis 二.创建单连接 import redis # 创建链接 conn = ...

  3. 在eclipse中导入源码

    因为初学java有一个源码项目想要导入,在网上找了很多方法试了都不行,后来发现其实是想多了,这里说一个很简洁的方法.* 1.首先点eclipse中的File然后点import, 2. 然后选Gener ...

  4. 【javaScript】报getElementId()为Null的错误

    若JavaScript代码写在<head>块中,若是javaScript,写JavaScript代码写在里面 window.οnlοad=function(){ js代码内容 } 若是jq ...

  5. linux DNS 服务器 配置

    1:named.conf 2:正向区域配置文件 3:反向域名解析文件

  6. mong 按 geometry 搜索 地理位置信息

    看 地理位置索引的使用 $near $geometry

  7. BERT模型总结

    BERT模型总结 前言 ​ BERT是在Google论文<BERT: Pre-training of Deep Bidirectional Transformers for Language U ...

  8. obj2gltf安装详细教程

    在线转换地址:http://52.4.31.236/convertmodel.html 在使用cesium的过程中需要使用到gltf模型,官方推荐使用obj2gltf插件将obj模型转换成gltf格式 ...

  9. 不停机替换线上代码? 你没听错,Arthas它能做到

    写在前边 有没有这样一种感受,自己写的代码在开发.测试环境跑的稳得一笔,可一到线上就抽风,不是缺这个就是少那个反正就是一顿报错,线上调试代码又很麻烦,让人头疼得很.阿里巴巴出了一款名叫Arthas的工 ...

  10. React报错Failed prop type: Invalid prop `component` of type `object` supplied to `Route`, expected `function`

    引言 最近在忙毕业设计,博客也很久没更新了,毕业设计使用vue做了一个校园寻物网站,现在开始学Raect,记录一下自己遇到问题,react-redux的connect方法使得组件与Redux建立了联系 ...