一个最简单的C程序,如下:

main.c:

int main()
{
char *str = "Hello World";
return ;
}

在64位平台上编译一个32位的程序,如下:(32位只是为了演示方便)

gcc -m32 -o hello main.c
./hello
echo $?

运行后 会看到结果是 8,说明程序正常。$?表示查看上一个命令的返回值


统计一下程序大小:7263字节,

wc -c hello
hello

通过 ldd 查看动态库的依赖,发现如下的一些动态库依赖,libc.so,可以说是几乎所有Linux上的程序都会依赖的一个基础C函数库。 ld-linux.so 是一个动态dll的加载库,它会动态加载libc.so, dll在Linux shared object, 后缀是 .so linux-gate.so是一个伪文件,它是与内核联系的一个接口,64位程序的linux-vdso.so也是同样的作用

ldd hello
linux-gate.so. => (0xf7780000)
libc.so. => /lib/i386-linux-gnu/libc.so. (0xf75ae000)
/lib/ld-linux.so. (0x5662a000)

我们加上 -nostdlib 选项,该选项在linking链接阶段,不会把标准库和启动文件引入进来,下面提示没有找到_start这个函数符号,默认给了一个入口地址。
我们不管这个警告,执行程序,发现报段错误,如果统计这个可执行文件的大小,会发现大小有1128字节,比之前的7236小了好多。

gcc -m32 -nostdlib -o hello main.c
/usr/bin/ld: warning: cannot find entry symbol _start; defaulting to 00000000080480d8
./hello
Segmentation fault
ldd hello
not a dynamic executable
wc -c hello
hello

当使用 -nostdlib 编译的时候,提示没有找到_start函数符号,那我们会不会想到是glibc里面提供的某个函数呢?
Linux上的C程序,入口实际是_start,而不是我们代码里的main, _start定义在ctr1.o这个可重定位目标文件里

查找一下 ctr1.o 这个文件, 找到文件位置。
sudo find / -name "crt1.o"

只编译,不链接,-c表示只编译,生成一个32位的hello.o的目标文件

gcc -m32 -Os -c main.c -o hello.o

进行链接:

ld /usr/lib/i386-linux-gnu/crt1.o -o hello hello.o
#64位crt1.o 在/usr/lib/x86_64-linux-gnu/crt1.o

发现报错:

/usr/lib/i386-linux-gnu/crt1.o: In function `_start':
(.text+0xc): undefined reference to `__libc_csu_fini'
/usr/lib/i386-linux-gnu/crt1.o: In function `_start':
(.text+0x11): undefined reference to `__libc_csu_init'
/usr/lib/i386-linux-gnu/crt1.o: In function `_start':
(.text+0x1d): undefined reference to `__libc_start_main'

crt1.o对应的代码在glibc的源代码,在glibc-2.19 源代码目录下的 sysdeps/i386/start.Ssysdeps/x86_64/start.S
_start 调用了__libc_start_main 等函数,__libc_start_maincsu/libc-start.c ,可以看到:

result = main (argc, argv, __environ MAIN_AUXVEC_PARAM);

这就是main被调用的地方。这个是我们用户代码开始的地方

所以,在_startmain 之间的那些函数都是做一些glibc的准备工作,我们这里要剥离glibc的依赖,所以,我们直接可以这样做:
增加一个文件:
stubstart.s

.globle _start
_start:call main

编译:

gcc -m32 -nostdlib -Os stubstart.s main.c -o hello
./hello #运行报错:Segmentation fault

让我使用加上调试信息,重新编译,用gdb来看看

gcc -m32 -g -nostdlib -O0 stubstart.s main.c -o hello

首先反汇编看看,不同的编译优化,汇编代码会有一些不同:

objdump -d hello

hello: file format elf32-i386
Disassembly of section .text:
080480d8 <_start>:
80480d8: e8 call 80480dd <main> #等价于:push %eip ; mov 80480dd, %eip 080480dd <main>:
80480dd: push %ebp
80480de: e5 mov %esp,%ebp #这2句是所有函数调用都有的,序言,套路,重新设置栈顶
80480e0: ec sub $0x10,%esp #分配临时变量
80480e3: c7 fc f1 movl $0x80480f1,-0x4(%ebp) #字符串赋值
80480ea: b8 mov $0x8,%eax #这里是把8赋值给eax,如果是把0赋值给eax,指令可能是:xor %eax,%eax 。
# xor 异或自己就是0,与 movl $, %eax 具有类似效果
80480ef: c9 leave #等价于:mov %ebp,%esp ; pop %esp ;
# 同时esp自动加一个步进(往栈基移动一个步进),
# 即80480dd地址后的2个指令反向执行,回归原位
80480f0: c3 ret #等价于 pop %eip,是call指令的反向执行,回归原位

我们用gdb来看看

gdb ./main
gdb> break _start
gdb> run

到_start 函数命中断点,开始 stepi 单步的执行汇编指令。

程序从_start开始,调用mainmain函数从上到下执行,从地址80480dd执行到80480f0call返回后,下一条指令又是80480dd,又会调用main,从地址80480dd执行到80480f0 又执行一遍,第二次执行,其实不是本意,
只是刚好call后面的指令恰好是main函数,一直在执行到ret指令,这时,栈顶的值是0x1, 把该值给eip0x1地址上无有效指令,报段异常,正确的段应该在80480f0附近

这里主要就是因为 call返回后,下一条指令又是80480dd,恰好是main函数,gcc编译的时候,如果使用 -Os 选项,得到的反汇编如下,这时就不会执行2次,但是依然会报段错误,因为指令指针已经飞到其他地方去了。

080480d8 <main>:
80480d8: push %ebp
80480d9: b8 mov $0x8,%eax
80480de: e5 mov %esp,%ebp
80480e0: 5d pop %ebp
80480e1: c3 ret
080480e2 <_start>:
80480e2: e8 f1 ff ff ff call 80480d8 <main>

正确的做法就是:在call main之后,退出进程。

.globl _start
_start: call main
mov $, %eax
mov $, %ebx
int $0x80

调用系统调用_exit(0);正确退出。

反汇编如下:

080480d8 <_start>:
80480d8: e8 0c call 80480e9 <main>
80480dd: b8 mov $0x1,%eax
80480e2: bb mov $0x0,%ebx
80480e7: cd int $0x80 #END 080480e9 <main>:
80480e9: push %ebp
80480ea: e5 mov %esp,%ebp
80480ec: ec sub $0x10,%esp
80480ef: c7 fc fd movl $0x80480fd,-0x4(%ebp)
80480f6: b8 mov $0x8,%eax
80480fb: c9 leave0480fc: c3 ret

如果用C语言来代替之前那个_start的汇编,则如下:
stubstart.c

void _start() {

 // main body of program: call main(), etc

     // exit system call
asm("mov $1,%eax;"
"xor %ebx,%ebx;"
"int $0x80"
// xor 异或自己就是0,与 movl $0, %eax 具有类似效果
);
}

至此,一个完全不依赖第三方库的简单C函数就完成了。

参考:

https://www.cnblogs.com/TOLLA/p/9646035.html
https://blogs.oracle.com/linux/hello-from-a-libc-free-world-part-1-v2
https://blogs.oracle.com/linux/hello-from-a-libc-free-world-part-2-v2

Linux下一个最简单的不依赖第三库的的C程序(2)的更多相关文章

  1. Linux下一个最简单的不依赖第三库的的C程序(1)

    如下代码是一段汇编代码,虽然标题中使用了C语言这个词语,但下面确实是一段汇编代码,弄清楚了这个代码,后续的知识点才会展开. simple_asm.s: #PURPOSE: Simple program ...

  2. Linux下一个php+mysql+nginx构建编译(三)

    在此之前一直是一个关键构建webserver.但一个关键的建筑环境都比较旧的.假定使用一个相对较新的环境,尤其是正式的server.您必须手动编译自己建(基于以下的结构linux centos6.5 ...

  3. linux下一个Oracle11g RAC建立(四)

    linux下一个Oracle11g RAC建立(四) 三.配置共享存储 配置ASM管理准备 1)OCRDISK :存储CRS资源配置信息 2)VOTEDISK:仲裁盘.记录节点状态 3)DataDis ...

  4. Linux下一个简单的日志系统的设计及其C代码实现

    1.概述 在大型软件系统中,为了监测软件运行状况及排查软件故障,一般都会要求软件程序在运行的过程中产生日志文件.在日志文件中存放程序流程中的一些重要信息, 包括:变量名称及其值.消息结构定义.函数返回 ...

  5. linux下git的简单运用

    linux下git的简单运用 windows下也有git,是git公司出的bash,基本上模拟了linux下命令行.许多常用的命令和linux下操作一样.也就是说,windows下的git命令操作和l ...

  6. Linux 下一个很棒的命令行工具

    导读 Taskwarrior 是 Ubuntu/Linux 下一个简单而直接的基于命令行的 TODO 工具.这个开源软件是我曾用过的最简单的基于命令行的工具之一.Taskwarrior 可以帮助你更好 ...

  7. linux下一个oracle11G DG建立(一个):准备环境

    linux下一个oracle11G  DG建立(一个):准备环境 周围环境 名称 主库 备库 主机名 bjsrv shsrv 软件版本号 RedHat Enterprise5.5.Oracle 11g ...

  8. Linux下MySQL的简单操作

    Linux下MySQL的简单操作 更改mysql数据库root的密码 首次进入数据库是不用密码的: [root@localhost ~]# /usr/local/mysql/bin/mysql -ur ...

  9. linux下一个有意思的问题(文件名以短划线或空格开头)

    linux下一个有意思的问题(文件名以短划线开头) 这本是无意中的一个发现. 在linux下,文件名中含有 - 是没有问题,但是如果文件名是以-作为第一个字符的,那么就比较麻烦了. 问题演示 看这里, ...

随机推荐

  1. 【bzoj 2716】[Violet 3]天使玩偶 (CDQ+树状数组)

    题目描述 Ayu 在七年前曾经收到过一个天使玩偶,当时她把它当作时间囊埋在了地下.而七年后 的今天,Ayu 却忘了她把天使玩偶埋在了哪里,所以她决定仅凭一点模糊的记忆来寻找它. 我们把 Ayu 生活的 ...

  2. acedSSGet 翻译

    ObjectARX 参考指南 > 全局函数 > AcEd 全局函数 > acedSSGet 函数 acedSSGet 折叠全部 C++ int acedSSGet( const AC ...

  3. lamp-linux3

    LAMP编程之Linux(3) 一.权限管理 1.权限介绍(重点) 在Linux中分别有读.写.执行权限: 读权限: 对于文件夹来说,读权限影响用户是否能够列出目录结构 对于文件来说,读权限影响用户是 ...

  4. 【css】—— inline-block 4px 和图片底部 2px bug

    首先我们观察一组案例: HTML结构很简单: <!DOCTYPE html> <html lang="en"> <head> <meta ...

  5. RHEL 7 下内存管理小记

    RHEL 7 下内存管理小记 一.Overview 众所周知,在 Linux 操作系统中有三个目录非常有趣好玩. /dev /run /proc 一个个解释下,/dev 用于对特殊设备(BTW:特殊设 ...

  6. 记一名软件实施自学转Java开发,附学习计划

    2015年毕业到现在已经3年了,而我转型开发已经有一年的时间了.写这篇文章除了记录,主要还是想分享一些经历给想要转型开发的同学们,不要走那些我走过的弯路. 2015年入职了第一家公司,当时是做的分销系 ...

  7. Web安全篇之SQL注入攻击

    在网上找了一篇关于sql注入的解释文章,还有很多技术,走马观花吧 文章来源:http://www.2cto.com/article/201310/250877.html ps:直接copy,格式有点问 ...

  8. MyBatisSystemException->BindingException: Parameter 'xxx' not found. Available parameters are [arg1, arg0, param1, param2]

    最近在使用Spring boot+mybatis做新的基础框架,结果碰到如下问题: 1 org.mybatis.spring.MyBatisSystemException: nested except ...

  9. Django 登陆注册实现

    路由层 from django.conf.urls import url from django.contrib import admin from app01 import views urlpat ...

  10. winform两个窗体之间传值(C#委托事件实现)

    委托 定义一个委托,声明一个委托变量,然后让变量去做方法应该做的事. 委托是一个类型 事件是委托变量实现的 经典例子:两个winform窗体传值 定义两个窗体:form1和form2 form1上有一 ...