第四周 扒开系统调用的“三层皮”

一、内核、用户态和中断

(一)如何区分用户态、内核态

1.一般现在的CPU有几种不同的指令执行级别

①在高级别的状态下,代码可以执行特权指令,访问任意的物理地址,这种CPU执行级别就对应着内核态,可以执行所有指令。

②在相应的低级别执行状态下,代码的掌控范围会受到限制,只能在对应级别允许的范围内活动。

为什么会有权限级别的划分?

答:当所有程序员写的代码都有特权指令时,系统很容易崩溃,没有访问权限划分容易使得系统混乱。

③Intel x86 CPU有四种不同的执行级别0—3,Linux只使用了其中的0级和3级来表示内核态和用户态。

2.如何区分用户态、内核态

CPU每条指令的读取都是通过cs:eip(代码段选择寄存器:偏移量寄存器)这两个寄存器,由硬件完成判断。

  • 内核态时,cs与eip的值可以访问任意地址
  • 用户态时,cs与eip只可以访问0x00000000—0xbfffffff的地址空间

  P.S.这里的地址空间指逻辑地址而非物理地址

(二)中断处理

中断处理是用户态进入内核态主要的方式,系统调用只是一种特殊的中断

①硬件中断,中断服务进程

②用户态执行系统调用,进入内核态

注意:从用户态切换到内核态时

必须保存用户态的寄存器上下文

中断指令会把内核态相应的寄存器值放在当前CPU中

中断/int指令会在堆栈上保存一些寄存器的值(eg:用户态栈顶地址(ss:esp),标志寄存器(eflags),cs:eip(为了返回的时候popl弹出保存的返回地址)。同时,将相关联的中端服务历程的入口加载到cs:eip,把当前的堆栈段esp也加载到CPU里面)

系统调用需要int触发,int 80要模拟中断,由硬件来处理,80号中断即为系统调用

中断发生后第一件事就是保存现场,进入中断处理程序,保存需要用到的push到寄存器的值。

中断处理结束前最后一件事是恢复现场,就是退出中断程序,恢复用户态的保存寄存器的数据

iret对应着中断信号恢复指令。

二、系统调用概述

系统调用

  • 是内核提供的最基本、最重要的服务设施
  • 所有内核服务都通过系统调用的形式提供

(一)系统调用的意义

操作系统为用户态进程与硬件设备进行交互提供了一组接口——系统调用。

①把用户从底层的硬件编程中解放出来

②极大的提高了系统的安全

③使用户程序具有可移植性

(系统调用减少了系统与硬件之间的耦合,所以极大提高了系统可移植性)

(二)操作系统提供的API和系统调用的关系

①应用编程接口(API)和系统调用是不同的,使用API是为了让用户从底层硬件编程中解放出来。

  • API只是一个被封装好的函数定义
  • 系统调用通过软中断向内核发出一个明确的请求

②Libc库定义的一些API引用了封装例程(wrapper routine,唯一目的就是发布系统调用)使程序员在写代码时不用以汇编指令触发系统调用而是直接调用函数。

  • 一般每个系统调用对应一个封装例程
  • 库再用这些封装例程定义出给用户的API

③不是每个API都对应一个特定的系统调用

  • API可能直接提供用户态的服务

    • 例如一些数学函数没有用到系统调用
  • API与系统调用不是单一的一对一的关系

④返回值

  • 大部分封装例程返回一个整数,其值的含义依赖于相应的系统调用
  • 返回值-1在多数情况下表示内核不能满足进程的请求
  • Libc中定义的errno变量包含特定的出错码

(三)系统调用的三层皮

一层皮:API

二层皮:中断向量对应的中断服务程序

三层皮:系统调用对应的很多不同种类的服务程序

详细过程:

用户态进程中,xyz()函数是系统调用对应的API,该编程接口里封装了一个系统调用,会触发一个int 0x80的中断,产生向量为128的编程异常。该中断对应着内核态的内核代码入口起点system_call,执行SAVE_ALL,执行到中断服务程序sys_xyz()时,进入程序处理,该中断服务程序执行完后,会ret_from_sys_call,在ret中可能会发生进程调度,如果没发生就会iret,返回用户态,继续执行。

(四)传参

①内核实现了很多不同的系统调用,

②进程必须指明需要哪个系统调用,这需要传递一个名为系统调用号的参数,使用eax寄存器

③系统调用还需要参数

做函数调用时,可以采用参数压栈的方式来传递。

从用户态到内核态如何传递参数呢?

system_call是linux中所有系统调用的入口点,每个系统调用至少有一个参数,即由eax传递的系统调用号。具体过程如下:1.一个应用程序调用fork()封装例程,那么在执行int $0x80之前就把eax寄存器的值置为2(即__NR_fork)。

2.这个寄存器的设置是libc库中的封装例程进行的,因此用户一般不关心系统调用号
3.进入sys_call之后,立即将eax的值压入内核堆栈


超过6个,就将某一个寄存器作为指针,指向内存,进入内核态后可以访问所有地址空间,即通过内存传递数据

三、使用库函数API来获取系统当前时间

(一)使用库函数API获取当前系统时间


编译:gcc time.c -o time

结果:打印出的就是系统时间下的 年:月:日:时:分:秒

(二)C代码中嵌入汇编代码的写法

__asm__(
汇编语句模板:
输入部分:
输出部分:
破坏描述部分:); 这里,汇编代码相当于一个函数。

include <stdio.h>
int main()
{
/*想要实现的功能:val1+val2=val3*/
unsigned int val1 = 1;
unsigned int val2 = 2;
unsigned int val3 = 0;
printf("val1:%d,val2:%d,val3:%d\n",val1,val2,val3);

asm volatile(
"movl $0,%%eax\n\t" /*%%表示转义字符,把0赋给eax,即把%eax清零*/
"addl %1,%%eax\n\t" /*%1指输出和输入的部分,用ecx寄存器存储val1的值*/

"addl %2,%%eax\n\t" /*把val1+val2放入eax*/

"movl %%eax,%0\n\t" /*把val1+val2的值存储在eax里面*/
: "=m" (val3) /* =表示把val3的值写到内存变量里面*/
: "c" (val1),"d" (val2) /*用%ecx存储val1,用%edx存储val2*/
);

printf("val1:%d+val2:%d=val3:%d\n",val1,val2,val3);
return 0;
}

内嵌汇编常用修饰符

嵌入式汇编中每一个输出或输入的前面都可以添加一个限定符

(三)用汇编方式触发系统调用获取系统当前时间

#include <stdio.h>
#include <time.h>
int main()
{
time_t tt;//int型数值
struct tm *t;
asm volatile(
"mov $0,%%ebx\n\t"//ebx清0
"mov $0xd,%%eax\n\t"//把0xd放入eax中,eax传递系统调用号13(13的16进制即为d)
"int $0x80\n\t"//中断
"mov %%eax,%0\n\t"//返回值通过eax这个寄存器返回,eax——%0放入tt中
:"=m"(tt)
);
t = localtime(&tt);
printf("time:%d:%d:%d:%d:%d:%d:\n",t->tm_year+,t->tm_mon,t->tm_mda,t->tm_hour,t->tm_min,t->tm_sec);
return ;
}

这段代码让我们更清楚的知道用户态向内核态

  • 传递了系统调用号
  • 传递了参数null向ebx

四、实验——使用库函数API和C代码中嵌入汇编代码两种方式使用同一个系统调用

实验要求:

  1. 选择一个系统调用(13号系统调用time除外),系统调用列表参见http://codelab.shiyanlou.com/xref/linux-3.18.6/arch/x86/syscalls/syscall_32.tbl

  2. 参考视频中的方式使用库函数API和C代码中嵌入汇编代码两种方式使用同一个系统调用,

本次实验我选择了24号和47号系统调用,分别获取当前用户uid(用户ID)和gid(组ID)。

1、uidgid.c(使用库函数API方式):

代码:

该代码通过调用getuid()和getgid()函数来获取当前执行用户uid和gid
 

实验结果:

 
2、uidgid_asm.c(使用C代码中嵌入汇编代码方式):

代码:

嵌入汇编代码版本中将原来两行通过API函数获取uid和gid的代码注释掉,用汇编代码替换。

首先将ebx寄存器清零,表示无参数传入。

然后分别将0x18和0x2f(十进制24和47)赋值给eax寄存器,表示需要调用的系统调用号,24为getuid,47为getgid。

执行int 0x80来执行系统调用。

之后eax寄存器保存了返回值,将它分别赋值给输出uid或gid变量。

完成整个汇编代码的系统调用。

实验结果:

五、总结——系统调用的工作机制

首先在高执行级别下,代码可以执行特权指令,访问任意的物理地址,这时CPU执行级别就对应着内核态。在相应的低级别执行状态下,代码的掌控范围会受到限制。只能在对应级别允许的范围内活动,即为用户态。Linux使用了其中的0级和3级分别来表示内核态和用户态。

用户态:只能访问0x00000000-0xbfffffff的地址空间
内核态:可以访问0xc0000000以上的地址空间

中断处理是从用户态进入内核态主要的方式。当用户态进程调用一个系统调用时,CPU切换到内核态并开始执行一个内核函数,Linux通过执行int $0x80来执行系统调用的,这条汇编指令产生向量为128的编程异常。进程需要指明哪个系统调用,就需要eax寄存器传递一个系统调用号参数。
system_call是linux中所有系统调用的入口点,每个系统调用至少有一个参数,即由eax传递的系统调用号,进入sys_call之后,立即将eax的值压入内核堆栈。然后执行正确的系统调用函数并把返回值带回用户态。系统调用是用户访问内核的唯一手段,内核只管执行封装好的指令并输出结果,用户只需应用API得出相应的结果而无需理会内核执行了哪些指令。

Linux内核分析——第四周学习笔记20135308的更多相关文章

  1. linux内核分析第四周学习笔记

    linux内核分析第四周学习笔记 标签(空格分隔): 20135328陈都 陈都 原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.co ...

  2. Linux内核分析——第一周学习笔记20135308

    第一周 计算机是如何工作的 第一节 存储程序计算机工作模型 1.冯·诺依曼结构模型:冯·诺依曼结构也称普林斯顿结构,是一种将程序指令存储器和数据存储器合并在一起的存储器结构.程序指令存储地址和数据存储 ...

  3. 20135320赵瀚青LINUX内核分析第四周学习笔记

    赵瀚青原创作品转载请注明出处<Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 概述 本周的内容主要是讲解系 ...

  4. Linux内核分析——第二周学习笔记20135308

    第二周 操作系统是如何工作的 第一节 函数调用堆栈 存储程序计算机:是所有计算机基础的框架 堆栈:计算机中基础的部分,在计算机只有机器语言.汇编语言时,就有了堆栈.堆栈机制是高级语言可以运行的基础. ...

  5. Linux内核分析——第四周学习笔记

    扒开系统调用的三层皮[上] 前言:以下笔记除了一些讲解视频中的概念记录,图示.图示中的补充文字.总结.分析.小结部分均是个人理解.如有错误观点,请多指教! 补充:[系统调用的参数传递方法]视频中讲解简 ...

  6. LINUX内核分析第四周学习总结——扒开系统调用的“三层皮”

    LINUX内核分析第四周学习总结--扒开系统调用的"三层皮" 标签(空格分隔): 20135321余佳源 余佳源 原创作品转载请注明出处 <Linux内核分析>MOOC ...

  7. Linux内核分析第二周学习笔记

    linux内核分析第二周学习笔记 标签(空格分隔): 20135328陈都 陈都 原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.co ...

  8. linux内核分析第一周学习笔记

    linux内核分析第一周学习笔记 标签(空格分隔): 20135328陈都 陈都 原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.co ...

  9. Linux内核分析第四周学习总结——系统调用的工作机制

    Linux内核分析第四周学习总结--系统调用的工作机制 内核态 执行级别高,可以执行特权指令,访问任意物理地址,在intel X86 CPU的权限分级为0级. 用户态 执行级别低,只能访问0x0000 ...

随机推荐

  1. LeetCode 休闲计划

    老年退役选手的 LeetCode 休闲之旅 前言 不知不觉两年多的大学时光悄然流逝,浑浑噩噩的状态似乎从来没有离开过自己. 这两年刷题似乎一直是常态.在退役之后的现在,深感有些东西一段时间没有接触,很 ...

  2. Python3编写网络爬虫03-正则表达式的使用

    一.正则表达式(处理字符串强大的工具,有特定的语法结构)功能:实现字符串的检索,替换,匹配验证实例: 地址:http://tool.oschina.net/regex/ #测试文本Hello,my p ...

  3. python第四十四课——继承性之单继承

    2.继承性 继承: 使用场景: 1).生活层面:... 2).计算机层面: 两部分组成,一部分我们称为父类(基类.超类.superclass),另一部分我们称为子类(派生类.subclass), 子类 ...

  4. Centos7 Nginx 开机启动

    Centos 系统服务脚本目录: 用户(user) 用户登录后才能运行的程序,存在用户(user) /usr/lib/systemd/ 系统(system) 如需要开机没有登陆情况下就能运行的程序,存 ...

  5. Invalid action class configuration that references an unknown class named [XX] .

    多次遇到这个错误,难以解决,有时候出现,有时候没有,很神奇,今天发现了一点端倪,虽然说不上找到了所有导致这个bug的原因.至少,也是很主要的一种了. 其实,透过结果,如果debug用心,一行代码一行代 ...

  6. DJI Mobile SDK 新教程

    DJI Mobile SDK 新教程发布! http://bbs.dji.com/thread-20282-1-1.html Android 如何创建一个航拍相机App: 你将学到如何配置DJI Mo ...

  7. debian文本配置网络备忘:/etc/network/interfaces

    我装了wheezy有gnome3,xfce4: 郁闷的是,不论在gnome还是xfce4中 我都无法图形登录或者切换用户到root: 而且我无法在普通用户下图形修改网络配置: 我也搜索不到启用root ...

  8. 基于jmxtrans+influxdb+grafana实现对canal监控

    最近在调研canal数据同步系统的监控方案,网上关于jmxtrans+influxdb+grafana监控kafka的文档很多,没有监控canal的.通过几天的摸索,大致明白了来龙去脉.监控流程基本是 ...

  9. WorldWind源码剖析系列:角度类Angle

    PluginSDK中的角度结构体Angle类图如下所示. 角度结构体主要定义了一个弧度表示角度值的字段:double Radians.还有几个表示角度最大值.最小值.非数值和零角度等字段.定义了一个D ...

  10. windows安装wget

    windows安装wget1. 下载wget-1.11.4-1-setup.exehttps://jaist.dl.sourceforge.net/project/gnuwin32/wget/1.11 ...