Linux内核分析(三)内核启动过程分析——构造一个简单的Linux系统
一、系统的启动(各历史节点)
在最开始的时候,计算机的启动实际上依靠一段二进制码,可以这么理解,他并不是一个真正的计算机启动一道程序。计算机在开始加电的时候几乎是没有任何用处的,因为RAM芯片中包括的都是一些没有意义的随机数据,此时没有操作系统在运行。在开始启动的时候,一个特殊的硬件电路在CPU的引脚上产生一个RESET复位信号,就是那个复位信号,就好比我们重启老式电子词典时候后面那个小按键要用到笔芯去按一下。在这个信号产生之后,就会把处理器的一些寄存器设置成固定的值,并执行物理地址0xfffffff0那个地方的代码。硬件把这个地址映射独到某个只读,持久的存储芯片上,这个芯片就是我们通常说的ROM。ROM中所存放的程序集实际上在80x86体系中叫做基本输入/输出系统(Basic Input/Output System——BIOS)因为它包括了几个中断的低级过程。所有的操作系统在启动时,都要通过这些程序对计算机硬件设备进行初始化。一些操作系统,如微软的MS-DOS,依赖于BIOS实现大部分系统调用。
linux中BIOS使用的是一种叫做实模式的地址(还是那句话名字不重要),以为这是在一通电的时候就加载的所以不能用一些逻辑描述(你可以把它理解为变量名字和他的地址相比就是一个逻辑描述)。实模式的地址用一个段地址和一个偏移量表示(seg+offset 类似 ebp+ip这样的)所以物理地址就是seg*16+offset。所以CPU这里面就可以直接的找到内存地址,显然这在没建立一张逻辑表示和物理地址对应表是是必要的(这个表实际上就是全局描述符表,嗯名字不重要)
Linux在启动阶段必须使用BIOS,此时Linux必须从磁盘或者其他的外部存储介质上获得系统的内核镜像(kernel Image)BOIS启动过程实际上分为四个过程:1、对硬件的检测2、硬件初始化3、索索一个操作系统来启动4、找到一个有效的设备。下面我们看一下早期的BOIS部分的结构:
后来就有了bootloader——引导装入程序。在之后就是setup()在之后就是startup_32(),现在他就变成了start_kernel()函数。就是今天我们要分析的。那么其他的我们日后在分析。浸提我么就是来分析start_kernel。
二、实验过程简述及启动过程分析
首先我们先来构建一个简单的Linux内核。大体上是分为两个步骤,首先是现在内核元代码编译内核,然后制作根文件系统,具体步骤过程如下(详细参见云课堂第三周实验指导)
如果是在“实验楼”提供的实验环境下,我们已经搭建了只需要打开shell然后输入如下语句:
下图是具体实验过程截图:
然后回车之后就会看到下面这样的界面,MenuOS正在启动:
然后一会儿他就会完全启动,看到下面的界面就说明启动成功了,然后后我们可以试试他的几个命令,help之后会有相应的提示:
到此为止我们就完成了一个简单的内核搭建。然后我们开始使用GDB调试,再重新打开一个终端我们可以进行如下步骤:
他的意思就是在开始的时候就让CPU停止在启动的那一刻,我们可以看到如下的界面:
这个时候我们可以在刚才新建的那个终端窗口输入gdb进入调试模式:
然后我们可以看到如下的过程:
然后我们看到系统停止在了我们设置的断点上,就是start_kernel。
然后我们可以使用list命令常看停止断点的源代码:如下图所示就是start_kernel()部分的代码:
我们可以在云课堂的主页上产看到3.18.6内核部分的源码,其中比较主要就是arch下面的x86目录。由于Linux是支持很多不同的处理器的所以在这个srch就是architecture对应了不同的体系结构deCPU的启动和内核代码。我们就是关心X86下的这些。从某种意义上,函数start_kernel就好像一般可执行程序中的主函数main,系统进入这个函数之前已经进行了一些最低限度的初始化,再往前研究就涉及很多硬件相关及编程语言了,这里是较高层次的初始化,基本是C代码,一直想搞清楚内核的初始化流程,好对整个linux内核有更深理解。分析程序习惯性的找main函数,那么就从这个start_kernel看看。 这个函数在init/main.c,我们首先开一下start_kernel()的源代码:
这里我们看到了一个void lockdep_init(void) 函数,点开就可以查看它的源代码了(代码的网站就在课程的首页上)然后我么看到它的注释就是用于初始化hash表。那么问题来了这个表干嘛的?我们看到源代码上是这么说的: We keep a global list of all lock classes. The list only grows, never shrinks. The list is only accessed with the lockdep spinlock lock held.实际上就是这个hash表是个全局的锁链表,lock dependency哈希表。个人理解是锁的初始化(欢迎留言补充)。
然后我们看到了init_task。看名字就知道是初始化任务的(恩恩源码就是要看名字猜想然后验证个人感觉)因为多任务的需求,Linux必须能支持任务这一特性,任务即进程,或者更简单地说由task_struct对象实例所代表的一段代码的集合,用以完成特定的任务。所以Linux内核初始化过程中必须为进程以及进程调度做准备。init_task进程在Linux中属于一个比较特殊的进程,它是内核开发者人为制造出来的,而不是其他进程通过do_fork来完成。我们观察这个东西的初始化就是看到它实际上使用静态的方式分配的。【在<arch/x86/kernel/init_task.c>有struct task_struct init_task = INIT_TASK(init_task);如果仔细考察INIT_TASK宏的细节,会发现很多有趣的东西,比如inti_task所对应的内核栈,在INIT_TASK宏中由下列代码指定:.stack = &init_thread_info可以猜想init_task进程的内核栈一定是通过静态方式分配的,事实上也的确】init_thread_info定义中的__init_task_data表明该内核栈所在的区域位于内核映像的init data区,我们可以通过编译完内核后所产生的System.map来看到该变量及其对应的逻辑地址。Linux在无进程概念的情况下将一直从初始化部分的代码执行到start_kernel,然后再到其最后一个函数调用rest_init。
从rest_init开始,Linux开始产生进程,因为init_task是静态制造出来的,pid=0,它试图将从最早的汇编代码一直到start_kernel的执行都纳入到init_task进程上下文中。在rest_init函数中,内核将通过下面的代码产生第一个真正的进程(pid=1):我们也可以开一下他的源码:
实际上我们看到了它实际上是完成了一些初始化的操作,和设置一些必要的参数。然后最后一句就是入口了,到此init_task的任务基本上已经完全结束了,它将沦落为一个idle task,事实上在更早前的sched_init()函数中,通过init_idle(current, smp_processor_id())函数的调用就已经把init_task初始化成了一个idle task,init_idle函数的第一个参数current就是&init_task,在init_idle中将会把init_task加入到cpu的运行队列中,这样当运行队列中没有别的就绪进程时,init_task(也就是idle task)将会被调用,它的核心是一个while(1)循环,在循环中它将会调用schedule函数以便在运行队列中有新进程加入时切换到该新进程上。
下面这张图希望对大家有参考。
三、Linux内核启动的一些综述补充
start_kernel( )函数完成了Linux内核的初始化工作。几乎每天内核部件都是用这个函数进行初始化的,我们只是说道了其中的一小部分:
1.调用sched_init()函数来初始化调度程序
2.调用build_all_zonelists()函数俩初始化内存管理
3.调用page_alloc_init()函数来初始化伙伴系统分配程序
4.调用trap_init()函数和init_IRQ()函数以初始化IDT
5.调用softing_init()函数初始化TASKLET_SOFTIRQ和HI_SOFTIRQ(软中断)
6.调用time_init()初始化系统日期时间
7.调用kmem_cache_init()函数初始化slab分配器(普通和高速缓存)
8.调用calibrate_delay()函数用于确定CPU时钟(延迟函数)
9.调用kernel_thread()函数为进程1创建内个线程,这个内核线程又会创建其他的内核线程并执行/sbin/init程序
在start_kernel()开始执行之后会显示linux版本西悉尼,除此之外,在init程序和内核线程执行的最后阶段还会显示很多其他信息。最后,就会在控制台上出现熟悉的登陆提示,通知用户Linux内核已经启动正在运行。
Linux内核分析(三)内核启动过程分析——构造一个简单的Linux系统的更多相关文章
- LINUX内核分析第三周学习总结——构造一个简单的Linux系统MenuOS
LINUX内核分析第三周学习总结——构造一个简单的Linux系统MenuOS 张忻(原创作品转载请注明出处) <Linux内核分析>MOOC课程http://mooc.study.163. ...
- Linux第三周学习总结——构造一个简单的Linux系统MenuOS
第三周学习总结--构造一个简单的Linux系统MenuOS 作者:刘浩晨 [原创作品转载请注明出处] <Linux内核分析>MOOC课程http://mooc.study.163.com/ ...
- 《Linux内核分析》第三周学习小结 构造一个简单的Linux系统OS
郝智宇 无转载 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 第三周 构造一个简单的Linux系统Me ...
- Linux内核分析第三周学习总结:构造一个简单的Linux系统MenuOS
韩玉琪 + 原创作品转载请注明出处 + <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 一.Linux内 ...
- 《Linux内核分析》第三周笔记 构造一个简单的Linux系统MenuOS
构造一个简单的Linux系统MenuOS 一.linux内核源代码简介 三大法宝(存储程序计算机.函数调用堆栈.中断)和两把宝剑(中断上下文的切换:保存现场和恢复现场.进程上下文的切换) 1.在lin ...
- Linux内核分析 笔记三 构造一个简单的Linux系统MenuOS ——by王玥
一.知识点总结 (一)Linux源代码简介 arch/x86目录下的代码是我们重点关注的 内核启动相关代码都在init目录下 start_kernel函数相当于普通C程序的main函数 linux的核 ...
- 《Linux内核分析》 第三周 构造一个简单的Linux系统MenuOS
Linux内核分析 第三周 构造一个简单的Linux系统MenuOS 张嘉琪 原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.com/ ...
- 20135327郭皓--Linux内核分析第三周 构造一个简单的Linux系统MenuOS
Linux内核分析第三周 构造一个简单的Linux系统MenuOS 前提回顾 1.计算机是如何工作的三个法宝 1.存储程序计算机 2.函数调用堆栈 3.中断 2.操作系统的两把宝剑 中断上下文的切换 ...
- linux内核分析 第三周 构造一个简单的Linux系统MenuOS
一.计算机的三个法宝 存储程序计算机,函数调用堆栈,中断二.操作系统的两把剑:1.中断上下文的切换,保存现场和恢复现场2.进程上下文的切换. 三.linux内核源代码的分析: ·arch/目录保存支持 ...
随机推荐
- ubuntu设置默认python版本
原文:https://www.cnblogs.com/johnny1024/p/8400511.html ··· ubuntu 16.04本身是自带python的,他本身是自带2.X和3.X,两个版本 ...
- xcode自动打ipa包脚本
http://blog.csdn.net/ccf0703/article/details/7999112 文章首发地址:http://webfrogs.github.com/IOS/2012/09/1 ...
- 【bzoj3744】GTY的妹子序列
大力分块+树状数组+主席树…… #include<bits/stdc++.h> #define N 50005 #define pa pair<int,int> #define ...
- 子类构造函数 supper关键字
在导出类的构造函数,如果没有明确指定调用哪一个基类构造器,它会默默调用默认构造器. 如果不存在默认构造器,编译器就会报错. java编程思想 p158(p194)
- 执行监听器( Execution listener)
相关类: org.activiti.engine.delegate.ExecutionListener org.activiti.engine.delegate.TaskListener org.ac ...
- hdu 1054(最小点覆盖集)
Strategic Game Time Limit: 20000/10000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others) ...
- [libgdx游戏开发教程]使用Libgdx进行游戏开发(10)-音乐和音效
本章音效文件都来自于公共许可: http://files.cnblogs.com/mignet/sounds.zip 在游戏中,播放背景音乐和音效是基本的功能. Libgdx提供了跨平台的声音播放功能 ...
- linux程序与进程内存结构
1.可执行文件结构: 1)代码区:包含操作码和操作对象.常量数据(const声明).立即数,代码区是共享的, 只提供只读. 2)全局/静态数据区:包含被初始化的全局数据和初始化静态数据. 3)未初始化 ...
- 百度MapAPI之地理编码
地理编码:将具体地址数据转换为对应坐标点经纬度功能 大致思路: 1.从数据库取得具体地理位置 2.将地址作为参数访问API接口,获取返回数据 3.处理response数据并将经度(lng.longit ...
- Visual Studio 2017 编译Clang
到http://releases.llvm.org/download.html下载LLVM和clang源码 比如: http://releases.llvm.org/6.0.0/llvm-6.0.0. ...