MINIX3 系统任务分析 

7.1 MINIX3 系统任务概要 

MINIX3 怎么来给用户提供丰富的服务呢?除了中断,异常处理,除了时钟服务。 程序员总是希望一个操作系统给他提供足够的服务,使得他能够做出更加高效安 全的程序来。在 MINIX3 中,它提供了一种系统任务机制。这个机制的作用就是 介绍任何想调用系统调用的函数消息,之后将其进行一个精准的处理,使得其能 够对程序员提供帮助。 

MINIX3 整体架构设计成 C/ S 模型,以 PM 为例,PM 其实在 MINIX3 看来就是 就是一个服务进程,用户就是客户端,用户发送消息给 PM 进程,PM 进程接受 消息之后,又将以个客户端的形式存在,这种客户端又会向内核发送消息请求服 务,这种层次模式类似于网络中的 TCP/IP。 

关于 MINIX3 的系统调用和传统的 UNIX/LIUNX 架构不一样。我们不做详细的 分析。我们将以图示的方式揭示出 2 者的差异性。 

113 

这种设计主要是为了除了将一些不得不在内核的部分以外,其他的都必须移到内 核外中进行的这一种设计理念。像在 LINUX/UNIX 这种传统的单体内核中,系 统调用就是一种对于内核提供服务的调用。在 MINX3 中,就大大的不一样,上 面的图也说明了这一点: 

在 MINIX3 中,系统调用是一种符合 POSIX 标准的设计方法,但是这里有一点, 用户进程不在是向内核直接发送请求,在 MINIX3 中,这点非常的重要,是 MINX3 将系统调用变成消息发送服务器,比如向 PM,FS 服务器。之后服务器在发送消 息给系统任务或者内核其他部分。这样就形成了所谓的系统调用。这一点相对于 传统的 LINUX/UNIX 设计而言,要复杂。 

114 

而下面是 MINIX3 的一种执行系统调用的通用过程: 

115 

7.2 MINIX3 源码导读 

这个程序源文件时 kernel/system.c 我在这里把它完整的附录上来进行讲解。 

/* This task handles the interface between the kernel and user-level servers. System services can be accessed by doing a system call. System calls are transformed into request messages, which are handled by this task. By convention, a sys_call() is transformed in a SYS_CALL request message thatis handled in a function named do_call(). 

*这个任务处理器是内核和用户层服务器的接口,系统服务器能够被一个系统调
用所获取。系统调用被转成请求信息,这个请求信息被这个任务处理。惯例的, 一个sys_call()被转成一个SYS_CALL请求信息,这个信息被一个叫做do_call()
的函数来处理 

* A private call vector is used to map all system calls to the functions
thathandle them. The actual handler functions are contained in separate
filesto keep this file clean. The call vector is used in the system task's 

116 

mainloop to handle all incoming requests. 

*一个私自调用向量号被用来映射所有的系统调用函数来处理他们。这个真正的 处理函数被单独放在一个文件中,主要是为了保证文件的整洁。调用号被用来处 理所有进入系统任务的主循环的请求 

* In addition to the main sys_task() entry point, which starts the main loop, there are several other minor entry points: 

*      get_priv: assign privilege structure to user or system

process

*      send_sig: send a signal directly to a system process

*      cause_sig: take action to cause a signal to occur via PM

*      umap_local:  map virtual address in LOCAL_SEG to physical *      umap_remote: map virtual address in REMOTE_SEG to physical *      umap_bios: map virtual address in BIOS_SEG to physical 

*      virtual_copy:    copy bytes from one virtual address to another
*      get_randomness: accumulate randomness in a buffer

* Changes: 

*      Aug 04, 2005      check if system call is allowed (Jorrit N. Herder)

*      Jul  20,  2005      send signal to services with message (Jorrit N.

Herder)

*      Jan 15, 2005      new, generalized virtual copy function (Jorrit N.

Herder)

*      Oct  10,  2004      dispatch system calls from call vector (Jorrit N.

Herder)

*      Sep  30,  2004      source code documentation updated (Jorrit N.

Herder)

*/ 

#include "kernel.h"
#include "system.h"
#include  <stdlib.h>
#include  <signal.h>
#include  <unistd.h> 

#include  <sys/sigcontext.h>
#if  (CHIP  == INTEL) 

#include  <ibm/memory.h>
#include "protect.h"
#endif 

/* Declaration of the call vector that defines the mapping of system calls
* to handler functions. The vector is initialized in sys_init() with
map(),    which makes sure the system call numbers are ok. No space is
allocated,    because the dummy is declared extern. If an illegal call is
given, the array size will be negative and this won't compile. 

117 

*/ 

//这个是已经声明好的调用向量号,这个数组就是各个系统调用的函数入口地址. 是一个公共变量 在kernel/talbe.c有定义 

PUBLIC int  (*call_vec[NR_SYS_CALLS])(message  *m_ptr); 

//这个宏定义在下面系统任务初始化中会用到,主要用于将具体系统任务安装到 //call_vec[]函数内部 

#define map(call_nr, handler)  \ 

{extern int dummy[NR_SYS_CALLS>(unsigned)(call_nr-KERNEL_CALL)  ? 1:-1];}  \ 

call_vec[(call_nr-KERNEL_CALL)]  =  (handler) 

FORWARD  _PROTOTYPE( void initialize,  (void)); 这个文件的第一个函数: 

先看这个函数的执行过程图: 

/*=================================================================== ========* 

* sys_task   系统任务进程,主要是将想调用内核任务的进程

118 

*==================================================================== =======*/ 

PUBLIC void sys_task()

/* Main entry point of sys_task.    Get the message and dispatch on type.
*/ 

static message m; 

register int result; 

register struct proc  *caller_ptr; unsigned int call_nr; 

int s; 

/* Initialize the system task.  */ 

//初始化工作,下面一个函数有详细说明 

//主要是对调用任务函数的入口进行一个初始化工作 

initialize(); 

//这里是一个主循环,也是sys_task整个运行流程,在整个OS运行过程中, //sys_task将一直在处在这个函数里 

while  (TRUE)  { 

/* Get work. Block and wait until a request message arrives.  */
//向任何消息源进行接受一个消息,注意这里的接受消息来源是ANY,所
有可以接受任何消息来源 

//如果没有渴望的消息接受来源,则保持阻塞状态 

receive(ANY, &m); 

// 确认是系统哪个调用号 

call_nr  =  (unsigned) m.m_type  - KERNEL_CALL; //确定调用进程地址 

caller_ptr  = proc_addr(m.m_source); 

/* See if the caller made a valid request and try to handle it. */
if  (!  (priv(caller_ptr)->s_call_mask &  (1<<call_nr)))  {
#if DEBUG_ENABLE_IPC_WARNINGS 

kprintf("SYSTEM: request  %d from  %d denied.\n", call_nr,m.m_source); 

#endif 

result  = ECALLDENIED; /* illegal message type  */

} else if  (call_nr  >= NR_SYS_CALLS)  { /* check call number

*/ 

//如果调用号超出范围,就表示是一个违法的操作 #if DEBUG_ENABLE_IPC_WARNINGS 

kprintf("SYSTEM: illegal request  %d from  %d.\n", call_nr,m.m_source); 

#endif 

119 

result  = EBADREQUEST; /* illegal message type  */

//这个是最终正常调用的结果,这里调用一个call_vec[call_nr],来处理 相应的信息 

else  { 

result  =  (*call_vec[call_nr])(&m); /* handle the system call

*/

/* Send a reply, unless inhibited by a handler function. Use the kernel function lock_send() to prevent a system call trap. The destination * is known to be blocked waiting for a message. 

*/ 

//如果返回结果合法,则尝试发送一个消息,当然这个消息用lock的形式,防 止被其他程序或进程干扰 

if  (result  != EDONTREPLY)  { 

m.m_type  = result; /* report status of call  */

if  (OK  !=  (s=lock_send(m.m_source, &m)))  {

kprintf("SYSTEM, reply to  %d failed:  %d\n", m.m_source,

s);

}

}

}

}

/*=================================================================== ========* 

* initialize *

*==================================================================== =======*/ 

PRIVATE void initialize(void)

register struct priv  *sp;
int i; 

/* Initialize IRQ handler hooks. Mark all hooks available.  */ 

//初始化IRQ处理器的钩子,所有标记所有的钩子表示可以使用,pro_nr就是
用于 

//标志是否被使用 

for  (i=0; i<NR_IRQ_HOOKS; i++)  {
irq_hooks[i].proc_nr  = NONE;

120 

/* Initialize all alarm timers for all processes.  */ //这里初始所有警报器 

for  (sp=BEG_PRIV_ADDR; sp  < END_PRIV_ADDR; sp++)  { tmr_inittimer(&(sp->s_alarm_timer)); 

/* Initialize the call vector to a safe default handler. Some system
calls    may be disabled or nonexistant. Then explicitely map known calls
to their handler functions. This is done with a macro that gives a compile
error if an illegal call number is used. The ordering is not important
here. 

*/ 

//这点个循环就是初始化所有系统的调用函数入口,他们首先被标记成为不能 使用使用的状态 

for  (i=0; i<NR_SYS_CALLS; i++)  {
call_vec[i]  = do_unused; 

//下面这里把系统调用号和函数对应起来,包括常见的进程管理信号处理I/O设 备等等 

//这点还是非常容易看出来的
/* Process management.  */

map(SYS_FORK, do_fork);

map(SYS_EXEC, do_exec);
map(SYS_EXIT, do_exit);
map(SYS_NICE, do_nice);

map(SYS_PRIVCTL, do_privctl); map(SYS_TRACE, do_trace);

/* Signal handling.  */

map(SYS_KILL, do_kill);
map(SYS_GETKSIG, do_getksig);
map(SYS_ENDKSIG, do_endksig);
map(SYS_SIGSEND, do_sigsend);

/* a process forked a new process  */

/* update process after execute  */ /* clean up after process exit  */ /* set scheduling priority  */

/* system privileges control  */ /* request a trace operation  */

/* cause a process to be signaled  */
/* PM checks for pending signals */
/* PM finished processing signal */
/* start POSIX-style signal  */ 

map(SYS_SIGRETURN, do_sigreturn); /* return from POSIX-style

signal  */

/* Device I/O.  */

map(SYS_IRQCTL, do_irqctl);

map(SYS_DEVIO, do_devio);
map(SYS_SDEVIO, do_sdevio);

*/

map(SYS_VDEVIO, do_vdevio); map(SYS_INT86, do_int86);

/* interrupt control operations  */

/* inb, inw, inl, outb, outw, outl */
/* phys_insb, _insw, _outsb, _outsw

/* vector with devio requests  */ /* real-mode BIOS calls  */

121 

/* Memory management.  */

map(SYS_NEWMAP, do_newmap);

map(SYS_SEGCTL, do_segctl);
map(SYS_MEMSET, do_memset);

/* Copying.  */

map(SYS_UMAP, do_umap);
map(SYS_VIRCOPY, do_vircopy);

/* set up a process memory map  */

/* add segment and get selector  */ /* write char to memory area  */

/* map virtual to physical address  */
/* use pure virtual addressing  */ 

map(SYS_PHYSCOPY, do_physcopy); /* use physical addressing  */

map(SYS_VIRVCOPY, do_virvcopy); /* vector with copy requests  */

map(SYS_PHYSVCOPY, do_physvcopy); /* vector with copy requests  */

/* Clock functionality.  */

map(SYS_TIMES, do_times); /* get uptime and process times  */

map(SYS_SETALARM, do_setalarm); /* schedule a synchronous alarm  */

/* System control.  */

map(SYS_ABORT, do_abort); /* abort MINIX  */

map(SYS_GETINFO, do_getinfo); /* request system information  */

map(SYS_IOPENABLE, do_iopenable); /* Enable I/O  */

}

/*===================================================================

========*

* get_priv   主要用于特权的处理,每一个进程是有特定的特权,

这个函数就是干这么一件事情:设置子进程的特权 *

*==================================================================== =======*/ 

PUBLIC int get_priv(rc, proc_type)

register struct proc  *rc;

//儿子进程指针

int proc_type;

//系统或者用户进程的标志

{

/* new  (child) process pointer  */

/* system or user process flag  */ 

/* Get a privilege structure. All user processes share the same privilege * structure. System processes get their own privilege structure.
得到一个特权结构。所有的用户进程共享同样的特权结构。系统进程就会得到它 们自己的结构 

*/ 

register struct priv  *sp; /* privilege structure  */

//如果是系统进程就找到一个空的位置 

if  (proc_type  == SYS_PROC)  { /* find a new slot  */

for  (sp  = BEG_PRIV_ADDR; sp  < END_PRIV_ADDR;  ++sp) 

122 

if (sp->s_proc_nr == NONE && sp->s_id != USER_PRIV_ID) break; 

if  (sp->s_proc_nr  != NONE) return(ENOSPC); 

rc->p_priv  = sp; /* assign new slot  */

rc->p_priv->s_proc_nr  = proc_nr(rc); /* set association  */

rc->p_priv->s_flags  = SYS_PROC; /* mark as privileged  */

} else  {

//如果是用户进程,就共享特权表

rc->p_priv  = &priv[USER_PRIV_ID]; /* use shared slot  */

rc->p_priv->s_proc_nr  = INIT_PROC_NR; /* set association  */

rc->p_priv->s_flags  =  0; /* no initial flags  */

}

return(OK);

}

/*===================================================================

========*

* get_randomness 取随机数函数,这个在中断号等地

方是会用到的,我们在这里简要的介绍下。 *

*==================================================================== =======*/ 

PUBLIC void get_randomness(source)
int source; 

/* On machines with the RDTSC (cycle counter read instruction - pentium * and up), use that for high-resolution raw entropy gathering. Otherwise, * use the realtime clock  (tick resolution).在拥有RDTSC芯片中,可以通 过硬件获取随机数。否则就实时时钟来获得 

* Unfortunately this test is run-time  - we don't want to bother with
* compiling different kernels for different machines.
*On machines without RDTSC, we use read_clock().
*/ 

int r_next; 

unsigned long tsc_high, tsc_low; 

source  %= RANDOM_SOURCES; 

r_next= krandom.bin[source].r_next; 

//486平台已经其后面的平台会有相关生成随机数的硬件
if  (machine.processor  >  486)  { 

read_tsc(&tsc_high, &tsc_low); 

krandom.bin[source].r_buf[r_next]  = tsc_low; } else  { 

123 

//没有这种硬件,就从实时时钟里读出时钟源 

krandom.bin[source].r_buf[r_next]  = read_clock();

if  (krandom.bin[source].r_size  < RANDOM_ELEMENTS)  { krandom.bin[source].r_size  ++; 

//最终生成随机数。 

krandom.bin[source].r_next  =  (r_next  +  1  )  % RANDOM_ELEMENTS;

}

/*===================================================================

========*

* send_sig 这个函数和下一个函数都和PM信号量机制有着

紧密的联系 读这2个函数时,最好结合相关的PM机制来实现。 *

*====================================================================

=======*/

PUBLIC void send_sig(proc_nr, sig_nr)

int proc_nr; /* system process to be signalled  */

int sig_nr; /* signal to be sent,  1 to  _NSIG  */

/* Notify a system process about a signal. This is straightforward. Simply * set the signal that is to be delivered in the pending signals map and * send a notification with source SYSTEM. 

*/ 

//通知系统进程一个信号量。这个非常直接,简单的设定这个信号量,这个信号 量被发送挂起信号位图和发送一个源为SYSTEM通知 

register struct proc  *rp; 

rp  = proc_addr(proc_nr); 

//给需要信号量机制的进程添加一个信号量 

sigaddset(&priv(rp)->s_sig_pending, sig_nr); //之后向proc_nr发送一个通知,通知来源为SYSTEM
lock_notify(SYSTEM, proc_nr); 

/*=================================================================== ========* 

* cause_sig 主要触发信号量机制 *

*==================================================================== =======*/ 

PUBLIC void cause_sig(proc_nr, sig_nr) 

int proc_nr; /* process to be signalled  */

124 

int sig_nr; /* signal to be sent,  1 to  _NSIG  */

{

/* A system process wants to send a signal to a process.    Examples are:

* - HARDWARE wanting to cause a SIGSEGV after a CPU exception

* - TTY wanting to cause SIGINT upon getting a DEL

* - FS wanting to cause SIGPIPE for a broken pipe

一个系统进程想发送一个信号给一个进程。举例如下:
在一个CPU异常之后HARDWARE想引起一个SIGSEGV
TTY在得到一个DEL之后,想引起一个SIGINT
FS想在一个broken pipe之后得到一个SIGPIPE 

* Signals are handled by sending a message to PM.    This function handles
the 

* signals and makes sure the PM gets them by sending a notification. The * process being signaled is blocked while PM has not finished all signals * for it. 

信号量通过发送一个消息给PM被处理。cause_sig函数处理这个信号量并且确保 PM得到它们,而给它们 

发送一个通知。当PM还没有完成所有信号量正在被发送信号量的进程被阻塞 

* Race conditions between calls to this function and the system calls
that 

* process pending kernel signals cannot exist. Signal related functions
are 

* only called when a user process causes a CPU exception and from the kernel 

* process level, which runs to completion. 

*/ 

register struct proc  *rp; 

/* Check if the signal is already pending. Process it otherwise.  */ 

rp  = proc_addr(proc_nr); 

sigaddset(&rp->p_pending, sig_nr); 

if  (!  (rp->p_rts_flags & SIGNALED))  { /* other pending  */

if  (rp->p_rts_flags  ==  0) lock_dequeue(rp); /* make not

ready  */ 

rp->p_rts_flags  |= SIGNALED  | SIG_PENDING; /* update flags */ send_sig(PM_PROC_NR, SIGKSIG); 

}

}

125 

7.3 系统调用函数举例 

现在进入主题进行分析,MINIX3 的有很多系统任务,我在此会将绝大部分的系 统任务给予介绍,以此让读者对 MINIX3 的系统任务有个全名直白的理解。 现在就进入/kernel/system 文件中看: 

/* The kernel call implemented in this file:
*      m_type:   SYS_VIRCOPY, SYS_PHYSCOPY
*这个消息来源于2个:SYS_VIRCOPY和SYS_PHYSOCPY
* The parameters for this kernel call are: 

* m5_c1:   CP_SRC_SPACE source virtual segment 源虚拟段

//CP_SRC_SPACE 表示m5_1的宏定义 m5_1是在消息机制定义的一种方式, 

//CR_SRC是为了书写方便而设定的。后面所有都采用这种形式,后面就会忽略这 //是模式的介绍。

* m5_l1:   CP_SRC_ADDR

//在段的源偏移地址

* m5_i1:   CP_SRC_PROC_NR

//源进程号

* m5_c2:   CP_DST_SPACE

//目的虚拟段号

* m5_l2:   CP_DST_ADDR

//目的段的偏移地址

* m5_i2:   CP_DST_PROC_NR

//目的进程号

* m5_l3:   CP_NR_BYTES

//复制的目的字节数

*/

#include "../system.h"

#include  <minix/type.h>

source offset within segment

source process number

destination virtual segment

destination offset within segment

destination process number

number of bytes to copy 

#if  (USE_VIRCOPY  || USE_PHYSCOPY) 

/*=================================================================== ========* 

* do_copy *

*==================================================================== =======*/ 

PUBLIC int do_copy(m_ptr) 

register message  *m_ptr; /* pointer to request message  */

/* Handle sys_vircopy() and sys_physcopy().    Copy data using virtual or
* physical addressing. Although a single handler function is used, there 

126 

* are two different kernel calls so that permissions can be checked.
处理sys_vircopy()和sys_physcopy().用虚拟地址或者物理地址复制数据。尽
管一个单独的函数被使用,但是这里有2种不同的内核调用所以权限应该需要做
出检查 

*/ 

struct vir_addr vir_addr[2]; /* virtual source and destination

address  */

phys_bytes bytes; /* number of bytes to copy  */

int i; 

/* Dismember the command message.  */
//这些宏定义在上面都有,不做详细的分析 

vir_addr[_SRC_].proc_nr  = m_ptr->CP_SRC_PROC_NR; 

vir_addr[_SRC_].segment  = m_ptr->CP_SRC_SPACE; 

vir_addr[_SRC_].offset  =  (vir_bytes) m_ptr->CP_SRC_ADDR; vir_addr[_DST_].proc_nr  = m_ptr->CP_DST_PROC_NR;
vir_addr[_DST_].segment  = m_ptr->CP_DST_SPACE;
vir_addr[_DST_].offset  =  (vir_bytes) m_ptr->CP_DST_ADDR; bytes  =  (phys_bytes) m_ptr->CP_NR_BYTES; 

/* Now do some checks for both the source and destination virtual address. 

* This is done once for  _SRC_, then once for  _DST_. 主要是做一些检查,看看有没有违反权限 

*/ 

for  (i=_SRC_; i<=_DST_; i++)  { 

/* Check if process number was given implictly with SELF and is valid.

*/

if  (vir_addr[i].proc_nr  == SELF) vir_addr[i].proc_nr  = m_ptr->m_source; 

if  (! isokprocn(vir_addr[i].proc_nr) && vir_addr[i].segment  != PHYS_SEG) 

return(EINVAL); 

/* Check if physical addressing is used without SYS_PHYSCOPY.  */ if  ((vir_addr[i].segment & PHYS_SEG) && 

m_ptr->m_type  != SYS_PHYSCOPY) return(EPERM);

}

/* Check for overflow. This would happen for  64K segments and  16-bit
* vir_bytes. Especially copying by the PM on do_fork() is affected.
检查是否溢出 

*/ 

127 

if  (bytes  !=  (vir_bytes) bytes) return(E2BIG); 

/* Now try to make the actual virtual copy.  */ 

//以上都通过,证明了没有问题,就进行真正以上的复制,从源复制bytes个字 //节到目的进程的地址上 

return( virtual_copy(&vir_addr[_SRC_], &vir_addr[_DST_], bytes)  );

}

#endif  /*  (USE_VIRCOPY  || USE_PHYSCOPY)  */ 

/* The kernel call implemented in this file: *      m_type:   SYS_FORK 

//是用SYS_FORK调用

* The parameters for this kernel call are:

* m1_i1:   PR_PROC_NR (child's process table slot)

//孩子进程表

* m1_i2:   PR_PPROC_NR

//父亲进程

*/

#include "../system.h" #include  <signal.h>

#if  (CHIP  == INTEL)

#include "../protect.h" #endif

#if USE_FORK

(parent, process that forked) 

/*=================================================================== ========* 

* do_fork *

事实上这个还是非常的重要,涉及到PM的知识,在此做一个简要的介绍,主要是 做一些设置工作。主要就是设置新进程的proc结构体。至于申请内存得其他事情 是由PM来处理 

*==================================================================== =======*/ 

PUBLIC int do_fork(m_ptr) 

register message  *m_ptr; /* pointer to request message  */

/* Handle sys_fork().    PR_PPROC_NR has forked.    The child is PR_PROC_NR.
*/ 

#if  (CHIP  == INTEL)
reg_t old_ldt_sel; 

#endif 

128 

register struct proc  *rpc; /* child process pointer  */

struct proc  *rpp; /* parent process pointer  */

int i; 

rpp  = proc_addr(m_ptr->PR_PPROC_NR);//rpp就是指向父亲进程
rpc  = proc_addr(m_ptr->PR_PROC_NR);//rpp就是指向孩子进程
if  (isemptyp(rpp)  ||  ! isemptyp(rpc)) return(EINVAL); 

/* Copy parent 'proc' struct to child. And reinitialize some fields. 将父亲进程的proc结构复制给孩子进程,并且重新初始化一些字段  */
#if  (CHIP  == INTEL) 

old_ldt_sel  = rpc->p_ldt_sel; /* backup local descriptors  */

*rpc  =  *rpp; /* copy 'proc' struct  *///将rpc指向父亲进

程,目的就是做进一步的复制

rpc->p_ldt_sel  = old_ldt_sel; /* restore descriptors  */

//将父亲进程的段描述符进行重新的设定

#else 

*rpc  =  *rpp; /* copy 'proc' struct  */

#endif 

rpc->p_nr  = m_ptr->PR_PROC_NR;  /* this was obliterated by copy  */ 

/* Only one in group should have SIGNALED, child doesn't inherit tracing.
*/ 

//继承正在运行的进程一些标志位 

rpc->p_rts_flags  |= NO_MAP;  /* inhibit process from running  */ 

rpc->p_rts_flags &=  ~(SIGNALED  | SIG_PENDING  | P_STOP); sigemptyset(&rpc->p_pending); 

//孩子进程将返回设置成为0,这就使得孩子进程知道它是孩子进程 

rpc->p_reg.retreg  =  0; /* child sees pid  =  0 to know it is child  */ //设定所有的计时都为0,因为子进程还没有投入使用 

rpc->p_user_time  =  0; /* set all the accounting times to  0  */

rpc->p_sys_time  =  0;

/* Parent and child have to share the quantum that the forked process
had, 

* so that queued processes do not have to wait longer because of the
fork. 

* If the time left is odd, the child gets an extra tick.
*/ 

//父亲进程和子进程共享整个时钟剩余量,这样做是有好处还有坏处,就不得而 知了! 

rpc->p_ticks_left  =  (rpc->p_ticks_left  +  1)  /  2; rpp->p_ticks_left  =    rpp->p_ticks_left  /  2; 

129 

/* If the parent is a privileged process, take away the privileges from
the 

* child process and inhibit it from running by setting the NO_PRIV flag.
* The caller should explicitely set the new privileges before
executing. 

*/ 

//主要是去除孩子进程的特权标志位,当然这个也是在父亲进程是一个有特权的 //情况做的事情,不然没有必要做 

if  (priv(rpp)->s_flags & SYS_PROC)  { 

rpc->p_priv  = priv_addr(USER_PRIV_ID); rpc->p_rts_flags  |= NO_PRIV; 

return(OK);

}

#endif  /* USE_FORK  */

/* The kernel call implemented in this file:

*      m_type:   SYS_IRQCTL

系统类型来源于SYS_IRQCTL,主要是处理中断信息

*

* The parameters for this kernel call are: 

* m5_c1:   IRQ_REQUEST (control operation to perform)

//IRQ_REQUEST 控制操作来执行

* m5_c2:   IRQ_VECTOR (irq line that must be controlled)

//向量号必须被控制

* m5_i1:   IRQ_POLICY (irq policy allows reenabling interrupts)

//中断向量策略允许嵌套中断

* m5_l3:   IRQ_HOOK_ID

//提供返回中断索引

* ,, ,,

kernel)

*/

(provides index to be returned on interrupt)

(returns index of irq hook assigned at 

//选取这个系统调用来看下,这个系统调用其实就是一个用于处理中断的方法过 程,消息类型是SYS_IRQCTL 

#include "../system.h" 

#if USE_IRQCTL 

FORWARD  _PROTOTYPE(int generic_handler,  (irq_hook_t  *hook)); 

/*=================================================================== ========* 

* do_irqctl *

130 

*==================================================================== =======*/ 

PUBLIC int do_irqctl(m_ptr) 

register message  *m_ptr; /* pointer to request message  */

/* Dismember the request message.  */ 

int irq_hook_id; 

int notify_id;
int r  = OK;
int irq_vec; 

irq_hook_t  *hook_ptr; 

/* Hook identifiers start at  1 and end at NR_IRQ_HOOKS.  */ irq_hook_id  =  (unsigned) m_ptr->IRQ_HOOK_ID  -  1;
irq_vec  =  (unsigned) m_ptr->IRQ_VECTOR; 

/* See what is requested and take needed actions.  */ //接受的消息是需要内核做什么工作 

switch(m_ptr->IRQ_REQUEST)  { 

/* Enable or disable IRQs. This is straightforward.  */ //实现关闭和打开中断功能,当然在此要排除一些非法状况 case IRQ_ENABLE: 

case IRQ_DISABLE:
//先检查时候违法操作 

if  (irq_hook_id  >= NR_IRQ_HOOKS  || 

irq_hooks[irq_hook_id].proc_nr  == NONE) return(EINVAL);
if  (irq_hooks[irq_hook_id].proc_nr  != m_ptr->m_source)
return(EPERM); 

//排除违法操作时,如果请求是关闭中断,则就关闭那个中断向量号,如果不是, //就开启中断向量号 

if  (m_ptr->IRQ_REQUEST  == IRQ_ENABLE) 

enable_irq(&irq_hooks[irq_hook_id]); 

else 

disable_irq(&irq_hooks[irq_hook_id]); break; 

/* Control IRQ policies. Set a policy and needed details in the IRQ table. 

* This policy is used by a generic function to handle hardware interrupts. 

*/ 

131 

case IRQ_SETPOLICY: 

/* Check if IRQ line is acceptable.  */ 

if  (irq_vec  <  0  || irq_vec  >= NR_IRQ_VECTORS) return(EINVAL); 

/* Find a free IRQ hook for this mapping.  */ 

// 

hook_ptr  = NULL; 

//主要是来寻找一个空闲的IRQ向量号来注册,记住这里中确确事实的中断向量 //号。是irq_hooks[]数组的下表 

for  (irq_hook_id=0; irq_hook_id<NR_IRQ_HOOKS; irq_hook_id++)  {
if  (irq_hooks[irq_hook_id].proc_nr  == NONE)  { 

hook_ptr  = &irq_hooks[irq_hook_id]; /* free hook  */

break;

}

//如果没有找到,就会出现错误。 

if  (hook_ptr  == NULL) return(ENOSPC); 

/* When setting a policy, the caller must provide an identifier that
* is returned on the notification message if a interrupt occurs.
*/ 

notify_id  =  (unsigned) m_ptr->IRQ_HOOK_ID; 

if  (notify_id  > CHAR_BIT * sizeof(irq_id_t)  -  1) return(EINVAL); 

/* Install the handler.  */ 

//给hook_ptr设定详细的信息。 

hook_ptr->proc_nr  = m_ptr->m_source; /* process to notify  */

hook_ptr->notify_id  = notify_id; /* identifier to pass  */

hook_ptr->policy  = m_ptr->IRQ_POLICY; /* policy for interrupts

*/ 

//注意这里,这里就是将中断同样处理程序给注册到向量号为irq_vec上。我们 等下会详细看到通用中断处理程序generic_handler是干了一件什么事情 

put_irq_handler(hook_ptr, irq_vec, generic_handler); 

/* Return index of the IRQ hook in use.  */ 

m_ptr->IRQ_HOOK_ID  = irq_hook_id  +  1; break; 

case IRQ_RMPOLICY: 

if  (irq_hook_id  >= NR_IRQ_HOOKS  || 

132 

irq_hooks[irq_hook_id].proc_nr  == NONE)  { return(EINVAL); 

} else if  (m_ptr->m_source  != irq_hooks[irq_hook_id].proc_nr)  {
return(EPERM); 

/* Remove the handler and return.  */ 

//在前面进行一系列的检查之后,发现没有问题时,就会将irq_hook_id中断信 息给去除掉 

rm_irq_handler(&irq_hooks[irq_hook_id]); break; 

default: 

r  = EINVAL; /* invalid IRQ_REQUEST  */

}

return(r);

}

/*===================================================================

========*

* generic_handler 这是一个通用中断处理程序,前面

一个函数已经调用了这个函数,现在我们深入里面分析 *

*==================================================================== =======*/ 

PRIVATE int generic_handler(hook)
irq_hook_t  *hook; 

/* This function handles hardware interrupt in a simple and generic way. All interrupts are transformed into messages to a driver. The IRQ line will bereenabled if the policy says so. 

*/ 

//这个函数处理硬件中断,用的方法非常简单和通用。所有的中断将被转化成消
息传送给驱动器。这个IRQ线将会被嵌套如果策略说可以的话。
/* As a side-effect, the interrupt handler gathers random information
by    timestamping the interrupt events. This is used for  /dev/random.
*/ 

get_randomness(hook->irq);
//这个是用随机算法取一个irq号 

/* Add a bit for this interrupt to the process' pending interrupts. When * sending the notification message, this bit map will be magically set * as an argument. 

*/ 

priv(proc_addr(hook->proc_nr))->s_int_pending  |=  (1  << 

133 

hook->notify_id); 

/* Build notification message and return.  */ //发送一个通知给HARDWRARE 

lock_notify(HARDWARE, hook->proc_nr);
return(hook->policy & IRQ_REENABLE);

#endif  /* USE_IRQCTL  */ 

/* The kernel call implemented in this file: *      m_type:   SYS_SETALARM 

* 消息类型:SYS_SETALARM

* The parameters for this kernel call are:

* m2_l1:   ALRM_EXP_TIME

*警报器消耗时间

* m2_i2:   ALRM_ABS_TIME

ALRM_ABS_TIME:是不是绝对时间
*  m2_l1:   ALRM_TIME_LEFT

*/

#include "../system.h"

#if USE_SETALARM

(alarm's expiration time)

(expiration time is absolute?)

(return seconds left of previous) 

FORWARD  _PROTOTYPE( void cause_alarm,  (timer_t  *tp)  ); 

/*=================================================================== ========* 

* do_setalarm 主要工作是给当前进程设置时

钟警报器,将时钟设置成相应的想要的时间进行警报* 

*==================================================================== =======*/ 

PUBLIC int do_setalarm(m_ptr) 

message  *m_ptr; /* pointer to request message  */

/* A process requests a synchronous alarm, or wants to cancel its alarm.
*/ 

//对时钟操作的最终需要调用的任务 

register struct proc  *rp;  /* pointer to requesting process  */ //指向正在请求的进程 

int proc_nr; /* which process wants the alarm  */

134 

//哪个进程想要警报 

long exp_time; /* expiration time for this alarm  */

//这个时钟警报器的时间

int use_abs_time; /* use absolute or relative time  */

//用绝对绝对时间或者相对时间

timer_t  *tp; /* the process' timer structure  */

//指向这个时钟警报器结构 

clock_t uptime;  /* placeholder for current uptime  */ 

/* Extract shared parameters from the request message.  */ //将消息信息抽取出来 

exp_time  = m_ptr->ALRM_EXP_TIME;  /* alarm's expiration time  */ 

use_abs_time  = m_ptr->ALRM_ABS_TIME; /* flag for absolute time  */ 

proc_nr  = m_ptr->m_source; /* process to interrupt later  */

rp  = proc_addr(proc_nr); 

if  (!  (priv(rp)->s_flags & SYS_PROC)) return(EPERM); 

/* Get the timer structure and set the parameters for this alarm.  */
//在这里设置tp所指向的timer_t的各个属性值,其实这个结构体是在进程里
//定义的 

tp  = &(priv(rp)->s_alarm_timer);
//ta_int设置成哪个进程想要警报
tmr_arg(tp)->ta_int  = proc_nr; 

//tp的tmr_func代表的是当时间耗尽该指向哪个函数 

tp->tmr_func  = cause_alarm; 

/* Return the ticks left on the previous alarm.  */ 

//主要是返回当前时间,看看还有多少时钟剩下,之后下面就是将警报器的时 //钟节拍设置好 

uptime  = get_uptime(); 

if  ((tp->tmr_exp_time  != TMR_NEVER) && (uptime  < tp->tmr_exp_time) )

{

m_ptr->ALRM_TIME_LEFT  =  (tp->tmr_exp_time  - uptime);

} else  {

m_ptr->ALRM_TIME_LEFT  =  0;

}

/* Finally,  (re)set the timer depending on the expiration time. 最终,我们依靠消耗时间来设定时钟警报器 

*/ 

//如果消耗时间为0,则需要重新设置时钟警报器。如果不为0,就调用 

set_timer(),这个函数就是在内核时钟队列里安装这个时钟警报器,看门狗函 数为tmr_func 

if  (exp_time  ==  0)  { 

135 

reset_timer(tp);
} else  { 

tp->tmr_exp_time  =  (use_abs_time)  ? exp_time  : exp_time  + get_uptime(); 

set_timer(tp, tp->tmr_exp_time, tp->tmr_func);

}

return(OK);

}

/*===================================================================

========*

* cause_alarm    这个函数主要是引起警报,主要是向目标进程发

送一个消息,消息源为CLOCK *

*==================================================================== =======*/ 

PRIVATE void cause_alarm(tp)
timer_t  *tp; 

/* Routine called if a timer goes off and the process requested a synchronous 

* alarm. The process number is stored in timer argument 'ta_int'. Notify
that 

* process with a notification message from CLOCK.
*/ 

//如果时间计时器已经耗尽,并且进程需要一个异步警告器。进程数被存储 在timer结构的ta_int里, 

//通知进程号为proc_nr一个消息,消息来源为CLOCK 

int proc_nr  = tmr_arg(tp)->ta_int; /* get process number  */

lock_notify(CLOCK, proc_nr); /* notify process  */

#endif  /* USE_SETALARM  */ 

就此 系统任务基本上的框架就分析完了,系统任务其实相对来讲还是比较简单 的。但是涉及到具体调用时需要注意消息的格式的具体含义!

MINIX3 系统任务分析的更多相关文章

  1. 2012高校GIS论坛

    江苏省会议中心 南京·钟山宾馆(2012年4月21-22日) 以"突破与提升"为主题的"2012高校GIS论坛"将于4月在南京举行,由南京大学和工程中心共同承办 ...

  2. MINIX3

    这个系列minix3是好早看的源码  现在都忘记的差不多了 觉得就此扔掉可惜了  今天把他全部放在博客上 1 是想和大家一起讨论下 2 是没事看看 能够加强对一个稳定性系统的理解 加厚

  3. MINIX3 内核整体架构回顾及内核定 性分析

    MINIX3  内核整体架构回顾及内核定 性分析 12.1 注意事项 由于本文档不对 I/O 文件系统做出分析,所以在此不对 MINIX3 整体做出一个分 析,本章主要是针对内核进程分析.并且这里的模 ...

  4. 【LINUX/UNIX网络编程】之使用消息队列,信号量和命名管道实现的多进程服务器(多人群聊系统)

    RT,使用消息队列,信号量和命名管道实现的多人群聊系统. 本学期Linux.unix网络编程的第三个作业. 先上实验要求: 实验三  多进程服务器 [实验目的] 1.熟练掌握进程的创建与终止方法: 2 ...

  5. MINIX3 进程通信分析

    MINIX3 进程通信分析 6.1MINIX3 进程通信概要 MINIX3 的进程通信是 MINIX3 内核部分最重要的一个部件,我个人认为其实这 是内核中的“内核”,怎么来理解这个概念呢?其实 MI ...

  6. MINIX3 进程调度分析

    MINIX3 进程调度分析  5.1MINIX3 进程调度概要  MINIX3 的进程调度还是非常简单的,调度算法是非常短小的,其目的就是体现 了一个简单和高效的设计原则,当然简单和高效其实很难并存, ...

  7. MINIX3 内核时钟分析

    MINIX3 内核时钟分析  4.1 内核时钟概要  先想想为什么 OS 需要时钟?时钟是异步的一个非常重要的标志,设想一下,如 果我们的应用程序需要在多少秒后将触发某个程序或者进程,我们该怎么做到? ...

  8. MINIX3 保护模式分析

    3.1 INTEL 保护模式概要 先要说明一个问题:不是 MINIX3 一定要设置这个保护模式,但是在 386 平台上, 引入了这个保护模式机制,MINIX3 不得不设立相关保护模式的内容.由于 38 ...

  9. MINIX3 导读分析

    一个操作系统的分析是属于一个非常庞大的工程,操作系统就像是一个人造的 人,每一个模块想完全发挥功效,很有可能需要很多模块的支持才能够实现.所 以在分析 MINIX3 时,我认为同时看多个模块对于理解 ...

随机推荐

  1. 目前几款基于html5的前端框架:如Bootstrap、Foundation、Semantic UI 、Amaze UI

    Bootstrap是由Twitter在2011年8月推出的开源WEB前端框架,集合CSS 和HTML,使用了最新的浏览器技术,为快速WEB开发提供了一套前端工具包,包括布局.网格.表格.按钮.表单.导 ...

  2. ubuntu 软件安装的几种方法

    说明:由于图形化界面方法(如Add/Remove... 和Synaptic Package Manageer)比较简单,所以这里主要总结在终端通过命令行方式进行的软件包安装.卸载和删除的方法. 一.U ...

  3. 深入理解Redis:命令处理流程

    Redis是著名的NoSQL键值数据库服务器,为了保证效率,其数据都缓存在内存中.与Memcached相比,Redis支持的数据类型更多,包括String,List,Set,Zset和Hash.下面简 ...

  4. 可伸缩的textview。

    在一些应用中,比如腾讯的应用市场APP应用宝,关于某款应用的介绍文字,如果介绍文字过长,那么不是全部展现出来,而是显示三四行的开始部分(摘要),预知全部的内容,用户点击展开按钮即可查阅全部内容. 这样 ...

  5. java引用类型

      java数据类型图: java的数据类型分基本数据类型(原始数据类型)和引用数据类型:1.基本八大类,图中可以很清楚的看到:这种类型的数据变量在声明之后java就会立刻分配给他内存空间.如:sho ...

  6. C-指针和数组的区别

    指针的操作: 允许:1)同类型指针的赋值 2)与整形的加减运算 3)指向同一数组内指针的减运算和比较 4)赋 ‘0’ 或与 ‘0’ 比较 不允许:1)两指针的相加,相乘除,位移或mask 2)与flo ...

  7. 在同一个页面中加载多个不同的jQuery版本

    <!-- 从谷歌服务器加载jQuery最新版本--> <script type="text/javascript" src="http://ajax.g ...

  8. android selector详解

    --> 改变字体的颜色<selector xmlns:android="http://schemas.android.com/apk/res/android"> ...

  9. error: unknown field 'ioctl' specified in initializer

    error message: 原因: 从2.6.36开始,file_operations结构发生了重大变化 具体看  xx../include/linux/fs.h定义: 取消了原先的 int (*i ...

  10. SharePoint 2016 的新特性概览(二)(What's New for IT Professionals in SharePoint Server 2016)

    博客地址:http://blog.csdn.net/FoxDave SharePoint 2016 的新特性 三. 监测和数据(Insights and Data) 实时数据监测,包括对使用情况.存储 ...