有些时候,一个系统调用可能无法马上取到或者送出数据:一个温度采集器如果没有采用中断或者轮询的策略,而是在用户发出请求时才进行采集,并在一定的时间后返回结果。如果用户程序希望调用read或write并且在调用返回时能确保得到想要的结果,那么用户程序应该阻塞,直到有结果或者错误后返回,用户程序的阻塞体现为进程的睡眠,也即系统调用中将进程状态切换为睡眠态。
 
  睡眠和等待队列

  一个进程的睡眠意味着它的进程状态标识符被置为睡眠,并且从调度器的运行队列中去除,直到某些事件的发生将它们从睡眠态中唤醒,在睡眠态,该进程将不被CPU调度,并且,如果不被唤醒,它将永远不被运行。

  在驱动中很容易通过调度等方式使当前进程睡眠,但是进程并不是在任何时候都是可以进入睡眠状态的。

    第一条规则是:当运行在原子上下文时不能睡眠:比如持有自旋锁,顺序锁或者RCU锁。

    在关中断中也不能睡眠。

    持有信号量时睡眠是合法的,但它所持有的信号量不应该影响唤醒它的进程的执行。另外任何等待该信号量的线程也将睡眠,因此发生在持有信号量时的任何睡眠都应当短暂。

    进程醒来后应该进行等待事件的检查,以确保它确实发生了。

  等待队列可以完成进程的睡眠并在事件发生时唤醒它,它由一个进程列表组成。在 Linux 中, 一个等待队列由一个"等待队列头"来管理:

linux/wait.h
struct __wait_queue_head {
spinlock_t lock;
struct list_head task_list;
};
typedef struct __wait_queue_head wait_queue_head_t;

  由于睡眠的进程很有可能在等待一个中断来改变某些状态,或通告某些事件的发生,那么中断上下文很有可能修改该等待队列,所以该结构中的自旋锁lock必须考虑禁中断,也即使用spin_lock_irqsave。

  队列中的成员是如下数据结构的实例,它们组成了一个双向链表:

typedef struct __wait_queue wait_queue_t;
typedef int (*wait_queue_func_t)(wait_queue_t *wait, unsigned mode, int flags, void *key);
int default_wake_function(wait_queue_t *wait, unsigned mode, int flags, void *key);
struct __wait_queue {
unsigned int flags;
#define WQ_FLAG_EXCLUSIVE 0x01
void *private;
wait_queue_func_t func;
struct list_head task_list;
};
flags的值或者为0,或者为WQ_FLAG_EXCLUSIVE。后者表示等待进程想要被独占地唤醒。
private指针指向等待进程的task_struct实例。该变量本质上可以指向任何私有数据,单内核只有很少情况下才这么用。
调用func,唤醒等待进程。
task_list用作一个链表元素,将wait_queue_t实例放置到等待队列中。

  为了使用等待队列,通常需要如下步骤:首先应该建立一个等待队列头:

DECLARE_WAIT_QUEUE_HEAD(name);

  另外一种方法是静态声明,并显式初始化它:

wait_queue_head_t wait_queue;
init_waitqueue_head(&wait_queue);

  接着为使得当前进程进入睡眠,并等待某一事件的发生,需要将它加入到等待队列中,内核提供了以下函数完成此功能:

wait_event(queue, condition);
wait_event_interruptible(queue, condition);
wait_event_timeout(queue, condition, timeout);
wait_event_interruptible_timeout(queue, condition, timeout);

  在所有的形式中,参数queue是要等待的队列头,由于这几个函数都是通过宏实现的,这里的队列头不是指针类型,而是对它的直接使用。条件condition是一个被这些宏在睡眠前后所要求值的任意的布尔表达式。直到条件求值为真,进程持续睡眠。

  通过wait_event进入睡眠的进程是不可中断的,此时进程的state成员置TASK_UNINTERRUPTIBLE位。但是它应该被wait_event_interruptible所替代,它可以被信号中断,这意味着用户程序在等待的过程中可以通过信号中断程序的执行。一个不能被信号中断的程序很容易激怒使用它的用户。wait_event函数没有返回值,而wait_event_interruptible有一个可以识别睡眠被某些信号打断的返回值-ERESTARTSYS。

  wait_event_timeout和wait_event_interruptible_timeout意味着等待一段时间,它以滴答数表示,在这个时间期间超时后,该宏返回一个0值,而不管事件是否发生。

  最后,我们需要在其他进程或者线程(也可能是中断)中通过相对应的函数,唤醒这些队列上沉睡的进程。内核提供了如下函数:

void wake_up(wait_queue_head_t *queue);
void wake_up_interruptible(wait_queue_head_t *queue);
wake_up唤醒所有的在给定队列上等待的进程。
wake_up_interruptible唤醒所有的在给定队列上等待的可中断的睡眠的进程。
 

  尽管wake_up可以替代wake_up_interruptible的功能,但是它们应该使用与wait_event对应的函数。通过等待队列实现一个管道的读写是可行的,内核中fs/pipe.c对管道的实现就是基于等待队列实现的,尽管它有些复杂。另外对于设备驱动来说,一个温度采集器在收到读数据请求后,该进程被放入等待队列,然后唤醒它的布尔变量在该设备对应的中断处理程序中被置为真。

  注意 wake_up_interruptible的调用可能使多个个睡眠进程醒来,而它们又是独占访问某一资源,如何使仅一个进程看到这个真值,这就是WQ_FLAG_EXCLUSIVE的作用,其他进程将继续睡眠。

  等待队列实现原理

  wait_event函数的核心实现如下:

#define __wait_event(wq, condition)                     \
do { \
DEFINE_WAIT(__wait); \
\
for (;;) { \
prepare_to_wait(&wq, &__wait, TASK_UNINTERRUPTIBLE); \
if (condition) \
break; \
schedule(); \
} \
finish_wait(&wq, &__wait); \
} while () 
DEFINE_WAIT注册了一个名为__wait的队列元素,其中包含一个名为autoremove_wake_function的钩子函数,它用来唤醒的进程并将该元素从等待队列中删除。
prepare_to_wait用来将队列元素计入等待队列,并指定进程的state状态标识为TASK_UNINTERRUPTIBLE,当然对应wait_event_interruptible,则是TASK_INTERRUPTIBLE。
for无限循环决定了当前进程在不满足condition时总是被调度,其他进程将替换该进程执行。并且这个循环实际上永远只执行一次,并且只在唤醒时直接
在满足条件时,finish_wait将进程状态设置为TASK_RUNNING,并从等待队列中将其移除。

  需要仔细考虑的是for循环的执行,显然它可能执行一次,也可能是多次,当condition不满足时,将会产生调度,而在此被调度时,将执行for的下一次循环,那么prepare_to_wait不是每次都添加一次__wait元素吗?查看prepare_to_wait代码可以发现,只有wait->task_list指向的链表为空时,也即__wait元素没有加入任何其他等待队列时才会把它加入到当前等待队列中,这也表明一个等待队列元素只能加入一个等待队列。

void prepare_to_wait(wait_queue_head_t *q, wait_queue_t *wait, int state)
{
unsigned long flags;
wait->flags &= ~WQ_FLAG_EXCLUSIVE;
spin_lock_irqsave(&q->lock, flags);
if (list_empty(&wait->task_list))
__add_wait_queue(q, wait);
set_current_state(state);
spin_unlock_irqrestore(&q->lock, flags);
}

  唤醒一个等待队列是通过wake_up系列函数完成的,一些列的唤醒函数都有对应的可中断形式:

#define wake_up(x)            __wake_up(x, TASK_NORMAL, 1, NULL)
#define wake_up_nr(x, nr) __wake_up(x, TASK_NORMAL, nr, NULL)
#define wake_up_all(x) __wake_up(x, TASK_NORMAL, 0, NULL)
#define wake_up_locked(x) __wake_up_locked((x), TASK_NORMAL)

  这里分析它们的核心实现:

kernel/sched.c
void __wake_up(wait_queue_head_t *q, unsigned int mode,
int nr_exclusive, void *key)
{
unsigned long flags;
spin_lock_irqsave(&q->lock, flags);
__wake_up_common(q, mode, nr_exclusive, , key);
spin_unlock_irqrestore(&q->lock, flags);
}

  __wake_up首先获取了自旋锁,然后调用__wake_up_common。该函数通过list_for_each_entry_safe遍历等待队列,如果没有设置独占标志,则根据mode唤醒每个睡眠的进程。nr_exclusiv表示需要唤醒的设置了独占标志进程的数目,它在wake_up中设置为1,表明当处理了一个含有WQ_FLAG_EXCLUSIVE标志进程后,将不再处理,独占标志的意义也在于此。另外看到这里通过func指针执行了真正的唤醒函数。

kernel/sched.c
static void __wake_up_common(wait_queue_head_t *q, unsigned int mode,
int nr_exclusive, int wake_flags, void *key)
{
wait_queue_t *curr, *next;
list_for_each_entry_safe(curr, next, &q->task_list, task_list) {
unsigned flags = curr->flags;
if (curr->func(curr, mode, wake_flags, key) &&
(flags & WQ_FLAG_EXCLUSIVE) && !--nr_exclusive)
break;
}
}

  如果含有独占标志的进程并不位于队列尾部,将导致其后的不含有该标志的进程无法执行,prepare_to_wait_exclusive解决了该问题,它总是将含有独占标志的进程插入到队列尾部,该函数被wait_event_interruptible_exclusive宏调用。

  转自:http://blog.chinaunix.net/uid-20608849-id-3126863.html

Unix环境高级编程-阻塞访问原理——等待队列的更多相关文章

  1. (十三) [终篇] 一起学 Unix 环境高级编程 (APUE) 之 网络 IPC:套接字

    . . . . . 目录 (一) 一起学 Unix 环境高级编程 (APUE) 之 标准IO (二) 一起学 Unix 环境高级编程 (APUE) 之 文件 IO (三) 一起学 Unix 环境高级编 ...

  2. Unix 环境高级编程 (APUE) 之 网络 IPC:套接字

    一起学 Unix 环境高级编程 (APUE) 之 网络 IPC:套接字 . . . . . 目录 (一) 一起学 Unix 环境高级编程 (APUE) 之 标准IO (二) 一起学 Unix 环境高级 ...

  3. (八) 一起学 Unix 环境高级编程 (APUE) 之 信号

    . . . . . 目录 (一) 一起学 Unix 环境高级编程 (APUE) 之 标准IO (二) 一起学 Unix 环境高级编程 (APUE) 之 文件 IO (三) 一起学 Unix 环境高级编 ...

  4. (二) 一起学 Unix 环境高级编程 (APUE) 之 文件 IO

    . . . . . 目录 (一) 一起学 Unix 环境高级编程 (APUE) 之 标准IO (二) 一起学 Unix 环境高级编程 (APUE) 之 文件 IO (三) 一起学 Unix 环境高级编 ...

  5. (五) 一起学 Unix 环境高级编程 (APUE) 之 进程环境

    . . . . . 目录 (一) 一起学 Unix 环境高级编程 (APUE) 之 标准IO (二) 一起学 Unix 环境高级编程 (APUE) 之 文件 IO (三) 一起学 Unix 环境高级编 ...

  6. (六) 一起学 Unix 环境高级编程 (APUE) 之 进程控制

    . . . . . 目录 (一) 一起学 Unix 环境高级编程 (APUE) 之 标准IO (二) 一起学 Unix 环境高级编程 (APUE) 之 文件 IO (三) 一起学 Unix 环境高级编 ...

  7. (九) 一起学 Unix 环境高级编程 (APUE) 之 线程

    . . . . . 目录 (一) 一起学 Unix 环境高级编程 (APUE) 之 标准IO (二) 一起学 Unix 环境高级编程 (APUE) 之 文件 IO (三) 一起学 Unix 环境高级编 ...

  8. (十一) 一起学 Unix 环境高级编程 (APUE) 之 高级 IO

    . . . . . 目录 (一) 一起学 Unix 环境高级编程 (APUE) 之 标准IO (二) 一起学 Unix 环境高级编程 (APUE) 之 文件 IO (三) 一起学 Unix 环境高级编 ...

  9. (十二) 一起学 Unix 环境高级编程 (APUE) 之 进程间通信(IPC)

    . . . . . 目录 (一) 一起学 Unix 环境高级编程 (APUE) 之 标准IO (二) 一起学 Unix 环境高级编程 (APUE) 之 文件 IO (三) 一起学 Unix 环境高级编 ...

随机推荐

  1. 工作记录之 [ python请求url ] v s [ java请求url ]

    背景: 模拟浏览器访问web,发送https请求url,为了实验需求需要获取ipv4数据包 由于不做后续的内容整理(有内部平台分析),故只要写几行代码请求发送https请求url列表中的url即可 开 ...

  2. HDU 3966 Aragorn's Story(模板题)【树链剖分】+【线段树】

    <题目链接> 题目大意: 给定一颗带点权的树,进行两种操作,一是给定树上一段路径,对其上每个点的点权增加或者减少一个数,二是对某个编号点的点权进行查询. 解题分析: 树链剖分的模板题,还不 ...

  3. hdu1285 确定比赛名次【拓扑排序】

    题目链接 确定比赛名次                                         Time Limit: 2000/1000 MS (Java/Others)    Memory ...

  4. NiftyNet开源平台使用

    NiftyNet是一款开源的卷积神经网络平台,专门针对医学图像处理分析,上一篇博客已经详细介绍了这个平台,接下来让我简单介绍一下目前我了解到的使用方法.更详细的使用方法.以及配置过程请查看NiftyN ...

  5. Newtonsoft.Json日期转换

    在使用EasyUI做后台时,使用表格datagrid,用Newtonsoft.Json转换为Json格式后,时间显示为2013-06-15 T00:00:00形式. 后来研究了一下Newtonsoft ...

  6. Django路由详解

    一.路由基础 1.路由url函数:路由自上而下进行匹配:url(正则路径,视图函数内存地址,默认参数,路由别名) 2.路由正则: 规定开始:^ | 规定结束:$ #url(r'index', view ...

  7. BZOJ.5288.[AHOI/HNOI2018]游戏(思路 拓扑)

    BZOJ LOJ 洛谷 考虑如何预处理每个点能到的区间\([l,r]\). 对于\(i,i+1\)的一扇门,如果钥匙在\(i\)的右边,连边\(i\to i+1\),表示从\(i\)出发到不了\(i+ ...

  8. php include 绝对路径 dirname(__FILE__)

     include(dirname(__FILE__)."/PHPMailer/function.php"); 

  9. Django 自定义模板语法

    from django import template from django.utils.safestring import mark_safe register = template.Librar ...

  10. C++ 线段树—模板&总结

    在信息学竞赛中,经常遇到这样一类问题:这类问题通常可以建模成数轴上的问题或是数列的问题,具体的操作一般是每次对数轴上的一个区间或是数列中的连续若干个数进行一种相同的处理.常规的做法一般依托于线性表这种 ...