最近项目组做xen底层,我已经被完爆无数遍了,关键在于对内核、驱动这块不熟悉,导致分析xen代码非常吃力。于是准备细细的将 几本 linux 书籍慢慢啃啃。

正好看到LINUX内核设计与实现,对于内核中中断下半段该如何选择?大牛的原话是这样的:“从根本上来说,你有休眠的需要吗?要是有,工作队列就是你的唯一选择,否则最好用tasklet。……”

书中一直强调 工作队列是可以休眠的,而且翻译的人总是强调”工作队列是运行在进程上下文的”, 对于这个翻译,我不是很理解,进程上下文难道就是指用户态而言吗,完全糊涂了,准备自己做个实验。于是我在网上收了下,并自己写了一个工作队列的例子,基本代码如下:


struct work_struct test_task; void task_handler(void *data)
{
char c = 'a';
int i = 0; while (task_doing == 1)
{
c = 'a'+ i%26;
printk(KERN_ALERT "---%c\n", c); if (i++ > 50)
{
printk(KERN_ALERT "i beyone so quit");
break;
} //msleep(1000);
wait_event_interruptible(my_dev->test_queue, my_dev->test_task_step !=0);
} printk(KERN_ALERT "quit task task_doing %d\n",task_doing); }
static int
test_ioctl(struct inode *inode, struct file *filp,
unsigned int cmd, unsigned long arg)
{
switch(cmd)
{
case IOCTL_INIT_TASK:
task_doing = 1;
INIT_WORK(&test_task, task_handler);
printk(KERN_ALERT "ioctl init task \n");
break;
case IOCTL_DO_TASK:
printk(KERN_ALERT "ioctl do task \n");
schedule_work(&test_task);
break;
default:
printk(KERN_ALERT "unknown ioctl cmd\n");
break;
}
return 0;
}

用户态测试程序通过 ioctl 命令发送 IOCTL_INIT_TASK 和 IOCTL_DO_TASK 命令。通过书中介绍,INIT_WORK 是初始化一个工作队列,其后调用schedule_work(&test_task) 后,才会执行工作队列上注册的回调函数。

在回调函数中,我进行了睡眠,开始用的是 msleep ,这个函数会放弃CPU到指定的时间,没想到我的内核居然挂住了,再也无法响应。看看驱动设计的代码,很少看到有人用msleep的,可能是自己用了不恰当的函数,于是换成如下代码:

wait_event_interruptible(my_dev->test_queue, my_dev->test_task_step !=0);

重新将虚拟机恢复后,执行同样的测试,还是不行,一运行注册的回调函数,内核就立刻挂起,再也无法操作。

更加无法理解了,说好的工作队列是可以睡眠的,但是我调用睡眠,内核居然就永远无法醒来啦。已经没有机会执行一个动作让 my_dev->test_task_step == 1 了,那么书中所说的 工作队列可以睡眠是什么意思呢 ?

同时看了设备驱动详解中阻塞IO的例子,书中说在 linux 中一个等待队列头可以如下动态创建:

wait_queue_head_t my_queue;
init_waitqueue_head(&my_queue);

但是常常更容易的做法是放一个 DEFINE_WAIT 行在循环的顶部, 来实现你的睡眠.

下一步是添加你的等待队列入口到队列, 并且设置进程状态. 2 个任务都由这个函数处理:

void prepare_to_wait(wait_queue_head_t *queue, wait_queue_t *wait, int state); 

这里, queue 和 wait 分别地是等待队列头和进程入口. state 是进程的新状态; 它应当或者是 TASK_INTERRUPTIBLE(给可中断的睡眠, 这常常是你所要的)或者 TASK_UNINTERRUPTIBLE(给不可中断睡眠).

在调用 prepare_to_wait 之后, 进程可调用 schedule -- 在它已检查确认它仍然需要等待之后. 一旦 schedule 返回, 就到了清理时间. 这个任务, 也, 被一个特殊的函数处理:

void finish_wait(wait_queue_head_t *queue, wait_queue_t *wait); 

同时,书中还有一个例子:

/* Wait for space for writing; caller must hold device semaphore. On
* error the semaphore will be released before returning. */
static int scull_getwritespace(struct scull_pipe *dev, struct file *filp)
{ while (spacefree(dev) == 0)
{ /* full */
DEFINE_WAIT(wait); up(&dev->sem);
if (filp->f_flags & O_NONBLOCK)
return -EAGAIN; PDEBUG("\"%s\" writing: going to sleep\n",current->comm);
prepare_to_wait(&dev->outq, &wait, TASK_INTERRUPTIBLE);
if (spacefree(dev) == 0)
schedule();
finish_wait(&dev->outq, &wait);
if (signal_pending(current)) return -ERESTARTSYS; /* signal: tell the fs layer to handle it */
if (down_interruptible(&dev->sem))
return -ERESTARTSYS;
}
return 0; }

问题在于,手动睡眠的方式和上面调用 wait_event_interruptible 有什么区别呢 ?从代码上看,手动睡眠有一个等待队列头,而且有一个等待队列单个元素 wait, prepare_to_wait 函数会将 该单个等待元素挂到等待队列头里面去。 一直想搞明白调用 prepare_to_wait 后,会不会进入睡眠 ? 做了一个实验,答案是肯定的,调用prepare_to_wait后,内核立刻进入睡眠状态,只有在其他地方调用 wake_up_interruptible 后才会通知它醒来。。。而且 不必再每次 prepare_to_wait醒来后都调用 finish_wait ,只需要最后调用一次就可以了,因为prepare_to_wait 的内部会做检查,发现该元素不在头链表上时,才会添加该元素到头链表。

在看看 wait_event_interruptible 的代码:

#define __wait_event_interruptible(wq, condition, ret)            \
do { \
DEFINE_WAIT(__wait); \
\
for (;;) { \
prepare_to_wait(&wq, &__wait, TASK_INTERRUPTIBLE); \
if (condition) \
break; \
if (!signal_pending(current)) { \
schedule(); \
continue; \
} \
ret = -ERESTARTSYS; \
break; \
} \
finish_wait(&wq, &__wait); \
} while (0)

原来这个函数对手动睡眠的过程进行了封装,所以调用的时候只用到工作队列(实际就是等待队列)头,它内部自己封装了一个等待元素。。

现在看来,linux 内核设计与实现中,对工作队列可以睡眠的说法是比较模糊的,工作队列上的回调函数是不能睡眠的。工作队列本身就是一种等待队列,队列是可以睡眠的,但是工作队列的上任务回调函数,看来是不能睡眠的。 今天先睡了,后面还要进一步分析看看。

今天在网上查了下相关的东西,有个家伙写得不错:“使用内核提供的共享列队,列队是保持顺序执行的,做完一个工作才做下一个,如果一个工作内有耗时大的处理如阻塞等待信号或锁,那么后面的工作都不会执行。如果你不喜欢排队或不好意思让别人等太久,那么可以创建自己的工作者线程,所有工作可以加入自己创建的工作列队,列队中的工作运行在创建的工作者线程中。”

问题可能就是出在上面了,如果我使用了内核提供的共享队列,可想而知,如果我进入了睡眠或者阻塞,内核中肯定有其他的工作也在这个共享队列上运行,此时便会阻塞内核的某些工作,当然系统就看起来卡死一样了。这样说,如果我创建自己的工作队列,然后在自己的工作队列上挂起,那样就不会出现卡死现象了。做了下试验,果然是这样。

看来,纸上得来总觉浅,深知此事要恭行。linux 内核设计与实现这本书是比较简洁的,作者只告诉我们,利用工作队列甚至可以睡眠,但是他没有强调:“最好不要在系统提供的共享队列上进行睡眠,如果自己的工作是非阻塞的,可以就近利用默认的共享队列。但是如果自己的工作需要睡眠或者阻塞,此时万万不可使用系统提供的默认共享队列,否则会导致内核中一部分关键工作得不到执行,而陷入系统卡死的状态。

这是一个坑,如果不小心处理,会导致系统挂起。
转自:linux 工作队列上睡眠的认识--不要在默认共享队列上睡眠_枪与玫瑰的专栏-CSDN博客

【转载】linux 工作队列上睡眠的认识--不要在默认共享队列上睡眠的更多相关文章

  1. linux工作队列 - workqueue总览【转】

    转自:https://blog.csdn.net/cc289123557/article/details/52551176 版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载 ...

  2. [转载]Linux进程调度原理

    [转载]Linux进程调度原理 Linux进程调度原理 Linux进程调度的目标 1.高效性:高效意味着在相同的时间下要完成更多的任务.调度程序会被频繁的执行,所以调度程序要尽可能的高效: 2.加强交 ...

  3. 20135327郭皓--Linux内核分析第四周 扒开系统调用的三层皮(上)

    Linux内核分析第四周 扒开系统调用的三层皮(上) 郭皓 原创作品转载请注明出处 <Linux内核分析>MOOC课程 http://mooc.study.163.com/course/U ...

  4. [转载]Linux下非root用户如何安装软件

    [转载]Linux下非root用户如何安装软件 来源:https://tlanyan.me/work-with-linux-without-root-permission/ 这是本人遇到的实际问题,之 ...

  5. [转载]Linux 命令详解:./configure、make、make install 命令

    [转载]Linux 命令详解:./configure.make.make install 命令 来源:https://www.cnblogs.com/tinywan/p/7230039.html 这些 ...

  6. [转载]Linux缓存机制

    [转载]Linux缓存机制 来源:https://blog.csdn.net/weixin_38278334/article/details/96478405 linux下的缓存机制及清理buffer ...

  7. [转载]Linux 线程实现机制分析

    本文转自http://www.ibm.com/developerworks/cn/linux/kernel/l-thread/ 支持原创.尊重原创,分享知识! 自从多线程编程的概念出现在 Linux ...

  8. <转载>linux下内存泄露查找、BUG调试

    先收藏着,抽空好好看看:http://www.ibm.com/developerworks/cn/linux/l-pow-debug/ 简介 调试程序有很多方法,例如向屏幕上打印消息,使用调试器,或者 ...

  9. VM下的linux系统上不了网?? 使用putty远程登录不上linux的解决方法?

    背景:昨晚想尝试一下用putty远程登录我的linux系统,悲剧的是,我竟然连接不上,显示 connection refused   ,连接被拒绝.于是我就想看看能不能在linux下看看能不能访问百度 ...

随机推荐

  1. 1549页Android最新面试题含答案

    在今年年初的疫情中,成了失业人员之一,于是各种准备面试,发现面试题网上很多,但是都是很凌乱的,而且一个地方一点,没有一个系统的面试题库,有题库有的没有答案或者是答案很简洁,没有达到面试的要求.所以一直 ...

  2. 《Python Cookbook v3.0.0》Chapter2 字符串、文本

    感谢: https://github.com/yidao620c/python3-cookbook 如有侵权,请联系我整改. 本文章节会严格按照原书(以便和原书对照,章节标题可能会略有修改),内容会有 ...

  3. repeatedly function in Clojure

    user=> (doc repeatedly) clojure.core/repeatedly ([f] [n f]) Takes a function of no args, presumab ...

  4. 【原创】利用动态二进制加密实现新型一句话木马之PHP篇

    概述 本系列文章重写了java..net.php三个版本的一句话木马,可以解析并执行客户端传递过来的加密二进制流,并实现了相应的客户端工具.从而一劳永逸的绕过WAF或者其他网络防火墙的检测. 本来是想 ...

  5. PHP变量覆盖漏洞整理

    昨天群里HW的大佬们都在传某某服终端检测响应平台edr存在大量RCE的洞 官网上关于EDR的介绍是这么写的 终端检测响应平台EDR,围绕终端资产安全生命周期,通过预防.防御.检测.响应赋予终端更为细致 ...

  6. 使用Squid部署代理缓存服务(标准正向、透明正反向代理)

    正向代理让用户可以通过Squid服务程序获取网站页面等数据,具体工作形式又分为标准代理模式与透明代理模式.标准正向代理模式: 将网站的数据缓存在服务器本地,提高数据资源被再次访问时的效率,但用户必需在 ...

  7. Java - Enum 枚举类型

    目录 前言 应用 定义 基本Enum特性 Enum的静态导入 Enum中添加新方法 Switch语句中的Enum Enum的继承 EnumSet的使用 EnumMap的使用 常量相关方法 枚举值向枚举 ...

  8. flutter升级2.0

    前言 flutter2.0版本带来了很多变化,特别是加入了空安全,升级后的大片报错,让大家望而却步. 现在距2.0发布已经快半年了,大部分插件也支持了空安全,而我们的项目却因为版本低,用不上新东西,所 ...

  9. MyBatiesPlus+Redis分布式缓存

    一.开启二级缓存 cache-enabled: true # mybatis-plus相关配置 mybatis-plus: # xml扫描,多个目录用逗号或者分号分隔(告诉 Mapper 所对应的 X ...

  10. 常用css样式(文字超出部分用省略号显示、鼠标经过图片放大、出现阴影)

    文字超出部分用省略号显示: white-space: nowrap; /* 不换行 */ overflow: hidden; /* 超出部分不显示 */ text-overflow: ellipsis ...