关于内核中spinlock的一些个人理解【转】

由于2.6内核可以抢占，应该在驱动程序中使用 preempt_disable() 和 preempt_enable()，从而保护代码段不被抢占（禁止 IRQ 同时也就隐式地禁止了抢占）。preempt_disable和preempt_enable 调用。spin_lock_irq的功能和上面的spin_lock提供的功能差不多，只不过它还多做了一步，就是把中断也关上，主要用于当前保护的数据在可能的中断程序中也要用到的情况。spin_lock_irqsave和spin_lock_irq的功能一样，只不过调用这个函数以后可以把当前的中断状态记下了，以备以后恢复。

在多CPU的环境下情况就比较复杂了，因为同时可能有几个程序在运行（是真正的同时），所以必须要定义一个变量当作锁的功能，linux是这样规定的，当这个变量为1时，那么其保护的变量可以被访问，当其值为0时，那么其保护的临界数据不可以被访问，其中，要改变变量锁的值也很有学问，就是不能让几个CPU同时去改，负责就会出现不同步的情况。如spin_lock在多cpu的时候就被?/

在这里，我主要把自己对内核中spinlock的一些理解写出来，并不是要告诉大家什么（因为我对我所说的也不能确定），而是希望大家对我的这些理解对的地方给我肯定，错误的地方给我指出。

和spinlock 相关的文件主要有两个，一个是include/linux/spinlock.h，主要是提供关于和硬件无关的spinlock的几个对外主函数，一个是 include/asm-XXX/spinlock.h，用来提供和硬件相关的功能函数。另外，在2.6的内核中，又多了一个文件， include/linux/preempt.h，为新增加的抢占式多任务功能提供一些服务。

spinlock的作用：spinlock系列函数主要用于保护临界数据（非常重要的数据）不被同时访问（给临界数据加锁），用以达到多任务的同步。如果一个数据当前不可访问，那么就一直等，直到可以访问为止。

spinlock 函数的使用前提：首先，spinklock函数只能使用在内核中，或者说只能使用在内核状态下，在2.6以前的内核是不可抢占的，也就是说，当运行于内核状态下时，是不容许切换到其他进程的。而在2.6以后的内核中，编译内核的时候多了一个选项，可以配置内核是否可以被抢占，这也就是为什么在2.6的内核中多了一个preempt.h的原因。

spinlock主要包含以下几个函数：
spin_lock
spin_unlock
spin_lock_irqsave
spin_lock_irq
spin_unlock_irqrestore
spin_unlock_irq
另外还有其他很多，如关于读者写者的一套函数，关于bottom half一套函数（关于bottom half的代码我还没有读到），还有还提供了一套用bit实现加锁的函数，由于大概意思都相同，所以我这里就不说了（只想简单说说，没想到东西还挺多，我的手都快冻僵了，江南的冬天真的受不了：）
spinlock函数根据机器的配置分为两套，单CPU和多CPU，先来看看单CPU的情况。
在单CPU的情况下，spin_lock和spin_unlock函数都被定义成空操作（do { } while(0)），这是因为我们上面说的，内核不可以被抢占的原因。所以，在单CPU的情况下，只要你能够保证你要保护的临界数据不会在中断中用到的话，那么你的数据已经是受保护的了，不需要做任何操作。在2.6内核中，这两个函数就不再这么简单了，因为内核也有可能被其他程序中断，所以要保护数据，还要让调度程序暂时不调度此段程序，也就是说，暂时禁止抢占式任务调度功能，所以在上面两个函数中分别多了一个

需要澄清的是，互斥手段的选择，不是根据临界区的大小，而是根据临界区的性质，以及
有哪些部分的代码，即哪些内核执行路径来争夺。

从严格意义上说，semaphore和spinlock_XXX属于不同层次的互斥手段，前者的
实现有赖于后者，这有点象HTTP和TCP的关系，都是协议，但层次是不同的。

先说semaphore，它是进程级的，用于多个进程之间对资源的互斥，虽然也是在
内核中，但是该内核执行路径是以进程的身份，代表进程来争夺资源的。如果
竞争不上，会有context switch，进程可以去sleep，但CPU不会停，会接着运行
其他的执行路径。从概念上说，这和单CPU或多CPU没有直接的关系，只是在
semaphore本身的实现上，为了保证semaphore结构存取的原子性，在多CPU中需要
spinlock来互斥。

在内核中，更多的是要保持内核各个执行路径之间的数据访问互斥，这是最基本的
互斥问题，即保持数据修改的原子性。semaphore的实现，也要依赖这个。在单CPU
中，主要是中断和bottom_half的问题，因此，开关中断就可以了。在多CPU中，
又加上了其他CPU的干扰，因此需要spinlock来帮助。这两个部分结合起来，
就形成了spinlock_XXX。它的特点是，一旦CPU进入了spinlock_XXX，它就不会
干别的，而是一直空转，直到锁定成功为止。因此，这就决定了被
spinlock_XXX锁住的临界区不能停，更不能context switch，要存取完数据后赶快
出来，以便其他的在空转的执行路径能够获得spinlock。这也是spinlock的原则
所在。如果当前执行路径一定要进行context switch，那就要在schedule()之前
释放spinlock，否则，容易死锁。因为在中断和bh中，没有context，无法进行
context switch，只能空转等待spinlock，你context switch走了，谁知道猴年
马月才能回来。

因为spinlock的原意和目的就是保证数据修改的原子性，因此也没有理由在spinlock
锁住的临界区中停留。

spinlock_XXX有很多形式，有

 spin_lock()/spin_unlock()，

  spin_lock_irq()/spin_unlock_irq()，

  spin_lock_irqsave/spin_unlock_irqrestore()

  spin_lock_bh()/spin_unlock_bh()

  local_irq_disable/local_irq_enable local_bh_disable/local_bh_enable

那么，在什么情况下具体用哪个呢？这要看是在什么内核执行路径中，以及要与哪些内核
执行路径相互斥。我们知道，内核中的执行路径主要有：

 1  用户进程的内核态，此时有进程context，主要是代表进程在执行系统调用

    等。

 2  中断或者异常或者自陷等，从概念上说，此时没有进程context，不能进行

    context switch。

 3  bottom_half，从概念上说，此时也没有进程context。

 4  同时，相同的执行路径还可能在其他的CPU上运行。

这样，考虑这四个方面的因素，通过判断我们要互斥的数据会被这四个因素中
的哪几个来存取，就可以决定具体使用哪种形式的spinlock。如果只要和其他CPU
互斥，就要用spin_lock/spin_unlock，如果要和irq及其他CPU互斥，就要用
spin_lock_irq/spin_unlock_irq，如果既要和irq及其他CPU互斥，又要保存
EFLAG的状态，就要用spin_lock_irqsave/spin_unlock_irqrestore，如果
要和bh及其他CPU互斥，就要用spin_lock_bh/spin_unlock_bh，如果不需要和
其他CPU互斥，只要和irq互斥，则用local_irq_disable/local_irq_enable，
如果不需要和其他CPU互斥，只要和bh互斥，则用local_bh_disable/local_bh_enable，
等等。值得指出的是，对同一个数据的互斥，在不同的内核执行路径中，
所用的形式有可能不同(见下面的例子)。

举一个例子。在中断部分中有一个irq_desc_t类型的结构数组变量irq_desc[]，
该数组每个成员对应一个irq的描述结构，里面有该irq的响应函数等。
在irq_desc_t结构中有一个spinlock，用来保证存取(修改)的互斥。

对于具体一个irq成员，irq_desc[irq]，对其存取的内核执行路径有两个，一是
在设置该irq的响应函数时(setup_irq)，这通常发生在module的初始化阶段，或
系统的初始化阶段；二是在中断响应函数中(do_IRQ)。代码如下：

 int setup_irq(unsigned int irq, struct irqaction * new)

{

        int shared = 0;

        unsigned long flags;

        struct irqaction *old, **p;

        irq_desc_t *desc = irq_desc + irq;

        /*

         * Some drivers like serial.c use request_irq() heavily,

         * so we have to be careful not to interfere with a

         * running system.

         */

        if (new->flags & SA_SAMPLE_RANDOM) {

                /*

                 * This function might sleep, we want to call it first,

                 * outside of the atomic block.

                 * Yes, this might clear the entropy pool if the wrong

                 * driver is attempted to be loaded, without actually

                 * installing a new handler, but is this really a problem,

                 * only the sysadmin is able to do this.

                 */

                rand_initialize_irq(irq);

        }

        /*

         * The following block of code has to be executed atomically

         */

[1]     spin_lock_irqsave(&desc->lock,flags);

        p = &desc->action;

        if ((old = *p) != NULL) {

                /* Can't share interrupts unless both agree to */

                if (!(old->flags & new->flags & SA_SHIRQ)) {

[2]                     spin_unlock_irqrestore(&desc->lock,flags);

                        return -EBUSY;

                }

                /* add new interrupt at end of irq queue */

                do {

                        p = &old->next;

                        old = *p;

                } while (old);

                shared = 1;

        }

        *p = new;

        if (!shared) {

                desc->depth = 0;

                desc->status &= ~(IRQ_DISABLED | IRQ_AUTODETECT | IRQ_WAITING);

                desc->handler->startup(irq);

        }

[3]     spin_unlock_irqrestore(&desc->lock,flags);

        register_irq_proc(irq);

        return 0;

}

asmlinkage unsigned int do_IRQ(struct pt_regs regs)

{        

        /* 

         * We ack quickly, we don't want the irq controller

         * thinking we're snobs just because some other CPU has

         * disabled global interrupts (we have already done the

         * INT_ACK cycles, it's too late to try to pretend to the

         * controller that we aren't taking the interrupt).

         *

         * 0 return value means that this irq is already being

         * handled by some other CPU. (or is disabled)

         */

        int irq = regs.orig_eax & 0xff; /* high bits used in ret_from_ code  */

        int cpu = smp_processor_id();

        irq_desc_t *desc = irq_desc + irq;

        struct irqaction * action;

        unsigned int status;

        kstat.irqs[cpu][irq]++;

[4]     spin_lock(&desc->lock);

        desc->handler->ack(irq);

        /*

           REPLAY is when Linux resends an IRQ that was dropped earlier

           WAITING is used by probe to mark irqs that are being tested

           */

        status = desc->status & ~(IRQ_REPLAY | IRQ_WAITING);

        status |= IRQ_PENDING; /* we _want_ to handle it */

        /*

         * If the IRQ is disabled for whatever reason, we cannot

         * use the action we have.

         */

        action = NULL;

        if (!(status & (IRQ_DISABLED | IRQ_INPROGRESS))) {

                action = desc->action;

                status &= ~IRQ_PENDING; /* we commit to handling */

                status |= IRQ_INPROGRESS; /* we are handling it */

        }

        desc->status = status;

        /*

         * If there is no IRQ handler or it was disabled, exit early.

           Since we set PENDING, if another processor is handling

           a different instance of this same irq, the other processor

           will take care of it.

         */

        if (!action)

                goto out;

        /*

         * Edge triggered interrupts need to remember

         * pending events.

         * This applies to any hw interrupts that allow a second

         * instance of the same irq to arrive while we are in do_IRQ

         * or in the handler. But the code here only handles the _second_

         * instance of the irq, not the third or fourth. So it is mostly

         * useful for irq hardware that does not mask cleanly in an

         * SMP environment.

         */

        for (;;) {

[5]             spin_unlock(&desc->lock);

                handle_IRQ_event(irq, ?s, action);

[6]             spin_lock(&desc->lock);

                if (!(desc->status & IRQ_PENDING))

                        break;

                desc->status &= ~IRQ_PENDING;

        }

        desc->status &= ~IRQ_INPROGRESS;

out:

        /*

         * The ->end() handler has to deal with interrupts which got

         * disabled while the handler was running.

         */

        desc->handler->end(irq);

[7]     spin_unlock(&desc->lock);

        if (softirq_pending(cpu))

                do_softirq();

        return 1;

}

在setup_irq()中，因为其他CPU可能同时在运行setup_irq()，或者在运行setup_irq()时，
本地irq中断来了，要执行do_IRQ()以修改desc->status。为了同时防止来自其他CPU和
本地irq中断的干扰，如[1][2][3]处所示，使用了spin_lock_irqsave/spin_unlock_irqrestore()

而在do_IRQ()中，因为do_IRQ()本身是在中断中，而且此时还没有开中断，本CPU中没有
什么可以中断其运行，其他CPU则有可能在运行setup_irq()，或者也在中断中，但这二者
对本地do_IRQ()的影响没有区别，都是来自其他CPU的干扰，因此只需要用spin_lock/spin_unlock，
如[4][5][6][7]处所示。值得注意的是[5]处，先释放该spinlock，再调用具体的响应函数。

再举个例子：

 static void tasklet_hi_action(struct softirq_action *a)

{

        int cpu = smp_processor_id();

        struct tasklet_struct *list;

[8]     local_irq_disable();

        list = tasklet_hi_vec[cpu].list;

        tasklet_hi_vec[cpu].list = NULL;

[9]     local_irq_enable();

        while (list) {

                struct tasklet_struct *t = list;

                list = list->next;

                if (tasklet_trylock(t)) {

                        if (!atomic_read(&t->count)) {

                                if (!test_and_clear_bit(TASKLET_STATE_SCHED, &t->state))

                                        BUG();

                                t->func(t->data);

                                tasklet_unlock(t);

                                continue;

                        }

                        tasklet_unlock(t);

                }

[10]            local_irq_disable();

                t->next = tasklet_hi_vec[cpu].list;

                tasklet_hi_vec[cpu].list = t;

                __cpu_raise_softirq(cpu, HI_SOFTIRQ);

[11]            local_irq_enable();

        }

}

这里，对tasklet_hi_vec[cpu]的修改，不存在CPU之间的竞争，因为每个CPU有各自独立的数据，
所以只要防止irq的干扰，用local_irq_disable/local_irq_enable即可，如[8][9][10][11]处
所示。

关于内核中spinlock的一些个人理解【转】的更多相关文章

经典]Linux内核中ioremap映射的透彻理解【转】
转自:http://blog.csdn.net/lanyang123456/article/details/7403514 几乎每一种外设都是通过读写设备上的寄存器来进行的,通常包括控制寄存器.状态寄 ...
Linux内核中ioremap映射的透彻理解
几乎每一种外设都是通过读写设备上的寄存器来进行的,通常包括控制寄存器.状态寄存器和数据寄存器三大类,外设的寄存器通常被连续地编址.根据CPU体系结构的不同,CPU对IO端口的编址方式有两种: (1)I ...
(笔记)Linux内核中ioremap映射的透彻理解
几乎每一种外设都是通过读写设备上的寄存器来进行的,通常包括控制寄存器.状态寄存器和数据寄存器三大类,外设的寄存器通常被连续地编址.根据CPU体系结构的不同,CPU对IO端口的编址方式有两种: (1)I ...
对linux内核中jiffies+Hz表示一秒钟的理解
jiffies在内核中是一个全局变量,它用来统计系统启动以来系统中产生的总节拍数,这个变量定义在include/linux/jiffies.h中,定义形式如下. unsigned long volat ...
(五)对linux内核中jiffies+Hz表示一秒钟的理解
jiffies在内核中是一个全局变量,它用来统计系统启动以来系统中产生的总节拍数,这个变量定义在include/Linux/jiffies.h中,定义形式如下. unsigned long volat ...
抢占式内核与非抢占式内核中的自旋锁（spinlock）的差别
一.概括 (1)自旋锁适用于SMP系统,UP系统用spinlock是作死. (2)保护模式下禁止内核抢占的方法:1.运行终端服务例程时2.运行软中断和tasklet时3.设置本地CPU计数器preem ...
[php-src]理解Php内核中的函数与INI
内容均以php-5.6.14为例. 一. 函数结构内核中定义一个php函数使用 PHP_FUNCTION 宏包装,扩展也不例外,该宏在 ./main/php.h:343 有着一系列类似以 PHP ...
Linux内核中锁机制之原子操作、自旋锁
很多人会问这样的问题,Linux内核中提供了各式各样的同步锁机制到底有何作用?追根到底其实是由于操作系统中存在多进程对共享资源的并发访问,从而引起了进程间的竞态.这其中包括了我们所熟知的SMP系统,多 ...
大话Linux内核中锁机制之原子操作、自旋锁
转至:http://blog.sina.com.cn/s/blog_6d7fa49b01014q7p.html 很多人会问这样的问题,Linux内核中提供了各式各样的同步锁机制到底有何作用?追根到底其 ...

随机推荐

Objective-C 语言特点/特性
Objective-C中 1.所有的类都必须继承自NSObject. 2.所有对象都是指针的形式. 3.用self代替this. 4.使用id代替void*. 5.使用nil表示NULL, 6.只支持 ...
thinkphp5报错
thinkPHP5配置nginx环境无法打开(require():open_basedirrestrictionineffect.File(/mnt/hgfs/ro (2018-07-19 22:05 ...
[转帖]shell 中的>/dev/null 2>&1 是什么鬼？
shell 中的>/dev/null 2>&1 是什么鬼? http://blog.jobbole.com/109355/ 背景我们经常能在shell脚本中发现>/dev/ ...
everything 提供http和ftp的功能
1. 早上起床看知乎,发现everything 有http和ftp的功能, 简单看了一下的确很强大.. 就是有点危险.. 功能位置. 2. 最下面有FTP和HTTP 可以进行启用这是http的建议 ...
Dos命令大全完整版
DOS(磁盘操作系统)命令,是DOS操作系统的命令,是一种面向磁盘的操作命令,主要包括目录操作类命令.磁盘操作类命令.文件操作类命令和其它命令. 使用技巧 DOS命令不区分大小写,比如C盘的Progr ...
Vue---导航守卫使用方法详解
导航守卫正如其名,vue-router 提供的导航守卫主要用来通过跳转或取消的方式守卫导航.有多种机会植入路由导航过程中:全局的, 单个路由独享的, 或者组件级的. 记住参数或查询的改变并不会触发进 ...
BOM之screen对象
前面的话 screen对象在javascript编程中,比较冷门,不太常用.screen对象用来表明客户端的能力,其中包括浏览器窗口外部的显示器的信息,如像素高度和宽度等.本文将详细介绍screen对 ...
【设计模式】——抽象工厂Abstract Factory
模式意图提供对象的使用接口,隐藏对象的创建过程. 模式结构 AbstractFactory 提供创建对象的接口. ConcreteFactory 提供真正创建对象的实现类,用于组合并创建不同的对象, ...
c# DataGridView绑定DataTable对象之后总会多一行
DataGridView 属性 AllowUserToAddRows = false
解题：NOI 2018 归程
题面清新友好的题目跑一个最短路,然后对海拔建Kruskal重构树,从最后接上去的边(最低的一个)开始DFS一下处理子树里路程的最小值. 询问是每次在重构树上倍增找到深度最浅的海拔高于当天水位线的节 ...

关于内核中spinlock的一些个人理解 【转】

关于内核中spinlock的一些个人理解 【转】的更多相关文章

随机推荐

热门专题

关于内核中spinlock的一些个人理解【转】

关于内核中spinlock的一些个人理解【转】的更多相关文章