【linux】驱动-12-并发与竞态

前言
12. 并发&竞态

前言

内核驱动的并发&竟态很容易理解，其解决方法也不能，看看例程就可以了。

对于API，看看内核源码和内核文档即可。

原文链接：https://www.cnblogs.com/lizhuming/p/14907262.html

12. 并发&竞态

本章内容为驱动基石之一。

驱动只提供功能，不提供策略。

12.1 并发&竞态概念

并发：

指多个单元同时、并行执行。
但是并发执行的单元对共享资源的访问容易产生竞态。
单核的并发可以参考 MCU RTOS 多任务原理。看似并行，实质串行。不过也存在竞态。

并发产生原因（大概）：

多线程并发访问。
抢占式并发访问。（linux2.6及高版本的内核为抢占式内核）
中断程序并发访问。
多核（SMP）核间并发访问。

竞态：

指并发的执行单元对共享资源的访问。
竞态产生的条件：
- 存在共享资源。
- 对共享资源进行竞争访问。

12.2 竞态解决方法

需要解决竞态是因为要保护数据。

确保每个时刻都只有一个执行单元访问共享资源。

竞态解决方法有：

原子操作。
自旋锁操作。
信号量操作。
互斥体操作。

12.3 原子

参考文档：

Documentation\atomic_t.txt
Documentation\atomic_bitops.txt

12.3.1 原子介绍

都知道，在 C 的世界里，a = 10; 这样一个简单的赋值，到了汇编的世界就不止一条语句啦。若此时多线程往变量 a 的地址赋值，就可能会产生数据错误。

原子操作就是不可分割操作。

注意：原子操作只能对 整型变量 和 位操作 具有保护功能。

12.3.2 原子操作步骤

原子操作：

定义原子变量&设置初始值。
设置原子变量的值。
获取原子变量的值。
原子变量的加/减。
原子变量的自加/自减。
原子变量的加/减及返回值。
原子变量测试函数。

12.3.3 原子 API

由于函数容易理解，所以就不像以前的笔记一样详细列出。

整型原子的操作需要个 atomic_t 结构体。

bit原子的操作只需要一个地址即可，是直接对内存操作。

atomic_t 32bit 整型原子变量结构体：

//atomic_t类型结构体

typedef struct

{

   int counter;

}atomic_t;

atomic64_t 64bit 整型原子变量结构体：

//atomic64_t 类型结构体

typedef struct

{

   long long  counter;

}atomic64_t;

整型原子 API 汇总：

API	描述
ATOMIC_INIT(int i)	定义原子变量时候的初始值
void atomic_set(atomic_t *v, int i)	向 v 写入 i
void atomic_read(atomic_t *v)	读取 v 的值
void atomic_add(int i, atomic_t *v)	v 加 i
void atomic_sub(int i, atomic_t *v)	v 减 i
void atomic_inc(atomic_t *v)	v 加 1
void atomic_dec(atomic_t *v)	v 减 1
int atomic_add_return(int i, atomic_t *v)	v 加 i ，返回 v 的结果
int atomic_sub_return(int i, atomic_t *v)	v 减 i ，返回 v 的结果
int atomic_inc_return(int i, atomic_t *v)	v 加 1 ，返回 v 的结果
int atomic_dec_return(int i, atomic_t *v)	v 减 1 ，返回 v 的结果
int atomic_sub_and_test(int i, atomic_t *v)	v 减 i 后是否为 0
int atomic_inc_and_test(atomic_t *v)	v 加 1 后是否为 0
int atomic_dec_and_test(atomic_t *v)	v 减 1 后是否为 0
int atomic_add_negative(int i, atomic_t *v)	v 加 i 后是否为负数

更多 API（如atomic_dec_unless_positive()、atomic_inc_unless_negative()）请参考内核源码和推荐的文档。

bit原子的操作不需要 atomic_t 结构体，它是直接对内存操作的。

bit 原子 API 汇总：

API	描述
void set_bit(int nr, void *p)	对地址 p 的第 nr 位置 1
void clear_bit(int nr, void *p)	对地址 p 的第 nr 位置 0
void change_bit(int nr, void *p)	对地址 p 的第 nr 位翻转
int test_bit(int nr, void *p)	返回地址 p 的第 nr 位的值
void test_and_set_bit(int nr, void *p)	对地址 p 的第 nr 位置 1，并返回原来的 nr 位值
void test_and_clear_bit(int nr, void *p)	对地址 p 的第 nr 位置 0，并返回原来的 nr 位值
void test_and_change_bit(int nr, void *p)	对地址 p 的第 nr 位翻转，并返回原来的 nr 位值

12.4 自旋锁

12.4.1 自旋锁介绍

原子操作只能对整型变量或者bit进行保护。而自旋锁能对一个单元进行保护，是给代码段添加一把锁。

自旋锁是实现互斥访问的常用手段。

获取自旋锁后再运行代码才能被保护起来。

自旋锁特点：

当使用自旋锁获取锁失败时（即需要访问的代码段被锁住了），线程不休眠，做死循环检测锁状态，直至自旋锁被释放。
简单，不休眠，可在中断中使用。
使用不当会导致死锁。如：
- 递归获取锁：第一次获取锁成功，在自旋锁保护的代码段内进行获取锁，那便永远等不到解锁，导致死锁。

自旋锁缺点：

死循环检测，占用系统资源。
递归获取锁后会导致死锁。
同一线程不能连续两次获取自旋锁，必须一获取一释放。
自旋锁在锁定期间不能调用引起进程调度的函数，否则可能导致系统崩溃。

12.4.2 自旋锁操作步骤

自旋锁操作：

定义自旋锁。
初始化自旋锁。
获取自旋锁。
释放自旋锁。

自旋锁使用注意事项：

锁的持有时间要短。因为自旋锁是不会休眠的，以免其它线程获取锁等待太久，降低系统性能。
自旋锁保护的临界区内不能调用引起线程休眠的 API 函数，否则可能引起死锁。
不能递归获取自旋锁，否则会导致死锁。
按多核思想编程。提高系统可移植性。

12.4.3 自旋锁 API

spinlock_t 结构体：

typedef struct

{

   struct lock_impl internal_lock;

}spinlock_t;

自旋锁 API 汇总：

API	描述
DEFINE_SPINLOCK(spinlock_t lock)	定义、初始化一个自选变量
void spin_lock_init(spinlock_t *lock)	初始化一个自旋锁
void spin_lock(spinlock_t *lock)	加锁，即是获取一个自旋锁
int spin_trylock(spinlock_t *lock)	尝试获取自旋锁，不等待，成功返回 true，失败返回 false
void spin_unlock(spinlock_t *lock)	释放自旋锁
int spin_is_locked(spinlock_t *lock)	检查指定自旋锁是否已经被获取。若没有，则返回非0；否则返回 0
void spin_lock_irq(spinlock_t *lock)	获取自旋锁并关中断（防止中断打断）
void spin_unlock_irq(spinlock_t *lock)	释放自旋锁并开中断
spin_lock_irqsave(lock, flags)	获取自旋锁，并保存中断状态到flags。锁返回时，之前开的中断，之后也是开的；之前关，之后也是关
spin_unlock_irqrestore(lock, flags)	释放自旋锁，并恢复中断状态，即是把 flags 值赋值给中断状态寄存器。

12.4.4 读写自旋锁

普通的自旋锁是一刀切的，不管访问者对临界区的操作是读还是写。

但是实际上，很多共享资源都允许多个执行单元同时读，这是不影响数据的。

所以，读写自旋锁 允许 读并发，但是不允许 写并发，且不允许读写同时出现。

即有允许以下情景：

多读。
一写。

读写自旋锁结构体：

typedef struct

{

   arch_rwlock_t raw_lock;

}rwlock_t;

读写自旋锁 API：

定义&初始化：

API	描述
DEFINE_RWLOCK(rwlock_t lock)	定义、初始化一个自选变量
void rwlock_init(rwlock_t *lock)	初始化一个自旋锁

读锁 API：

API	描述
void read_lock(rwlock_t *lock)	加锁，即是获取一个读自旋锁
void read_unlock(rwlock_t *lock)	释放读自旋锁
void read_lock_irq(rwlock_t *lock)	禁止本地中断，且加锁，即是获取一个读自旋锁
void read_unlock_irq(rwlock_t *lock)	打开本地中断，释放读自旋锁
void read_lock_irqsave(rwlock_t *lock, unsigned long flags)	保存本地中断状态，禁止本地中断，且加锁，即是获取一个读自旋锁
void read_unlock_irqrestore(rwlock_t *lock, unsigned long flags)	回复本地中断状态，且激活本地中断，释放读自旋锁
void read_lock_bh(rwlock_t *lock)	关闭下半部，加锁，即是获取一个读自旋锁
void read_unlock_bh(rwlock_t *lock)	打开下半部，释放读自旋锁

写锁：
- 把前面读锁的前缀 read_ 改为 write_，即可。

12.4.5 顺序锁

顺序锁 是 读写锁 的一个优化。

读写锁 不允许读和写同时出现。有以下前景：

多读。
一写。

顺序锁 允许读和写同时出现，但是只能出现一个写。有以下前景：

多读。
一写。
多读一写。

顺序自旋锁结构体：

typedef struct

{

   struct seqcount seqcount;

   spinlock_t lock;

}seqlock_t;

顺序自旋锁 API：

定义&初始化：

API	描述
DEFINE_SEQLOCK(seqlock_t sl)	定义、初始化一个自选变量
void seqlock_init(seqlock_t *sl)	初始化一个自旋锁

读锁 API：
- 需要注意的是，写操作的顺序锁，会对顺序号加1-2。若 read_seqretry() 检测到顺序号不一致，则请重新读去数据。

API	描述
unsigned read_seqbegin(const seqlock_t *sl)	加锁，并返回获取到的顺序锁的顺序号
unsigned read_seqretry(const seqlock_t *sl)	读结束后调用该函数。用于检查在读的过程中是否有对资源进行写操作，若有，则返回1，建议重新读去数据。

写锁 API：

API	描述
void write_seqlock(seqlock_t *sl)	加锁，即是获取一个读自旋锁
void write_sequnlock(seqlock_t *sl)	释放读自旋锁
void write_seqlock_irq(seqlock_t *sl)	禁止本地中断，且加锁，即是获取一个读自旋锁
void write_sequnlock_irq(seqlock_t *sl)	打开本地中断，释放读自旋锁
void write_seqlock_irqsave(seqlock_t *sl, unsigned long flags)	保存本地中断状态，禁止本地中断，且加锁，即是获取一个读自旋锁
void write_sequnlock_irqrestore(seqlock_t *sl, unsigned long flags)	回复本地中断状态，且激活本地中断，释放读自旋锁
void write_seqlock_bh(seqlock_t *sl)	关闭下半部，加锁，即是获取一个读自旋锁
void write_sequnlock_bh(seqlock_t *sl)	打开下半部，释放读自旋锁

12.5 信号量

12.5.1 信号量概念

学过 RTOS 的都知道信号量了。可以看做一个全局计数器。

信号量常用于同步和互斥。

信号量的获取失败后，线程可引入休眠，当信号量可用时，系统会通知其退出休眠。

12.5.2 信号量操作

信号量操作：

定义信号量。
初始化信号量。
尝试获取信号量。
获取信号量。
释放信号量。

信号量使用注意事项：

适用于占用资源较长时间的情景。因为信号量可以引起休眠，占用系统资源少。若占用资源时间少的，建议使用 自旋锁 ，因为不用切换线程，系统开销小。
不能用于中断。同样是因为信号量可以引起休眠。不过可以使用 down_interruptible() 函数。
保护的临界区内可调用引起阻塞的 API。

12.5.3 信号量 API

semaphore 结构体：

struct semaphore

{

    raw_spinlock_t    lock;

    unsigned int      count;

    struct list_head  wait_list;

};

API	描述
DEFINE_SEMAPHORE(name)	定义一个信号量，并置为 1
void sema_init(struct semaphore *sem, int val)	初始化信号量，并置为 val
void down(struct semaphore *sem)	获取信号量。因为信号量会导致休眠，且不能被信号打断，因此不能在中断中使用该函数
int down_trylock(struct semaphore *sem)	尝试获取信号量，不休眠。成功返回 0，失败返回非0
void down_interruptible(struct semaphore *sem)	获取信号量。就算导致休眠后，也能被信号打断，因此该函数可以在中断中使用
void up(struct semaphore *sem)	释放信号量

12.6 互斥体

12.6.1 互斥体概念

互斥体 的占用其实和信号量量值为 1 的效果是一样的。

但是互斥体的执行效率更高，毕竟，专业的API做专业的事嘛。

12.6.2 互斥体操作

互斥体执行操作：

定义互斥体。
初始化互斥体。
尝试获取互斥体。
获取互斥体。
释放互斥体。

互斥体使用注意事项：

不能在中断中使用。因为 mutex 会导致休眠。除非使用函数 int mutex_lock_interruptible。
必须由 mutex 持有者释放。因为一次只有一条线程持有。
保护的临界区内可调用引起阻塞的 API。

12.6.3 互斥体 API

API	描述
DEFINE_MUTEX(name)	定义并初始化一个 mutex 变量
void mutex_init(mutex *lock)	初始化 mutex
void mutex_lock(struct mutex *lock)	加锁，获取 mutex
void mutex_unlock(struct mutex *lock)	释放 mutex
int mutex_trylock(struct mutex *lock)	尝试获取 mutex。成功返回 1，失败返回 0
int mutex_is_locked(struct mutex *lock)	判断 mutex 是否被上锁了。是返回 1，否返回 0
void mutex_lock_interruptible(struct mutex *lock)	加锁，获取 mutex。获取失败进入休眠后，依然能被信号打断。支持在中断中使用。

12.7 完成量

12.7.1 完成量概念

完成量（completion）。

完成量用于一个执行单元等待另一个执行单元。

12.7.2 完成量操作

完成量操作：

定义完成量。
初始化完成量。
等待完成量。
唤醒完成量。

12.7.3 完成量 API

完成量结构体：

struct completion {

	unsigned int done;

	wait_queue_head_t wait;

};

API	描述
void complete(struct completion *x)	唤醒一个等待完成量 x 的线程
void complete_all(struct completion *x)	唤醒所有等待完成量 x 的线程
void wait_for_completion(struct completion *x)	等待一个完成量 x
unsigned long wait_for_completion_timeout(struct completion *x, unsigned long timeout)	限时等待一个完成量 x
void init_completion(struct completion *c)	初始化一个完成量
void reinit_completion(struct completion *c)	重新初始化一个完成量