linux可重入、异步信号安全和线程安全
一 可重入函数
当一个被捕获的信号被一个进程处理时,进程执行的普通的指令序列会被一个信号处理器暂时地中断。它首先执行该信号处理程序中的指令。如果从信号处理程序返回(例如没有调用exit或longjmp),则继续执行在捕获到信号时进程正在执行的正常指令序列(这和当一个硬件中断发生是所发生的事情相似。)但是在信号处理器里,我们并不知道当信号被捕获时进程正在执行哪里的代码。
如果进程正使用malloc在它的堆上分配额外的内存,而此时由于捕捉到信号而插入执行该信号处理程序,其中又调用了malloc,这会发生什么呢?或者,如果进程正调用一个把结果存储在一个静态区域里的函数到一半,比如 getpwnam,而我们在信号处理器里调用相同的函数,又会发生什么呢?在malloc的例子里,进程可能会遭到严重破坏,因为malloc通常维护它 所有分配过的区域的链表,而插入执行信号处理程序时,进程可能正在更改此链接表。在getpwnam的例子里,返回给普通调用者的信息可能被返回给信号处理器的信息覆盖。
SUS规定了必须保证是可以再入的函数。下表列出了这些再入函数:
accept | fchmod | lseek | sendto | stat |
access | fchown | lstat | setgid | symlink |
aio_error | fcntl | mkdir | setpgid | sysconf |
aio_return | fdatasync | mkfifo | setsid | tcdrain |
aio_suspend | fork | open | setsockopt | tcflow |
alarm | fpathconf | pathconf | setuid | tcflush |
bind | fstat | pause | shutdown | tcgetattr |
cfgetispeed | fsync | pipe | sigaction | tcgetpgrp |
cfgetospeed | ftruncate | poll | sigaddset | tcsendbreak |
cfsetispeed | getegid | posix_trace_event | sigdelset | tcsetattr |
cfsetospeed | geteuid | pselect | sigemptyset | tcsetpgrp |
chdir | getgid | raise | sigfillset | time |
chmod | getgroups | read | sigismenber | timer_getoverrun |
chown | getpeername | readlink | signal | timer_gettime |
clock_gettime | getpgrp | recv | sigpause | timer_settime |
close | getpid | recvfrom | sigpending | times |
connect | getppid | recvmsg | sigprocmask | umask |
creat | getsockname | rename | sigqueue | uname |
dup | getsockopt | rmdir | sigset | unlink |
dup2 | getuid | select | sigsuspend | utime |
execle | kill | sem_post | sleep | wait |
execve | link | send | socket | waitpid |
_Exit & _exit | listen | sendmsg | socketpair | write |
二 线程安全
线程安全:一个函数被称为线程安全的,当且仅当被多个并发线程反复的调用时,它会一直产生正确的结果。
有一类重要的线程安全函数,叫做可重入函数,其特点在于它们具有一种属性:当它们被多个线程调用时,不会引用任何共享的数据。
尽管线程安全和可重入有时会( 不正确的 )被用做同义词,但是它们之间还是有清晰的技术差别的。可重入函数是线程安全函数的一个真子集。
三 可重入与线程安全的区别及联系
可重入函数:
重入即表示重复进入,首先它意味着这个函数可以被中断,其次意味着它除了使用自己栈上的变量以外不依赖于任何环境(包括static ),这样的函数就是purecode (纯代码)可重入,可以允许有该函数的多个副本在运行,由于它们使用的是分离的栈,所以不会互相干扰。
可重入函数是线程安全函数,但是反过来,线程安全函数未必是可重入函数。
实际上,可重入函数很少,APUE 10.6 节中描述了Single UNIX Specification 说明的可重入的函数,只有115 个;APUE 12.5 节中描述了POSIX.1 中不能保证线程安全的函数,只有89 个。
不可重入的几种情况:
使用静态数据结构,比如getpwnam,getpwuid:如果信号发生时正在执行getpwnam,信号处理程序中执行getpwnam可能覆盖原来getpwnam获取的旧值
- 调用malloc或free:如果信号发生时正在malloc(修改堆上存储空间的链接表),信号处理程序又调用malloc,会破坏内核的数据结构
- 使用标准IO函数,因为好多标准IO的实现都使用全局数据结构,比如printf(文件偏移是全局的)
- 函数中调用longjmp或siglongjmp:信号发生时程序正在修改一个数据结构,处理程序返回到另外一处,导致数据被部分更新。
即 使对于可重入函数,在信号处理函数中使用也需要注意一个问题就是errno 。一个线程中只有一个errno 变量,信号处理函数中使用的可重入函数也有可能 会修改errno 。例如,read 函数是可重入的,但是它也有可能会修改errno 。因此,正确的做法是在信号处理函数开始,先保存errno ;在信号处 理函数退出的时候,再恢复errno 。
例如,程序正在调用printf 输出,但是在调用printf 时,出现了信号,对应的信号处理函数也有printf 语句,就会导致两个printf 的输出混杂在一起。
如果是给printf 加锁的话,同样是上面的情况就会导致死锁。对于这种情况,采用的方法一般是在特定的区域屏蔽一定的信号。
屏蔽信号的方法:
1> signal(SIGPIPE, SIG_IGN); // 忽略一些信号
2> sigprocmask()
sigprocmask 只为单线程定义的
3> pthread_sigmask()
pthread_sigmasks 可以在多线程中使用
现在看来信号异步安全和可重入的限制似乎是一样的,所以这里把它们等同看待;
线程安全:
线程安全:如果一个函数在同一时刻可以被多个线程安全的调用,就称该函数是线程安全的。 Malloc 函数是线程安全的。
不需要共享时,请为每个线程提供一个专用的数据副本。如果共享非常重要,则提供显式同步,以确保程序以确定的方式操作。通过将过程包含在语句中来锁定和解除锁定互斥,可以使不安全过程变成线程安全过程,而且可以进行串行化。
很多函数并不是线程安全的,因为他们返回的数据是存放在静态的内存缓冲区中的。通过修改接口,由调用者自行提供缓冲区就可以使这些函数变为线程安全的。
操作系统实现支持线程安全函数的时候,会对POSIX.1 中的一些非线程安全的函数提供一些可替换的线程安全版本。
例如,gethostbyname() 是线程不安全的,在Linux 中提供了gethostbyname_r() 的线程安全实现。
函数名字后面加上"_r" ,以表明这个版本是可重入的(对于线程可重入,也就是说是线程安全的,但并不是说对于信号处理函数也是可重入的,或者是异步信号安全的)。
多线程程序中常见的疏忽性问题
1> 将指针作为新线程的参数传递给调用方栈。
2> 在没有同步机制保护的情况下访问全局内存的共享可更改状态。
3> 两个线程尝试轮流获取对同一对全局资源的权限时导致死锁。其中一个线程控制第一种资源,另一个线程控制第二种资源。其中一个线程放弃之前,任何一个线程都无法继续操作。
4> 尝试重新获取已持有的锁(递归死锁)。
5> 在同步保护中创建隐藏的间隔。如果受保护的代码段包含的函数释放了同步机制,而又在返回调用方之前重新获取了该同步机制,则将在保护中出现此间隔。结果具有误导性。对于调用方,表面上看全局数据已受到保护,而实际上未受到保护。
6> 将UNIX 信号与线程混合时,使用sigwait(2) 模型来处理异步信号。
7> 调用setjmp(3C) 和longjmp(3C) ,然后长时间跳跃,而不释放互斥锁。
8> 从对*_cond_wait() 或*_cond_timedwait() 的调用中返回后无法重新评估条件。
四 总结
判断一个函数是不是可重入函数,在于判断其能否可以被打断,打断后恢复运行能够得到正确的结果。(打断执行的指令序列并不改变函数的数据)
判断一个函数是不是线程安全的,在于判断其能否在多个线程同时执行其指令序列的时候,保证每个线程都能够得到正确的结果。
如果一个函数对多个线程来说是可重入的,则说这个函数是线程安全的,但这并不能说明对信号处理程序来说该函数也是可重入的。
如果函数对异步信号处理程序的重入是安全的,那 么就可以说函数是" 异步- 信号安全 " 的。
可重入与线程安全是两个独立的概念, 都与函数处理资源的方式有关。
首先,可重入和线程安全是两个并不等同的概念,一个函数可以是可重入的,也可以是线程安全的,可以两者均满足,可以两者皆不满足( 该描述严格的说存在漏洞,参见第二条) 。
其次,从集合和逻辑的角度看,可重入是线程安全的子集,可重入是线程安全的充分非必要条件。可重入的函数一定是线程安全的,然过来则不成立。
第三,POSIX 中对可重入和线程安全这两个概念的定义:
Reentrant Function :A function whose effect, when called by two or more threads,is guaranteed to be as if the threads each executed thefunction one after another in an undefined order, even ifthe actual execution is interleaved.
Thread-Safe Function :A function that may be safely invoked concurrently by multiple threads.
Async-Signal-Safe Function : A function that may be invoked, without restriction fromsignal-catching functions. No function is async-signal -safe unless explicitly described as such
以上三者的关系为:可重入函数 必然 是 线程安全函数 和 异步信号安全函数;线程安全函数不一定是可重入函数。
可重入与线程安全的区别体现在能否在signal 处理函数中被调用的问题上, 可重入函数在signal 处理函数中可以被安全调用,因此同时也是Async-Signal-Safe Function ;而线程安全函数不保证可以在signal 处理函数中被安全调用,如果通过设置信号阻塞集合等方法保证一个非可重入函数不被信号中断,那么它也是Async-Signal-Safe Function 。
值得一提的是POSIX 1003.1 的System Interface 缺省是Thread-Safe 的,但不是Async-Signal-Safe 的。Async-Signal-Safe 的需要明确表示,比如fork () 和signal() 。
一个非可重入函数通常( 尽管不是所有情况下) 由它的外部接口和使用方法即可进行判断。例如:strtok() 是非可重入的,因为它在内部存储了被标记分割的字符串;ctime() 函数也是非可重入的,它返回一个指向静态数据的指针,而该静态数据在每次调用中都被覆盖重写。
一个线程安全的函数通过加锁的方式来实现多线程对共享数据的安全访问。线程安全这个概念,只与函数的内部实现有关,而不影响函数的外部接口。在 C 语言中,局部变量是在栈上分配的。因此,任何未使用静态数据或其他共享资源的函数都是线程安全的。
目前的 AIX 版本中,以下函数库是线程安全的:
* C 标准函数库
* 与BSD 兼容的函数库
使用全局变量( 的函数) 是非线程安全的。这样的信息应该以线程为单位进行存储,这样对数据的访问就可以串行化。一个线程可能会读取由另外一个线程生成的错误代码。在AIX 中,每个线程有独立的errno 变量。
最后让我们来构想一个线程安全但不可重入的函数:
假设函数func() 在执行过程中需要访问某个共享资源,因此为了实现线程安全,在使用该资源前加锁,在不需要资源解锁。
假设该函数在某次执行过程中,在已经获得资源锁之后,有异步信号发生,程序的执行流转交给对应的信号处理函数;再假设在该信号处理函数中也需要调用函数 func() ,那么func() 在这次执行中仍会在访问共享资源前试图获得资源锁,然而我们知道前一个func() 实例已然获得该锁,因此信号处理函数阻 塞—— 另一方面,信号处理函数结束前被信号中断的线程是无法恢复执行的,当然也没有释放资源的机会,这样就出现了线程和信号处理函数之间的死锁局面。
因此,func() 尽管通过加锁的方式能保证线程安全,但是由于函数体对共享资源的访问,因此是非可重入。
改写函数库
下面强调了将现存函数库改写为可重入和线程安全版本的主要步骤,只适用于C 语言的函数库。
*识别出由函数库导出的所有全局变量。这些全局变量通常是在头文件中由export 关键字定义的。
导出的全局变量应该被封装起来。每个变量应该被设为函数库所私有的( 通过static 关键字实现) ,然后创建全局变量的访问函数来执行对全局变量的访问。
* 识别出所有静态变量和其他共享资源。静态变量通常是由static 关键字定义的。
每个共享资源都应该与一个锁关联起来,锁的粒度( 也就是锁的数量) ,影响着函数库的性能。为了初始化所有锁,可能需要一个仅被调用一次的初始化函数。
* 识别所有非可重入函数,并将其转化为可重入。参见函数可重入化
* 识别所有非线程安全函数,并将其转化为线程安全。参见函数线程安全化。
使用非线程安全函数的解决方法
通过某种解决方法,非线程安全函数是可以被多个线程调用的。这在某些情况下或许是有用的,特别是当在多线程程序中使用一个非线程安全函数库的时候——或者是出于测试的目的,或者是由于没有相应的线程安全版本可用。这种解决方法会增加开销,因为它需要将对某个或一组函数的调用进行串行化。
使用作用于整个函数库的锁,在每次使用该函数库( 调用库中的某个函数或是访问库中的全局变量) 时加锁,如下面的伪代码所示:
/* this is pseudo-code! */
lock(library_lock);
library_call();
unlock(library_lock);
lock(library_lock);
x = library_var;
unlock(library_lock);
该解决方法有可能会造成性能瓶颈,因为在任意时刻,只有一个线程能任意的访问或是用该库。只有在该库很少被使用的情况下,或是作为一种快速的实现方式,该方法才是可接受的。
使用作用于单个库组件( 函数或是全局变量) 或是一组组件的锁,如下面的伪代码所示
/* this is pseudo-code! */
lock(library_moduleA_lock);
library_moduleA_call();
unlock(library_moduleA_lock);
lock(library_moduleB_lock);
x = library_moduleB_var;
unlock(library_moduleB_lock);
这种方法与前者相比要复杂一些,但是能提高性能
由于该类解决方式只应该在应用程序而不是函数库中使用,可以使用互斥锁(mutex) 来为整个库加锁。
linux可重入、异步信号安全和线程安全的更多相关文章
- [Linux]不可重入函数
一.概述 怎么会有可重入和不可重入. 在多任务系统下,中断可能在任务执行的任何时间发生:如果一个函数的执行期间被中断后,到重新恢复到断点进行执行的过程中,函数所依赖的环境没有发生改变,那么这个函数就是 ...
- Linux可重入函数和线程安全的区别与联系(转)
*****可重入函数 函数被不同的控制流程调用,有可能在第一次调用还没返回时就再次进入该函数,这称为重入. 当程序运行到某一个函数的时候,可能因为硬件中断或者异常而使得在用户正在执行的代码暂时终端转而 ...
- linux: 可重入函数与不可重入函数
1. 可重入函数与线程安全 摘自 多线程和多进程的区别(小结) http://blog.csdn.net/hairetz/article/details/4281931 要确保函数线程安全,主要需要考 ...
- Linux 可重入内核
Linux内核是可重入的,这意味着几个进程可能同时在内核模式下执行.(当然单处理器系统,在某一时间只会有一个进程执行,但许多会阻塞在内核模式)这些进程会分时共享CPU.I/O设备等系统资源,给用户的感 ...
- UNIX高级环境编程(13)信号 - 概念、signal函数、可重入函数
信号就是软中断. 信号提供了异步处理事件的一种方式.例如,用户在终端按下结束进程键,使一个进程提前终止. 1 信号的概念 每一个信号都有一个名字,它们的名字都以SIG打头.例如,每当进程调用了ab ...
- 【Linux】可重入函数和线程安全的区别与联系【转】
转自:http://blog.csdn.net/scenlyf/article/details/52074444 版权声明:本文为博主原创文章,未经博主允许不得转载. *****可重入函数 函数被不同 ...
- 可重入函数、线程安全、volatile
一. POSIX 中对可重入和线程安全这两个概念的定义: Reentrant Function:A function whose effect, when called by two or more ...
- java高并发系列 - 第12天JUC:ReentrantLock重入锁
java高并发系列 - 第12天JUC:ReentrantLock重入锁 本篇文章开始将juc中常用的一些类,估计会有十来篇. synchronized的局限性 synchronized是java内置 ...
- 可重入锁 公平锁 读写锁、CLH队列、CLH队列锁、自旋锁、排队自旋锁、MCS锁、CLH锁
1.可重入锁 如果锁具备可重入性,则称作为可重入锁. ========================================== (转)可重入和不可重入 2011-10-04 21:38 这 ...
随机推荐
- 关于java reflect
反射的基石 Class类 对比提问: Person类代表人,它的实例对象就是张三,李四这样一个个具体的人, Java程序中的各个Java类属于同一类事物,描述这类事物的Java类名就是Class.对比 ...
- 前端开发福音!阿里Weex跨平台移动开发工具开源-b
阿里巴巴今天在Qcon大会上宣布跨平台移动开发工具Weex开放内测邀请.Weex能够完美兼顾性能与动态性,让移动开发者通过简捷的前端语法写出Native级别的性能体验,并支持iOS.安卓.YunOS及 ...
- poj2752 bzoj3670
2752这是一道关于next函数的题(其实好像也可以用后缀数组暴力搞搞,但大概会超时)根据next[i]=max{j} (s[0..j]=s[i-j..i] j<i)不难发现这正是某个串既是前缀 ...
- BZOJ1610: [Usaco2008 Feb]Line连线游戏
1610: [Usaco2008 Feb]Line连线游戏 Time Limit: 5 Sec Memory Limit: 64 MBSubmit: 1301 Solved: 571[Submit ...
- OA请假流程 -- 编码
OA请假流程 -- 编码 凡是内容不会发生变化的,都要写在xml配置文件中.需要定义如下内容: <process>标签 id英文命名 和 name 中文命名,然后只要与该流程相关的资源均以 ...
- C#操作Active Directory(AD)详解
1. LDAP简介 LDAP(轻量级目录访问协议,Lightweight Directory Access Protocol)是实现提供被称为目录服务的信息服务.目录服务是一种特殊的数据库系统,其专门 ...
- sql server 2008 创建新数据库报错、创建表报错、更改表的设计报错
一:创建数据库报错如下: 二:解决,将软件以管理员身份运行 三:创建表报错如下图: 四:解决办法,在你创建的数据库下面的安全里,找到你创建的用户,属性,添加权限,红色标注,然后确定: 五:更改表的设计 ...
- Java同步
同步:★★★★★ 好处:解决了线程安全问题. 弊端:相对降低性能,因为判断锁需要消耗资源,产生了死锁. 定义同步是有前提的: 1,必须要有两个或者两个以上的线程,才需要同步. 2,多个线程必须保证使用 ...
- poj 3575 Crosses and Crosses(SG函数)
Crosses and Crosses Time Limit: 3000MS Memory Limit: 65536K Total Submissions: 3063 Accepted: 11 ...
- SQL Server阻止了对组件xp_cmdshell过程的解决方案
使用SQL tools连接sqlserver时候出现以下问题: SQL Server阻止了对组件xp_cmdshell过程的解决方案错误描述:SQL Server阻止了对组件‘xp_cmdshell’ ...