简介

在共享内存的多处理器结构中,可以用线程来实现并行。对于UNIX系统, IEEE POSIX 1003.1c标准规定了C语言线程编程接口的标准。这份标准的实现就是POSIX threads, 或者称为Pthreads.

本文开始先介绍线程的基本概念,动机和设计方面的一些考虑。 接下来是Pthreads API 的三个主要部分:线程管理,互斥锁和 条件变量。本文自始至终会贯穿大量的示例代码来展示如何使用Pthread API的每一部分。

Pthreads 概述

线程是什么?

  • 从技术角度讲,一个线程是一个独立的指令流可以被操作系统调用运行。But what does this mean?
  • 从程序员的角度讲,独立于主程序而单独运行的“程序”可以被称为一个线程。
  • 更进一步的讲, 想象一个包含很多子程序的主程序 (a.out) . 然后想象所有这些子程序都能操作系统调用同时并且独立的运行。这就是一个多线程的程序。
  • 这是怎么完成的呢?
  • 在理解线程之前, 先要理解UNIX系统下的进程。 一个进程是由操作系统创建的, 并且要求大量的"开销"。进程包含关于程序资源的信息和程序的执行状态,包括:
    • 进程ID,进程组ID, 用户ID,和组ID
    • 环境
    • 工作目录
    • 程序指令
    • 寄存器
    • 文件描述符
    • 信号操作
    • 共享库
    • 进程通信工具 (例如消息队列,管道,信号量,或者共享内存 ).

UNIX进程                                                                                              线程

  • 线程使用并存在在这些进程资源中,线程可以被操作系统调用并独立运行, 很大程度上是因为它只复制了很少量的作为可执行代码存在的必须重要资源。

  • 一个线程完成独立的控制流是因为它维护自己拥有的:

    • 栈指针
    • 寄存器
    • 调度优先级
    • 待定和阻塞信号集合
    • 线程特有的数据
  • 因此,简而言之,在UNIX系统环境中一个线程:

    • 存在在一个进程中并使用进程资源
    • 只要父进程存在并且操作系统支持就一直拥有自己独立的控制流
    • 仅复制独立调度所必须关键资源
    • 可以和其他线程共享进程资源
    • 如果线程的父进程死掉,则该线程死掉
    • 是“轻量级”的因为大多是开销在它的进程创建的时候已经完成了
  • 同一进程的线程间共享资源,导致:

    • 一个线程对于共享的系统资源所做的更改(例如关闭一个文件)将会被所有其他的线程发现
    • 两个具有相同值的指针指向相同的数据
    • 可能读写相同的内层位置,因此要求程序员进行显式的同步

为什么使用线程

  • 在高性能计算的世界,使用线程的首要目的是实现潜在的程序性能的提升
  • 与创建和管理进程的花费相比,创建一个线程只需要较少的系统开销。管理线程所需要的系统资源原少于管理进程

    举例来说,下表是fork() 与 pthread_create()所花时间的对比。

Platform fork() pthread_create()
real user sys real user sys
Intel 2.6 GHz Xeon E5-2670 (16 cores/node) 8.1 0.1 2.9 0.9 0.2 0.3
Intel 2.8 GHz Xeon 5660 (12 cores/node) 4.4 0.4 4.3 0.7 0.2 0.5
AMD 2.3 GHz Opteron (16 cores/node) 12.5 1.0 12.5 1.2 0.2 1.3
AMD 2.4 GHz Opteron (8 cores/node) 17.6 2.2 15.7 1.4 0.3 1.3
IBM 4.0 GHz POWER6 (8 cpus/node) 9.5 0.6 8.8 1.6 0.1 0.4
IBM 1.9 GHz POWER5 p5-575 (8 cpus/node) 64.2 30.7 27.6 1.7 0.6 1.1
IBM 1.5 GHz POWER4 (8 cpus/node) 104.5 48.6 47.2 2.1 1.0 1.5
INTEL 2.4 GHz Xeon (2 cpus/node) 54.9 1.5 20.8 1.6 0.7 0.9
INTEL 1.4 GHz Itanium2 (4 cpus/node) 54.5 1.1 22.2 2.0 1.2 0.6

  • 一个进程中的所有线程共享相同的地址空间。在很多情况下线程间通信比进程间通信更高效和容易。

  • 线程应用与非线程应用相比,提供的潜在的性能提升和实际的优势主要通过以下几种方法:

    • 通过I/O重叠CPU工作:
    • 优先/实时调用:更重要的任务可以优先调用或者中断低优先级的任务
    • 异步事件处理:服务不确定频率和交叉存取的事件的任务。举例来说,一个web服务端程序可以在和一个请求传送数据的同时管理新到的请求

设计线程程序

并行编程

  • 设计并行程序需要考虑很多方面:

    • 使用什么类型的并行编程模型
    • 问题分解
    • 负载平衡
    • 通信
    • 数据依赖关系
    • 同步和竞争条件
    • 内存问题
    • I/O问题
    • ...
  • 本文将不对上述问题进行深入的探讨,不过,感兴趣的可以戳这里:Introduction to Parallel Computing
  • 一般来讲,一个程序想要发挥Pthread的优势,必须是可以分离成独立的可以同时运行的子任务 如图所示:
  • 适合使用Pthread的程序一般由如下性质:
    • 工作可以被多任务同时执行或者数据可以被同时操作
    • 潜在的长时间I/O等待阻塞
    • 必须响应异步事件
    • 一些工作比其他的工作更重要(优先级中断)
  • 一些常见的基于线程的程序模型:
    • Manager/worker:manager线程分配任务给其他workers线程。
    • Pipeline:一个任务被分成一系列的子任务,每个子任务都被一个不同的线程有序并发的处理。类似汽车装配线
    • Peer:有点类似Manager/worker,但是,在主线程建立其他线程之后,就各自工作

共享内存模型:

  • 所有线程都可以访问相同的全局,共享内存
  • 线程可以由自己的私有数据
  • 程序员应该负责同步全局共享的数据的访问

线程安全

  • 线程安全:
  • 举例,假设你的程序创建一些线程,每个线程都调用相同的子程序:
    • 这个子程序访问或者更改一个全局结构或者一个全局变量
    • 由于每个线程都调用这个子程序,所以它们可能同时尝试修改这个全局结构或者全局变量
    • 如果这个子程序没有使用某种同步方法来防止数据崩溃的话,这个程序就不是线程安全的

POSIX 线程编程(一)简介的更多相关文章

  1. 在 POSIX 线程编程中避免内存泄漏

    检测和避免 POSIX 线程内存泄漏的技巧 POSIX 线程(pthread)编程定义了一套标准的 C 编程语言类型.函数和常量 — 且 pthreads 提供了一种强大的线程管理工具.要充分使用 p ...

  2. Posix线程编程指南

    Posix线程编程指南 Posix线程编程指南... 1 一线程创建与取消... 2 线程创建... 2 1.线程与进程... 2 2. 创建线程... 2 3. 线程创建属性... 2 4. 创建的 ...

  3. Posix线程编程指南(2)

    这是一个关于Posix线程编程的专栏.作者在阐明概念的基础上,将向您详细讲述Posix线程库API.本文是第2篇将向您讲述线程的创建与取消. 一.概念及作用在单线程程序中,我们经常要用到"全 ...

  4. Posix线程编程指南(3)

    这是一个关于Posix线程编程的专栏.作者在阐明概念的基础上,将向您详细讲述Posix线程库API.本文是第三篇将向您讲述线程同步. 一.互斥锁尽管在Posix Thread中同样可以使用IPC的信号 ...

  5. Posix线程编程指南(1)

    这是一个关于Posix线程编程的专栏.作者在阐明概念的基础上,将向您详细讲述Posix线程库API.本文是第一篇将向您讲述线程的创建与取消.   一.线程创建 1.1 线程与进程相对进程而言,线程是一 ...

  6. Posix线程编程指南(5)

    Posix线程编程指南(5) 杨沙洲 原文地址:http://www.ibm.com/developerworks/cn/linux/thread/posix_threadapi/part5/ 杂项 ...

  7. Posix线程编程指南(4)

    Posix线程编程指南(4) 杨沙洲 原文地址:http://www.ibm.com/developerworks/cn/linux/thread/posix_threadapi/part4/ 线程终 ...

  8. Posix线程编程指南(4) 线程终止

    线程终止方式 一般来说,Posix的线程终止有两种情况:正常终止和非正常终止.线程主动调用pthread_exit()或者从线程函数中return都将使线程正常退出,这是可预见的退出方式:非正常终止是 ...

  9. Posix线程编程指南(5) 杂项

    在Posix线程规范中还有几个辅助函数难以归类,暂且称其为杂项函数,主要包括pthread_self().pthread_equal()和pthread_once()三个,另外还有一个LinuxThr ...

随机推荐

  1. C# try-catch-return

    正常执行try后才能执行finally,catch中的语句可能会影响finally的执行 使用 finally 块,可以清理在 Try 中分配的任何资源,而且,即使在 try 块中发生异常,您也可以运 ...

  2. Android ViewGroup拦截触摸事件具体解释

    前言 在自己定义ViewGroup中.有时候须要实现触摸事件拦截.比方ListView下拉刷新就是典型的触摸事件拦截的样例. 触摸事件拦截就是在触摸事件被parent view拦截,而不会分发给其ch ...

  3. ISAM Indexed Sequential Access Method 索引顺序存取方法

    ISAM Indexed Sequential Access Method 索引顺序存取方法 学习了:https://baike.baidu.com/item/ISAM/3013855 是IBM发展起 ...

  4. bram和dram差别

    选择distributed memory generator和block memorygenerator标准: Dram和bram差别: 1.bram 的输出须要时钟,dram在给出地址后既可输出数据 ...

  5. SVN文件恢复

    SVN删除文件 一.本地删除 SVN删除文件里的本地删除,指的是在clientdelete了一个文件,但还没有commit.使用revert来撤销删除. 二.server删除 1.通过本地删除后提交s ...

  6. Wing IDE配置空格取代tab缩进+护眼背景色

    打开Wing IDE后,进入"编辑"列的"偏好设置"页面,如图1所看到的: 图1 设置用4个spaces取代tab, 如图2所看到的 图2 设置保护眼睛的绿色, ...

  7. Linux系统编程——进程替换:exec 函数族

    在 Windows 平台下,我们能够通过双击运行可运行程序,让这个可运行程序成为一个进程.而在 Linux 平台.我们能够通过 ./ 运行,让一个可运行程序成为一个进程. 可是.假设我们本来就执行着一 ...

  8. 初识MVC之建项

    MVC全名是Model View Controller,是模型(model)-视图(view)-控制器(controller)的缩写,用一种业务逻辑.数据.界面显示分离的方法组织代码,将业务逻辑聚集到 ...

  9. cocos2dx --- 在游戏中显示HTML页面

    前文介绍了简单的富文本组件RichText,如今我们来了解下由freeType库做出来的第三方组件.可以直接显示html页面,而且可以实现超链接.和触摸事情. 步骤: 1.在github中  下载  ...

  10. PBKDF2加密的实现

    PBKDF2(Password-Based Key Derivation Function). 通过哈希算法进行加密.由于哈希算法是单向的,能够将不论什么大小的数据转化为定长的"指纹&quo ...