OpenMP笔记(四)
个人博客地址:http://www.bearoom.xyz/2019/02/22/openmp4/
一、private
private子句用于将一个或多个变量声明成线程私有的变量,这样每个线程都有该变量的副本,不同线程的操作不会改变其他线程中的同名变量副本,且并行块的所有操作都不会影响外面的同名共享变量。 例子:
int k = 11;
printf("k=%d, &k=%d\n", k, &k);
omp_set_num_threads(10);
#pragma omp parallel for private(k)
for (k = 0; k < 10; k++)
{
printf("k=%d, &k=%d, threadID=%d\n", k, &k, omp_get_thread_num());
}
printf("k=%d, &k=%d\n", k, &k);
这个说明并行块中每个线程的变量k跟共享变量k的地址都是不一样的。但是,这里加不加private(k)结果都是一样的。但是在下面这种情况,加不加private(k)结果是不一样的。 不加的情况:
int k = 11;
printf("k=%d, &k=%d\n", k, &k);
omp_set_num_threads(10);
#pragma omp parallel for
for (int i = 0; i < 10; i++)
{
k = i;
printf("k=%d, &k=%d, threadID=%d\n", k+=i, &k, omp_get_thread_num());
}
printf("k=%d, &k=%d\n", k, &k);
加private(k)的情况:
要注意,加private(k)的时候以下的情况是会编译报错的:
int k = 11;
printf("k=%d, &k=%d\n", k, &k);
omp_set_num_threads(10);
#pragma omp parallel for private(k)
for (int i = 0; i < 10; i++)
{
printf("k=%d, &k=%d, threadID=%d\n", k+=i, &k, omp_get_thread_num());
}
printf("k=%d, &k=%d\n", k, &k);
二、firstprivate
private就是并行块内部的同名变量与外部的共享变量无关,而firstprivate就是该变量依然无关,但是会用外部共享变量来初始化并行块内部的变量。例子:
int k = 11;
printf("k=%d, &k=%d\n", k, &k);
omp_set_num_threads(10);
#pragma omp parallel for firstprivate(k)
for (int i = 0; i < 10; i++)
{
printf("k=%d, &k=%d, threadID=%d\n", k += i, &k, omp_get_thread_num());
}
printf("k=%d, &k=%d\n", k, &k);
k是用了外部的值做初始化,但是不改变外部的值,不加的话,结果如下:
与firstprivate(k)相对的有lastprivate(k),如果只有firstprivate则不会改变外部,加了lastprivate就可以改变外部变量,此时并不是将运行在最后的一个线程的结果复制给外部共享变量,而是将语法上的最后一个线程的值复制给外部变量。
三、shared,default
shared子句用来声明一个或多个变量是共享变量,这个共享变量在不同线程之间是共享的,所以要注意当对共享变量存在写操作的时候就需要加以保护。
default允许用户控制并行区域中变量的共享属性,用法如下:default(shared | none),使用shared时,缺省情况下,传入并行区域内的同名变量被当作共享变量来处理,不会产生线程私有副本,除非使用private等子句来指定某些变量为私有的才会产生副本;如果使用none作为参数,那么线程中用到的变量必须显示指定是共享的还是私有的,除了那些有明确定义的除外。
四、reduction
reduction子句主要用来对一个或多个参数条目指定一个操作符,每个线程将创建参数条目的一个私有拷贝,在区域的结束处,将用私有拷贝的值通过指定的运行符运算,原始的参数条目被运算结果的值更新。也就说,传进来的参数在线程结束后,会依次对所有线程的拷贝做reduction指定的运算符操作,将结果复制给该参数。
reduction的用法:reduction(operator:list),operator的符号如下:
例子 :
int k = 2;
printf("k=%d, &k=%d\n", k, &k);
omp_set_num_threads(10);
#pragma omp parallel for reduction(*:k)
for (int i = 0; i < 10; i++)
{
printf("k=%d, &k=%d, threadID=%d\n", k = 2, &k, omp_get_thread_num());
}
printf("k=%d, &k=%d\n", k, &k);
注意,如果在并行区域内不加锁保护就直接对共享变量进行写操作,存在数据竞争问题,会导致不可预测的异常结果。共享数据作为private、firstprivate、lastprivate、threadprivate、reduction子句的参数进入并行区域后,就变成线程私有了,不需要加锁保护了。
五、copyin
这里要介绍copyin,要先讲下指令threadprivate,threadprivate的作用是指定一个变量是线程局部存储(thread local storage),也就是不同并行区域的同个线程里,这个变量是全局的,这个指令的作用效果如下:
int A = 100;
#pragma omp threadprivate(A)
int main(int argc, char *argv[])
{
#pragma omp parallel for
for (int i = 0; i < 5; i++)
{
A++;
printf("Thread ID, i, A: %d, %d, %d\n", omp_get_thread_num(), i, A);
}
printf("Global A: %d\n", A);
#pragma omp parallel for
for (int i = 0; i < 5; i++)
{
A++;
printf("Thread ID, i, A: %d, %d, %d\n", omp_get_thread_num(), i, A);
}
printf("Global A: %d\n", A);
system("pause");
return 0;
}
可以看到我使用了两个完全一样的并行块#pragma omp parallel for,每个块都是for循环五次,我的电脑CPU是4线程的,所以,四个线程执行一次并行的++,那么首先是都会变成101,然后有一次线程多执行了一次,变成两次++就是102,此时全局A就变成102。但是第二个for循环,可以看到,线程0的初始值是102,但是线程1、2、3的初始值不是,而是上一个并行块的线程中最后的值。
然后在第二个for循环里加上一个copyin(A):
int A = 100;
#pragma omp threadprivate(A)
int main(int argc, char *argv[])
{
#pragma omp parallel for
for (int i = 0; i < 5; i++)
{
A++;
printf("Thread ID, i, A: %d, %d, %d\n", omp_get_thread_num(), i, A);
}
printf("Global A: %d\n", A);
#pragma omp parallel for copyin(A)
for (int i = 0; i < 5; i++)
{
A++;
printf("Thread ID, i, A: %d, %d, %d\n", omp_get_thread_num(), i, A);
}
printf("Global A: %d\n", A);
system("pause");
return 0;
}
可以看到,此时第二个for循环的A的初始值是102。这是因为copyin将主线程threadprivate修饰的变量的值拷贝到执行并行区域的各个线程的threadprivate变量中作为变量初始值。copyin修饰的参数必须是被threadprivate修饰过的。
六、copyprivate
copyprivate子句提供了一种机制用一个私有变量将一个值从一个线程广播到执行同一并行区域的其他线程。copyprivate子句可以关联single构造,在single构造的barrier到达之前就完成了广播工作。copyprivate可以对private和threadprivate子句中的变量进行操作,但是当使用single构造时,copyprivate的变量不能用于private和firstprivate子句中。
single修饰的代码块将会在一个线程中执行,但是不一定会是主线程,例子:
static int A = 100;
#pragma omp threadprivate(A)
int B = 100;
int C = 1000;
#pragma omp parallel firstprivate(B) copyin(A)
{
#pragma omp single
{
A = 10;
B = 20;
printf("Thread ID = %d, A = %d,B = %d, C = %d\n", omp_get_thread_num(), A, B, C);
}
printf("Initial Thread ID = %d, A = %d,B = %d, C = %d\n", omp_get_thread_num(), A, B, C);
}
printf("Global A = %d, B = %d, C = %d\n", A, B, C);
single修饰的后面一段代码是在线程2中执行,并且就执行一次,因为其他线程是不执行的。然后在single后面用copyprivate修饰一个变量,如A,#pragma omp single copyprivate(A),则得到的结果是:
可以看到,A被广播到了其他线程了。
紫陌红尘拂面来,
无人不道看花回。
玄都观里桃千树,
尽是刘郎去后栽。
--刘禹锡 《元和十年自朗州至京戏赠看花诸君子/玄都观桃花》
OpenMP笔记(四)的更多相关文章
- C#可扩展编程之MEF学习笔记(四):见证奇迹的时刻
前面三篇讲了MEF的基础和基本到导入导出方法,下面就是见证MEF真正魅力所在的时刻.如果没有看过前面的文章,请到我的博客首页查看. 前面我们都是在一个项目中写了一个类来测试的,但实际开发中,我们往往要 ...
- 《MFC游戏开发》笔记四 键盘响应和鼠标响应:让人物动起来
本系列文章由七十一雾央编写,转载请注明出处. http://blog.csdn.net/u011371356/article/details/9327377 作者:七十一雾央 新浪微博:http:// ...
- IOS学习笔记(四)之UITextField和UITextView控件学习
IOS学习笔记(四)之UITextField和UITextView控件学习(博客地址:http://blog.csdn.net/developer_jiangqq) Author:hmjiangqq ...
- java之jvm学习笔记四(安全管理器)
java之jvm学习笔记四(安全管理器) 前面已经简述了java的安全模型的两个组成部分(类装载器,class文件校验器),接下来学习的是java安全模型的另外一个重要组成部分安全管理器. 安全管理器 ...
- Java学习笔记四---打包成双击可运行的jar文件
写笔记四前的脑回路是这样的: 前面的学习笔记二,提到3个环境变量,其中java_home好理解,就是jdk安装路径:classpath指向类文件的搜索路径:path指向可执行程序的搜索路径.这里的类文 ...
- Java加密与解密笔记(四) 高级应用
术语列表: CA:证书颁发认证机构(Certificate Authority) PEM:隐私增强邮件(Privacy Enhanced Mail),是OpenSSL使用的一种密钥文件. PKI:公钥 ...
- Learning ROS for Robotics Programming Second Edition学习笔记(四) indigo devices
中文译著已经出版,详情请参考:http://blog.csdn.net/ZhangRelay/article/category/6506865 Learning ROS for Robotics Pr ...
- Typescript 学习笔记四:回忆ES5 中的类
中文网:https://www.tslang.cn/ 官网:http://www.typescriptlang.org/ 目录: Typescript 学习笔记一:介绍.安装.编译 Typescrip ...
- Django开发笔记四
Django开发笔记一 Django开发笔记二 Django开发笔记三 Django开发笔记四 Django开发笔记五 Django开发笔记六 1.邮箱激活 users app下,models.py: ...
随机推荐
- POJ1723 SOLDIERS 兄弟连
SOLDIERS 有一个性质:在一个长为n的序列a中找一个数 \(a_k\) 使得 \(\sum\limits_{i=1}^n abs(a_i-a_k)\) 最小,则 \(a_k\) 是a的中位数. ...
- Redis集群环境之linux搭建多机版---已完结,跟着一步一步来你就可以集群成功
上一篇踩着各种坑写了Redis集群环境之linux搭建单机版,这一篇准备就多机版集群进行搭建,主要目的一来是在上一篇的基础上进行精华提粹总结,二来是把单机版与多机版的区别进行记录. 首先软硬件环境: ...
- postman测试带有json数据格式的字段
测试六个字段 普通字段: ModelCode 普通字段: MmodelCode 普通字段: ModelTagKey 普通字段: ModelTagValue 普通字段: ModelTagType jso ...
- 控制数据的小数位数 java / js
//java一般控制格式都是通过 DecimalFormat 来控制的.下边是个例子. import java.text.DecimalFormat; public class ControlBit ...
- JAVA中的指针
不同于CPP,JAVA中不需要程序员对指针进行操作.不过,这不代表JAVA没有指针,事实上,JAVA的指针操作都被底层代码封装了.笔者在初学Java时,虽然就了解了形参,实参,StringBuffer ...
- ACM-DFS Template
自己写的DFSTemplate: // DFS_Template.cpp : 定义控制台应用程序的入口点. // #include "stdafx.h" //DFS的思想是:一直向 ...
- Linux命令笔记一
#查看文件大小[root@elegant-codes-3 py]# ls -lh total 1.1M -rw-r--r-- 1 root root 5.0K Feb 21 08:18 Crawl_W ...
- JavaScript的运算符、条件判断、循环、类型转换(9.25 第十一天)
JS的运算符 加 + 减 - 乘 * 除 / 取余 % 自增 ++ 自减 -- 赋值运算符 a=3 a+=3 a=a=3 a-=3 a=a-3 a*=3 a=a*2 a/=3 a=a/3 ...
- multi-layer perceptrons, MLP)模型,CvANN_MLP。
#include <opencv2/core/core.hpp> #include <opencv2/highgui/highgui.hpp> #include <ope ...
- 2 ~ express ~ 模板引擎的配置与使用
一,创建应用 (一),创建应用,监听端口 var express = require('express') // 创建app应用 var app = express() app.listen(3000 ...