OpenMP 循环调度 + 计时
▶ 使用子句 schedule() 来调度循环,对于循环中每次迭代时间不相等的情况较为有效
● 代码
- #include <stdio.h>
- #include <stdlib.h>
- #include <math.h>
- #include <omp.h>
- #include <time.h>
- const int thread = , dataSize = ;
- double f(int i)// 工作函数每次运行的时间与输入值 i 有关
- {
- const int first = i * (i + ) / , last = first + i;
- int j;
- double sum;
- for (j = first, sum = 0.0; j <= last; j++)
- sum += sin(j);
- return sum;
- }
- int main(int argc, char* argv[])
- {
- int i, threadReal;
- clock_t time;
- if (argc > && *argv[] > ''&& *argv[] < '')
- threadReal = atoi(argv[]);
- else
- threadReal = thread;
- time = clock();
- #pragma omp parallel for num_threads(thread) schedule(static, 1)// 静态调度,每个线程循环分配 1 个迭代块,默认调度相当于 schedule(static, dataSize / thread)
- for (i = ; i < dataSize; i++) // 新的 OpenMP 还支持 auto (系统自选)和 runtime (从环境变量 OMP_SCHEDULE 中选定,值为 static,dynamic,guided 之一)
- f(i);
- time = clock() - time;
- printf("finished, time = %d ms\n", time);
- getchar();
- return ;
- }
● 输出结果
- finished, time = ms // 单线程
- finished, time = ms // 8 线程,默认调度
- finished, time = ms // 8 线程,schedule(static, 1)
- finished, time = ms // 8 线程,schedule(dynamic)
- finished, time = ms // 8 线程,schedule(guided)
▶ OpenMP 的计时工具
- #include <stdio.h>
- #include <stdlib.h>
- #include <windows.h>
- #include <omp.h>
- int main(int argc, char* argv[])
- {
- double start = omp_get_wtime(); // 以毫秒为单位的计时器
- Sleep();
- double end = omp_get_wtime();
- double wtick = omp_get_wtick(); // 时钟分辨率,单位是秒
- printf_s("start = %.16g\nend = %.16g\ndiff = %.16g\n", start, end, end - start);
- printf_s("wtick = %.16g\n1/wtick = %.16g\n", wtick, 1.0 / wtick);
- getchar();
- return ;
- }
● 输出结果:
- start = 31852.98727121565
- end = 31853.99453063095
- diff = 1.007259415295266
- wtick = 2.438090779872098e-07
- /wtick =
OpenMP 循环调度 + 计时的更多相关文章
- 应用OpenMP的一个简单的设计模式
小喵的唠叨话:最近很久没写博客了,一是因为之前写的LSoftmax后馈一直没有成功,所以在等作者的源码.二是最近没什么想写的东西.前两天,在预处理图片的时候,发现处理200w张图片,跑了一晚上也才处理 ...
- OpenMP编程总结表
本文对OpenMP 2.0的全部语法——Macro(宏定义).Environment Variables(环境变量).Data Types(数据类型).Compiler Directives(编译指导 ...
- openMP的一点使用经验【非原创】
按照百科上说的,针对于openmp的编程,最简单的就是在开头加个#include<omp.h>,然后在后面的for上加一行#pragma omp parallel for即可,下面的是较为 ...
- 基于OpenMP的矩阵乘法实现及效率提升分析
一. 矩阵乘法串行实现 例子选择两个1024*1024的矩阵相乘,根据矩阵乘法运算得到运算结果.其中,两个矩阵中的数为double类型,初值由随机数函数产生.代码如下: #include <i ...
- OpenMP 入门教程
前两天(其实是几个月以前了)看到了代码中有 #pragma omp parallel for 一段,感觉好像是 OpenMP,以前看到并行化的东西都是直接躲开,既然躲不开了,不妨研究一下: OpenM ...
- OpenMP基础----以图像处理中的问题为例
OpenMP2.5规范中,对于可以多线程执行的循环有如下5点约束: 1.循环语句中的循环变量必须是有符号整形,如果是无符号整形就无法使用,OpenMP3.0中取消了这个约束 2.循环语句中的比 ...
- openMP多线程编程
OpenMP(Open Muti-Processing) OpenMP缺点: 1:作为高层抽象,OpenMp并不适合需要复杂的线程间同步和互斥的场合: 2:另一个缺点是不能在非共享内存系统(如计算机集 ...
- CentOS6中OpenMP的运行时间或运行性能分析
OpenMp作为单机多核心共享内存并行编程的开发工具,具有编码简洁等,容易上手等特点. 关于OpenMP的入门,博主饮水思源(见参考资料)有了深入浅出,循序渐进的分析.做并行开发,做性能分析是永远逃避 ...
- OpenMP n 体问题
▶ <并行程序设计导论>第六章中讨论了 n 体问题,分别使用了 MPI,Pthreads,OpenMP 来进行实现,这里是 OpenMP 的代码,分为基本算法和简化算法(引力计算量为基本算 ...
随机推荐
- 通过电信ADSL无线猫WLAN上网的方法
本教程只适合中国电信ADSL无线猫使用wifi(路由器不适合此帖)我的无线猫是电信赠送的华为[EchoLife]HG522c,亲测可用,解决网关无回应! 首先打开IE(注意,只能是IE,其他内核的浏览 ...
- python学习笔记(一)---python下载以及环境的安装
转载网址:https://www.runoob.com/python/python-install.html 1.下载python安装包: 安装包下载网址(如下图所在的网址):https://www. ...
- Spring Boot 集成 FreeMarker 详解案例(十五)
一.Springboot 那些事 SpringBoot 很方便的集成 FreeMarker ,DAO 数据库操作层依旧用的是 Mybatis,本文将会一步一步到来如何集成 FreeMarker 以及配 ...
- MissingNumber缺失的数字,FirstMissingPositive第一个缺失的正数
MissingNumber问题描述:给定一个数组,数组数字范围是0-n,找到缺失的数字.例如nums={0,1,3},return2. 算法分析:第一种方法,对数组进行排序,然后找到和下标不一致的数字 ...
- Android 遍历全国地区位置(一)
1.布局 choose_area.xml <?xml version="1.0" encoding="utf-8"?> <LinearLayo ...
- ES6学习一 JS语言增强篇
一 背景 JavaScript经过二十来年年的发展,由最初简单的交互脚本语言,发展到今天的富客户端交互,后端服务器处理,跨平台(Native),以及小程序等等的应用.JS的角色越来越重要,处理场景越来 ...
- java基础---->Zip压缩的使用
java中提供了对压缩格式的数据流的读写.它们封装到现成的IO 类中,以提供压缩功能.下面我们开始java中压缩文件的使用. 目录导航: 关于压缩的简要说明 GZIP压缩文件的使用 ZIP压缩文件的使 ...
- Alpha冲刺一 (9/10)
前言 队名:拖鞋旅游队 组长博客:https://www.cnblogs.com/Sulumer/p/10034872.html 作业博客:https://edu.cnblogs.com/campus ...
- LR 解压缩函数(wgzMemDecompressBuffer)失败 Code=-5
用LR做压力测试的时候有时会报错 “解压缩函数(wgzMemDecompressBuffer)失败 返回Code=-5”. Google了一把,也没有解决掉. 因为有些脚本运行时没有问题,感觉可能和请 ...
- tensorflow中 tf.reduce_mean函数
tf.reduce_mean 函数用于计算张量tensor沿着指定的数轴(tensor的某一维度)上的的平均值,主要用作降维或者计算tensor(图像)的平均值. reduce_mean(input_ ...