OpenMP与MPI联合编程
研究一下如何一起使用mpi和openmp
先上程序:
#include <stdio.h> #include <stdlib.h> #ifdef _OPENMP #include <omp.h> #endif #ifdef MPICH_CC #include <mpi.h> #endif #define SIZE 512 #define SIZEM SIZE #define SIZEN SIZE #define SIZEK SIZE #define DISPLAYT 1 double mytic() { double result = 0.0; struct timeval tv; gettimeofday( &tv, NULL ); result = tv.tv_sec*1e6 + tv.tv_usec; return result; } int main(int argc, char** argv) { #ifdef MPICH_CC int mpirank; int mpisize; MPI_Status mpistatus; #endif float *ma; float *mb; float *mc; int m, n, k; int r, s, t; float tsum; double tstart, tend; #ifdef MPICH_CC MPI_Init(&argc, &argv); MPI_Comm_rank(MPI_COMM_WORLD, &mpirank); #endif #ifdef _OPENMP omp_set_num_threads(2); #endif /*Matrx A, B, C allocation.*/ m = SIZEM; n = SIZEN; k = SIZEK; ma = (float*)malloc(m*n*sizeof(float)); if (!ma){return -1;} mb = (float*)malloc(n*k*sizeof(float)); if (!mb){free(ma);return -1;} mc = (float*)malloc(m*k*sizeof(float)); if (!mc){free(ma);free(mb);return -1;} /*Matrx A, B, C initialization.*/ srand((unsigned int)time(0)); tstart = mytic(); for (r = 0; r < m; r++) { for (s = 0; s < n; s++) { ma[r*n+s] = (1.0*rand())/RAND_MAX; } } #if DISPLAYT printf("[T] ma initialization time : %.3fms\n", 1e-3*(mytic()-tstart)); #endif tstart = mytic(); for (r = 0; r < n; r++) { for (s = 0; s < k; s++) { mb[r*k+s] = (1.0*rand())/RAND_MAX; } } #if DISPLAYT printf("[T] mb initialization time : %.3fms\n", 1e-3*(mytic()-tstart)); #endif /*Compute matrix C*/ tstart = mytic(); #pragma omp parallel for private(r,t,s,tsum) shared(m,n,k,ma,mb,mc) for (r = 0; r < m; r++) { for (t = 0; t < k; t++) { tsum = 0.0f; for (s = 0; s < n; s++) { tsum += ma[r*n+s]*mb[s*k+t]; } mc[r*m+t] = tsum; } } #if DISPLAYT printf("[T] mc computation time : %.3fms\n", 1e-3*(mytic()-tstart)); #endif #ifdef MPICH_CC printf("[R] rank = %d with ", mpirank); #pragma omp parallel { if (0==omp_get_thread_num()) { printf("omp_size = %d\n", omp_get_num_threads()); } } #endif #ifdef MPICH_CC #endif #ifdef MPICH_CC printf("MPI -- parallel \n"); MPI_Finalize(); #else printf(" serial \n"); #endif free(ma);free(mb);free(mc); return 0; }
使用如下命令编译这个代码
gcc -DMPICH_CC -O0 -fopenmp test.c `pkg-config --cflags --libs mpich` -o mpiomp.exe
执行代码(我用的是mpich)
mpiexec -n 2 ./mpiomp.exe
上面启动了两个进程来执行代码。
程序中,每个进程做的是一样的事情,都是计算两个矩阵的乘积,计算矩阵乘积的时候,我用openmp将矩阵乘积的计算分配给几个不同的线程来计算,以增加并行度。
如果你想在执行的时候设置openmp的线程数,可以把代码中第50行注释掉,然后用下面的命令执行。我是在ubuntu12.04上测试的,用的gcc-4.6.3,如果先不注释执行的话,再注释后按下面的命令执行的话,可能会得到跟之前一样的结果。这个原因我不是很清楚。有知道的,烦请告知一下呀。
mpiexec -n 2 -env OMP_NUM_THREADS 4 ./mpiomp.exe
注意几点:
因为有很多新手,可能以上来执行不出来。所以给出一下几个可能出问提的点。
* 是否安装MPICH? 没有安装的话,麻烦先安装。源码安装的看这里 点击打开链接
* pkg-config出问题。 检查下 mpich.pc是否在pkg-config的搜索路径,或者man pkg-config研究下pkg-config
OpenMP与MPI联合编程的更多相关文章
- OpenMP共享内存并行编程详解
实验平台:win7, VS2010 1. 介绍 平行计算机可以简单分为共享内存和分布式内存,共享内存就是多个核心共享一个内存,目前的PC就是这类(不管是只有一个多核CPU还是可以插多个CPU,它们都有 ...
- 转 Visual C++6.0 与matlab联合编程(2)----Visual C++6.0 环境下编译和调试MEX文件
我的最初想法是利用matlab的mex命令调用C++程序生成动态链接库的,但是测试程序(文中另附)通过了,自己的实际应用程序却没有过.还是把方法贴在这儿,以便自己以后进行整理. http://shij ...
- c++与matlab联合编程,调用Deploytool 生成exe文件和dll文件(转)
转自:http://www.cnblogs.com/xlw1219/archive/2012/12/25/2832222.html 首先必须知道联合编程需要知道的一些命令解释: mcc 的作用是将 . ...
- 方阵行列式并行化计算(OpenMP,MPI),并计算加速比
00][100].在创建方阵时,方阵的阶数N(N<100)由外部输入.然后用两层"for循环"来给方阵 p左上角 N×N个位置赋值.具体实现如下: /* * 定义矩阵阶数N ...
- Halcon C# 联合编程问题(三)
因为之前遇到的那个halcon处理的图片要转换成ImageSource的问题,迟迟没有找到好的解决方案, 于是决定直接在wpf中使用halcon提供的HWindowControlWPF,用于显示图片. ...
- 在CentOS上安装MPI以及MPI入门编程笔记
一.准备工作 更新yum库 yum update 下载相关依赖包 yum install wget -y yum install gcc gcc-c++ gcc-fortran kernel-deve ...
- 学习MPI并行编程记录
简单的MPI程序示例 首先,我们来看一个简单的MPI程序实例.如同我们学习各种语言的第一个程序一样,对于MPI的第一个程序同样是"Hello Word". /* Case 1 he ...
- Win7 32bit + Matlab2013b +Visual Studio 2010联合编程配置
要建立独立运行的C应用程序,系统中需要安装Matlab.Matlab编译器.C/C++编译器以及Matlab C/C++数学库函数和图形库函数. Matlab编译器使用mbuild命令可以直接将C/C ...
- 基于OpenMP的C++并行编程简单示例
示例要求:在整数A和B之间找到符合条件的值X,使f(X)=C. 示例代码(需要在VS中开启OpenMP支持): #include<iostream> #include<time.h& ...
随机推荐
- 洛谷P3275 [SCOI2011]糖果
差分约束大坑题 #include<cstdio> #include<cstdlib> #include<algorithm> #include<cstring ...
- UVA11082:Matrix Decompressing
题意:给定一个矩阵的前i行的和,以及前i列的和,求任意一个满足条件的矩阵,矩阵元素在[1,20] 矩阵行列<=20 题解:做一个二分图的模型,把行列拆开,然后设源点到行节点的容量就是该行所有元素 ...
- C++Primer学习——类型转换
无符号之间的运算 当一个是无符号类型,另外一个是带符号类型: 如果无符号不小于带符号,那么带符号转换成无符号. 如果无符号小于带符号,当无符号类型的所有值都能存到带符号中时,则无符号转换成带符号,否则 ...
- 非Unicode编码的软件如何在Windows系统上运行
我们常常会遇到这样一种情况:点开某些日文软件(我不会说就是galgame( ╯□╰ ))会出现乱码或者直接无法运行. 出现乱码的原因很简单:编码与译码的方式不一致!!!!!!!!!!! 首先大家需要知 ...
- Docker学习笔记【三】安装Redis
项目中使用到Redis,平常都是别人搭建的,今天试着在Google Cloud Platform 上搭建一个学习环境. 1.使用 docker pull redis 从docker hub中下载镜像 ...
- Spring MVC运行流程
一.配置阶段 ①web.xml ②DispatcherServlet //Spring MVC总入口 ③配置初始化参数 //classpath:application.xml,用于配置无数个 ...
- sqlserver 按照特定值排序查询结果
select * from t_ss_student order by case when xm like '林%' then 1 else 2 end asc; 姓林的会排在前面
- TCP/IP学习笔记__mbuf
Socket发送和接收数据都是写入和读取mbuf(存储器缓存)来完成的.下面着重介绍下Sendto函数与mbuf的关系: 以UDP协议为例: 1.UDP的输出执行过程: UDP的输出执行过程 2.协议 ...
- JVM Class字节码之三-使用BCEL改变类属性
使用BCEL动态改变Class内容 之前对Class文件中的常量池,Method的字节码指令进行了说明.JVM Class详解之一JVM Class详解之二 Method字节码指令现在我们开始实际动手 ...
- ng-book札记——HTTP
Angular拥有自己的HTTP库,可以用于调用外部API. 在JavaScript世界里有三种方式可以实现异步请求,Callback,Promise与Observable.Angular倾向于使用O ...