c++多线程编程:实现标准库accumulate函数的并行计算版本
今天使用c++实现了标准库头文件<numeric>中的accumulate函数的并行计算版本,代码如下,注释写的比较详细,仅对其中几点进行描述:
①该实现假定不发生任何异常,故没有对可能产生的异常进行处理
②第42行的语句:
const unsigned int num_thread = std::min((hardware_thread != 0 ? hardware_thread : 2), max_thread);
要运行的线程数是计算出的最大线程数和硬件线程数量的较小值。这是因为若运行的线程数超出了硬件支持的范围,CPU的上下文切换会降低性能。又因为hardware_thread的值可能为0,在这种情况下用户需要自行替换线程的数量,在代码中为2,因为在单核的机器上运行过多的线程会导致性能降低,但过少的线程也会使用户错过可用的并发。
③第44行计算每个线程操作的元素个数时算式可能无法整除,但无须担心,因为最后一个线程将会处理剩下的所有元素,如第68行语句所示:
Accum<Iterator, T>()(block_begin, last, results[num_thread - 1]);
④注意第64行的语句:
threads[i] = thread(Accum<Iterator, T>(), block_begin, block_end, std::ref(results[i]));
传给线程执行的函数的第三个参数增加了std::ref(),该函数包含在头文件<functional>中。在一般情况下,thread对象的构造函数只是简单地拷贝用户提供的参数,然后传递给线程关联的可调用对象。也就是说,该可调用对象接收的是该参数的副本,对其所作的修改无法影响到最初用户所传递的参数。若需要接收参数的引用版本,则需要使用std::ref()函数。
//实现标准库头文件<numeric>中accumulate函数的并行版本
#include <iostream>
#include <thread>
#include <numeric>
#include <algorithm>
#include <vector>
#include <functional>
#include <utility> using std::thread;
using std::vector;
using std::accumulate;
using std::cout;
using std::endl; template <typename Iterator, typename T> class Accum
{
public:
void operator() (Iterator first, Iterator last, T &sum)
{
sum = std::accumulate(first, last, sum);
}
}; template <typename Iterator, typename T>
T ParallelAccum(Iterator first, Iterator last, T &sum)
{
//计算迭代器中包含的元素数量
const unsigned int len = std::distance(first, last);
//若迭代器中没有元素则直接返回
if (!len)
{
return sum;
}
//每个线程处理的元素的最小数量
const unsigned int min_per_thread = ;
//获取线程的最大数量,向上取整
const unsigned int max_thread = (len - + min_per_thread) / min_per_thread;
//获取机器支持的并发线程数
const unsigned int hardware_thread = thread::hardware_concurrency();
//取上述两者的较小值,同时避免线程数过少
const unsigned int num_thread = std::min((hardware_thread != ? hardware_thread : ), max_thread);
//最终实际上每个线程处理的元素个数
const unsigned int block_size = len / num_thread;
//保存每个线程累加的结果
vector<T> results(num_thread);
//启动比num_thread - 1个线程,因为main函数本身已开启一个线程
vector<thread> threads(num_thread - );
//
cout << "Number of elements: " << len << endl;
cout << "Hardware concurrency: " << hardware_thread << endl;
cout << "Maximum number of threads: " << max_thread << endl;
cout << "Number of threads: " << num_thread << endl;
cout << "Block size: " << block_size << endl;
cout << "Started parallel calculating..." << endl;
//开始并行计算
Iterator block_begin = first;
for (unsigned int i = ; i < (num_thread - ); ++i)
{
Iterator block_end = block_begin;
//将迭代器向前推进一个块,到达当前块的末尾位置
std::advance(block_end, block_size);
//传递参数,通常情况下thread的构造函数将复制所提供的参数,需要将模板参数转为引用
threads[i] = thread(Accum<Iterator, T>(), block_begin, block_end, std::ref(results[i]));
block_begin = block_end;
}
//处理最后一个线程,由于block_size = len / num_thread得到的结果不一定为整数,该线程处理剩余的所有元素
Accum<Iterator, T>()(block_begin, last, results[num_thread - ]);
//对threads中所有线程调用join()
std::for_each(threads.begin(), threads.end(), std::mem_fn(&thread::join));
//
return accumulate(results.begin(), results.end(), sum);
} int main()
{
vector<int> i_vec;
int sum = ;
for (int i = ; i != ; ++i)
{
i_vec.push_back(i);
}
sum = ParallelAccum(i_vec.cbegin(), i_vec.cend(), sum);
cout << "sum = " << sum << endl;
system("pause");
return ;
}
c++多线程编程:实现标准库accumulate函数的并行计算版本的更多相关文章
- c/c++ 标准库 bind 函数 详解
标准库 bind 函数 详解 bind函数:接收一个函数名作为参数,生成一个新的函数. auto newCallable = bind(callbale, arg_list); arg_list中的参 ...
- Atitit 数据库 标准库 sdk 函数库 编程语言 mysql oracle attilax总结
Atitit 数据库 标准库 sdk 函数库 编程语言 mysql oracle attilax总结 1.1. 常见的编程语言以及数据库 sql内部函数库标准化库一般有以下api1 1.2. 各个 ...
- 实现C++标准库string类的简单版本
代码如下: #ifndef STRING_H #define STRING_H #include <cassert> #include <utility> #include & ...
- C标准库常用函数概要
stdio.h printf()/fprintf() printf的返回值是打印的字符数, 发生错误则返回负数 scanf()/fscanf() scanf的返回值是成功赋值的变量个数, 失败则返回E ...
- 标准库bind函数中使用占位符placeholders
placeholders ,占位符.表示新的函数对象中参数的位置.当调用新的函数对象时,新函数对象会调用被调用函数,并且其参数会传递到被调用函数参数列表中持有与新函数对象中位置对应的占位符. 举个例子 ...
- 【C++】标准库sort函数的自定义排序
自定义排序需要单独写一个compare函数 例1 LeetCode 056. Merge Intervals Given a collection of intervals, merge all ov ...
- C++11 标准库 bind 函数
bind 是什么? bind 顾名思义: 绑定 通俗来讲呢,可以这么理解有点像函数指针的意思. 资料上是这么讲的:可以将 bind 函数看做一个通用函数的适配器,它接受一个可调用对象,生成一个新的可以 ...
- C标准库pow函数精度问题。
#include <stdio.h> int main () { int temp,i; double a=2.4568; unsigned ]; ;i<;i++) { temp=( ...
- 逆向 stdio.h 函数库 fseek 函数(调试版本)
0x01 fseek 函数 函数原型:int fseek(FILE *stream, long int offset, int whence) 函数功能:设置流 stream 的文件位置为给定的偏移 ...
随机推荐
- MysQL使用一与Python交互
与python交互 在熟练使用sql语句的基础上,开始使用python语言提供的模块与mysql进行交互 这是我们在工作中大事要做的事 先学会sql是基础,一定要熟练编写sql语句 安装引入模块 安装 ...
- 动态规划dp专题练习
貌似开坑还挺好玩的...开一个来玩玩=v=... 正好自己dp不是很熟悉,就开个坑来练练吧...先练个50题?小目标... 好像有点多啊QAQ 既然是开坑,之前写的都不要了! 50/50 1.洛谷P3 ...
- Azure Active Directory配置java应用的单点登录
下载应用:https://github.com/Azure-Samples/active-directory-java-webapp-openidconnect(普通项目,集成了特殊配置接入微软的注册 ...
- LightOJ 1356 Prime Independence(质因数分解+最大独立集+Hopcroft-Carp)
http://lightoj.com/login_main.php?url=volume_showproblem.php?problem=1356 题意: 给出n个数,问最多能选几个数,使得该集合中的 ...
- MySQL索引失效的场景
WHERE字句的查询条件里有不等于号(WHERE column!=-),MYSQL将无法使用索引 类似地,如果WHERE字句的查询条件里使用了函数(如:WHERE DAY(column)=-),MYS ...
- 解决msi文件在XP上安装未完成
下载Ocra工具,然后删除"DIRCA_CheckFx"和"VSDCA_VsdLaunchConditions"这两个Action即可.第一步,下载并打开Ocr ...
- Flash访问模块FDS用法及常见问题—nRF5 SDK模块系列一
FDS,全称Flash Data Storage,用来访问芯片内部Flash的.当你需要把数据存储在Flash中,或者读取Flash中的用户数据,或者更新或者删除Flash中的数据,那么FDS模块是你 ...
- 在Web API 2 中实现带JSON的Patch请求
译文:http://www.cnblogs.com/kexxxfeng/p/the-patch-verb-in-web-api-2-with-json.html 原文:https://carly.io ...
- 基于哈夫曼编码的压缩解压程序(C 语言)
这个程序是研一上学期的课程大作业.当时,跨专业的我只有一点 C 语言和数据结构基础,为此,我查阅了不少资料,再加上自己的思考和分析,实现后不断调试.测试和完善,耗时一周左右,在 2012/11/19 ...
- Android----- MD5加密(登录注册得到与IOS相同的加密值,并且解决两个平台汉字加密不相同问题)
最近开发项目中遇到一个这样的问题,注册和登录时需要对信息MD5加密生成一个Token传给后台, 后台会对信息进行比较加密是否相同,才表示你登录或者注册成功,所以,IOS和Android两个平台的tok ...