C++AMP介绍(一)

最后更新日期:2014-05-02

阅读前提

环境:Windows 8.1 64bit英文版,Visual Studio 2013 Professional Update1英文版。Nvidia QuadroK600 显卡

内容简单介绍

介绍C++ AMP怎样使用加速器(GPU)的并发运行能力。通过两个尽可能简洁的程序,让用户了解到怎样把AMP应用到自己的程序开发其中。

正文

C++AMP (C++ Accelerated Massive Parallelism)利用并行硬件(比如独立图形加速卡)的性能。加速你C++程序的运行速度,C++ AMP编程模型包含支持多维数组。索引。内存传输和平铺,包含数学函数库。你能够使用C++ AMP更广泛的控制CPU同GPU之间数据的传递。

C++ AMP要求你的显卡完整支持DirectX11硬件特性。

在Visual Studio上建立Win32 控制台项目。以下是我第一个C++AMP应用程序源码

  1. #include "stdafx.h"
  2.  
  3. #include <amp.h>
  4. #include <iostream>
  5. using namespace concurrency;
  6.  
  7. const int size = 5;
  8.  
  9. void CppAmpMethod() {
  10. int aCPP[] = { 1, 2, 3, 4, 5 };
  11. int bCPP[] = { 6, 7, 8, 9, 10 };
  12. int sumCPP[size];
  13.  
  14. //concurrency::array_view是AMP的数据包装器。可作为智能指针使用,代表了一维或多维数组。
  15. //第一个模板參数是数据类型,第二个模板參数是维度。
  16.  
  17. //第一个构造參数是数组中元素的数量,第二个构造參数是数组
  18. array_view<const int, 1> a(size, aCPP);
  19. array_view<const int, 1> b(size, bCPP);
  20. array_view<int, 1> sum(size, sumCPP);
  21.  
  22. //调用dsicard_data方法。是为了避免sum包装器中的数据拷贝到GPU
  23. //此方法的调用不能出如今有restrict(amp)约束的上下文(代码段)中
  24. sum.discard_data();
  25.  
  26. parallel_for_each(
  27. //sum.extent代表计算域,在这上面将会建立线程集合
  28. //由于数组中有5个元素。所以会建立5根线程分别执行
  29. sum.extent,
  30. //Lambda表达式定义在加速器上各个线程将会执行的代码
  31. //restrict(amp)是Microsoft AMP引入的约束符号,要求Lambda执行在GPU上
  32. //默认值是restrict(cpu)约束在CPU上执行。所以不加约束能够在不论什么标准C++编译器中正确编译
  33. //约束还能够是restrict(cpu,amp),没有其他。
  34. //index类用来索引array_view中的元素,index模板參数表示idx的维度
  35. [=](index<1> idx) restrict(amp)
  36. {
  37. //restrict(amp)约束使lambda表达式无法捕获到外面的引用型和指针型变量
  38. //仅仅能使用concurrency::array_view容器,输入输出数据
  39. sum[idx] = a[idx] + b[idx];
  40. }
  41. );
  42.  
  43. // 打印输出结果. 正确的输出应该是 "7, 9, 11, 13, 15".
  44. for (int i = 0; i < size; i++) {
  45. std::cout << sum[i] << "\n";
  46. }
  47.  
  48. //更新sum包装器指向的数据源,即sumCPP中的数据(元素)
  49. sum.synchronize();
  50.  
  51. // 打印输出结果. 正确的输出应该是 "7, 9, 11, 13, 15".
  52. for (int i = 0; i < size; i++) {
  53. std::cout << sumCPP[i] << "\n";
  54. }
  55. }
  56. int _tmain(int argc, _TCHAR* argv[])
  57. {
  58. CppAmpMethod();
  59.  
  60. system("pause");
  61.  
  62. return 0;
  63. }

第二个C++ AMP程序演示怎样自己编写带restrict(amp)修饰的函数。以及怎样调用它。

  1. #include "stdafx.h"
  2.  
  3. #include <amp.h>
  4. #include <amp_math.h>
  5. #include <iostream>
  6. using namespace concurrency;
  7.  
  8. const int size = 5;
  9.  
  10. //带restrict(amp)约束的函数仅仅能使用C++标准的子集,称为kernel函数,
  11. //在GPU上执行。仅仅能被带有restrict(amp)约束的上下文(代码段)调用
  12. void AddElementsWithRestrictedFunction(
  13. index<1> idx, array_view<int, 1> sum, array_view<int, 1> a, array_view<int, 1> b) restrict(amp)
  14. {
  15. sum[idx] = a[idx] + b[idx];
  16. }
  17.  
  18. void AddArraysWithFunction() {
  19.  
  20. int aCPP[] = { 1, 2, 3, 4, 5 };
  21. int bCPP[] = { 6, 7, 8, 9, 10 };
  22. int sumCPP[5];
  23.  
  24. array_view<int, 1> a(5, aCPP);
  25. array_view<int, 1> b(5, bCPP);
  26. array_view<int, 1> sum(5, sumCPP);
  27. sum.discard_data();
  28.  
  29. parallel_for_each(
  30. sum.extent,
  31. [=](index<1> idx) restrict(amp)
  32. {
  33. //调用restrict(amp)约束的函数
  34. AddElementsWithRestrictedFunction(idx, sum, a, b);
  35. }
  36. );
  37.  
  38. for (int i = 0; i < 5; i++) {
  39. std::cout << sum[i] << "\n";
  40. }
  41. }
  42.  
  43. /*
  44. C++ AMP 带了两个数学库。 在名字空间Concurrency::precise_math的双精度库,也提供单精度数学函数。
  45. 在Concurrency::fast_math名字空间的单精度库,仅仅提供单精度数学函数。
  46. 能够使用accelerator::supports_double_precision属性推断GPU是否支持双精度库。
  47. 这些带restrict(amp)约束的数学函数在<amp_math.h>头文件里声明。
  48. 标准C++库<cmath>头文件里声明的数学函数在fast_math和precise_math空间中都能找到。
  49.  
  50. */
  51. void MathExample() {
  52.  
  53. double numbers[] = { 1.0, 10.0, 60.0, 100.0, 600.0, 1000.0 };
  54. array_view<double, 1> logs(6, numbers);
  55.  
  56. parallel_for_each(
  57. logs.extent,
  58. [=](index<1> idx) restrict(amp) {
  59. logs[idx] = concurrency::fast_math::log10(logs[idx]);
  60. }
  61. );
  62.  
  63. for (int i = 0; i < 6; i++) {
  64. std::cout << logs[i] << "\n";
  65. }
  66. }
  67.  
  68. int _tmain(int argc, _TCHAR* argv[])
  69. {
  70. //測试这里写的带restrict(amp)约束的函数
  71. AddArraysWithFunction();
  72.  
  73. //測试C++ AMP提供的带restrict(amp)约束的数学函数
  74. MathExample();
  75.  
  76. system("pause");
  77.  
  78. return 0;
  79. }

如今你应该已经学会了C++AMP的编程方式,下一篇介绍C++ AMP关于性能优化方面的基本知识。

參考资料

http://msdn.microsoft.com/zh-cn/library/vstudio/hh265136(v=vs.120).aspx

http://blogs.msdn.com/b/nativeconcurrency/archive/2011/09/13/c-amp-in-a-nutshell.aspx

C++ AMP (C++ Accelerated MassiveParallelism)

http://msdn.microsoft.com/zh-cn/library/hh265137.aspx

C++AMP介绍(一)的更多相关文章

  1. CSS3 background-image背景图片相关介绍

    这里将会介绍如何通过background-image设置背景图片,以及背景图片的平铺.拉伸.偏移.设置大小等操作. 1. 背景图片样式分类 CSS中设置元素背景图片及其背景图片样式的属性主要以下几个: ...

  2. MySQL高级知识- MySQL的架构介绍

    [TOC] 1.MySQL 简介 概述 MySQL是一个关系型数据库管理系统,由瑞典MySQL AB公司开发,目前属于Oracle公司. MySQL是一种关联数据库管理系统,将数据保存在不同的表中,而 ...

  3. Windows Server 2012 NIC Teaming介绍及注意事项

    Windows Server 2012 NIC Teaming介绍及注意事项 转载自:http://www.it165.net/os/html/201303/4799.html Windows Ser ...

  4. Linux下服务器端开发流程及相关工具介绍(C++)

    去年刚毕业来公司后,做为新人,发现很多东西都没有文档,各种工具和地址都是口口相传的,而且很多时候都是不知道有哪些工具可以使用,所以当时就想把自己接触到的这些东西记录下来,为后来者提供参考,相当于一个路 ...

  5. JavaScript var关键字、变量的状态、异常处理、命名规范等介绍

    本篇主要介绍var关键字.变量的undefined和null状态.异常处理.命名规范. 目录 1. var 关键字:介绍var关键字的使用. 2. 变量的状态:介绍变量的未定义.已定义未赋值.已定义已 ...

  6. HTML DOM 介绍

    本篇主要介绍DOM内容.DOM 节点.节点属性以及获取HTML元素的方法. 目录 1. 介绍 DOM:介绍DOM,以及对DOM分类和功能的说明. 2. DOM 节点:介绍DOM节点分类和节点层次. 3 ...

  7. HTML 事件(一) 事件的介绍

    本篇主要介绍HTML中的事件知识:事件相关术语.DOM事件规范.事件对象. 其他事件文章 1. HTML 事件(一) 事件的介绍 2. HTML 事件(二) 事件的注册与注销 3. HTML 事件(三 ...

  8. HTML5 介绍

    本篇主要介绍HTML5规范的内容和页面上的架构变动. 目录 1. HTML5介绍 1.1 介绍 1.2 内容 1.3 浏览器支持情况 2. 创建HTML5页面 2.1 <!DOCTYPE> ...

  9. ExtJS 4.2 介绍

    本篇介绍ExtJS相关知识,是以ExtJS4.2.1版本为基础进行说明,包括:ExtJS的特点.MVC模式.4.2.1GPL版本资源的下载和说明以及4种主题的演示. 目录 1. 介绍 1.1 说明 1 ...

  10. ExtJS 4.2 组件介绍

    目录 1. 介绍 1.1 说明 1.2 组件分类 1.3 组件名称 1.4 组件结构 2. 组件的创建方式 2.1 Ext.create()创建 2.2 xtype创建 1. 介绍 1.1 说明 Ex ...

随机推荐

  1. 【scrapy】使用方法概要(三)(转)

    请初学者作为参考,不建议高手看这个浪费时间] 前两篇大概讲述了scrapy的安装及工作流程.这篇文章主要以一个实例来介绍scrapy的开发流程,本想以教程自带的dirbot作为例子,但感觉大家应该最先 ...

  2. GDB 调试PYTHON

    http://www.cnblogs.com/dkblog/p/3806277.html

  3. 由于拷贝的文件太大,不可能一直开着SHELL,所以让SCP后台运行

    原文地址: http://blog.itpub.net/90618/viewspace-750822/ 1:开一个终端,scp命令运行后,输入密码让其拷贝 # scp chris@221.179.1. ...

  4. andriod arcgis createPolygons创建带空的面

    private void createPolygons() { // create input polygon 1 PointCollection pointsPoly = new PointColl ...

  5. 利用Squid + DNSPOD 搭建CDN服务器

    首先下载squid for windows安装包 squid-2.7.STABLE5-bin.zip 然后解压缩,放到C盘squid目录内. 进入目录C:\squid\etc内,将所有文件的.defa ...

  6. tsort - 拓扑排序

    tsort - 拓扑排序 本文链接:http://codingstandards.iteye.com/blog/834572   (转载请注明出处) 用途说明 tsort命令通常用于解决一种逻辑问题, ...

  7. 【BZOJ】【2120】数颜色 & 【2453】维护队列

    莫队算法 分块大法吼 这题乍一看跟HH的项链很像啊……只是多了一个修改操作……然而我就不会做了

  8. Objective-C:ARC自动释放对象内存

    ARC是cocoa系统帮你完成对象内存释放的引用计数机制 .h文件 // Person.h // 01-ARC // // Created by ma c on 15/8/13. // Copyrig ...

  9. XSS第四节,XSS攻击实例(一)

    在开始实例的讲解之前,先看一下XSS的危害情况,第一张图中说明和XSS相关的CVE漏洞有7417个(http://web.nvd.nist.gov/view/vuln/search-results?q ...

  10. 混沌数学之Feigenbaum模型

          1975年,物理学家米切尔·费根鲍姆(Mitchell Feigenbaum)发现,一个可用实验加以测 量的特殊数与每个周期倍化级联相联系.这个数大约是4.669,它与π并列成为似乎在数学 ...