在CPU上定义两个数并赋值,然后使用GPU核函数将两个数相加并返回到CPU,在CPU上显示

  1. #include "cuda_runtime.h"
  2. #include "device_launch_parameters.h"
  3.  
  4. #include <iomanip>
  5. #include <iostream>
  6. #include <stdio.h>
  7.  
  8. using namespace std;
  9.  
  10. //检测GPU
  11. bool CheckCUDA(void){
  12. int count = ;
  13. int i = ;
  14.  
  15. cudaGetDeviceCount(&count);
  16. if (count == ) {
  17. printf("找不到支持CUDA的设备!\n");
  18. return false;
  19. }
  20. cudaDeviceProp prop;
  21. for (i = ; i < count; i++) {
  22. if (cudaGetDeviceProperties(&prop, i) == cudaSuccess) {
  23. if (prop.major >= ) {
  24. break;
  25. }
  26. }
  27. }
  28. if (i == count) {
  29. printf("找不到支持CUDA的设备!\n");
  30. return false;
  31. }
  32. cudaGetDeviceProperties(&prop, );
  33. printf("GPU is: %s\n", prop.name);
  34. cudaSetDevice();
  35. printf("CUDA initialized success.\n");
  36. return true;
  37. }
  38.  
  39. //使用指针相加
  40. __global__ void addNumber(double a, double b, double *c);
  41.  
  42. int main(){
  43. //检测GPU
  44. if (!CheckCUDA()){
  45. cout << "No CUDA device.";
  46. return ;
  47. }
  48. cout << "*************************************************************************************************************" << endl;
  49.  
  50. double h_a, h_b, h_c; //在CPU上定义三个变量
  51. double *d_c; //定义一个将指向GPU的指针
  52.  
  53. h_a = 2.2;
  54. h_b = 3.3;
  55.  
  56. cudaMalloc((void **)&d_c, sizeof(double)); //为指针在GPU上分配内存空间
       //调用核函数并启用一个线程块和一个线程
  57. addNumber<<<, >>>(h_a, h_b, d_c); //只是单独的两个数相加,不是两个数组相加,只需使用单线程,数组相加可以使用多线程
  58. cudaMemcpy(&h_c, d_c, sizeof(double), cudaMemcpyDeviceToHost); //将GPU上计算好的结果返回到CPU上定义好的变量
  59.  
  60. //setw(10)表示输出10个空格,需添加 #include <iomanip>
  61. cout << setw() << h_a << " + " << h_b << " = " << h_c << endl;
  62.  
  63. cout << endl << endl;
  64. system("pause");
  65. return ;
  66. }
  67.  
  68. __global__ void addNumber(double a, double b, double *c){
  69. *c = a + b;
  70. }

显示结果如下

CUDA学习(三)之使用GPU进行两个数相加的更多相关文章

  1. 在O(N)时间内求解 正数数组中 两个数相加的 最大值

    一,问题描述 给定一个正数数组arr(即数组元素全是正数),找出该数组中,两个元素相加的最大值,其中被加数的下标大于加数的下标.由加法运算的可逆性,j >i 这个条件可以去掉. 即求出: max ...

  2. 【LeetCode-面试算法经典-Java实现】【002-Add Two Numbers (单链表表示的两个数相加)】

    [002-Add Two Numbers (单链表表示的两个数相加)] 原题 You are given two linked lists representing two non-negative ...

  3. 牛客网2016.4.11(两个数相加为sum/计数一个int型的二进制有多少个1/二叉树是否左右对称)

    求最小的两个数相加为sum //求最小的两个数相加为sum public ArrayList<Integer> FindNumbersWithSum(int [] array,int su ...

  4. 作业帮:给定一个整数数组,找出其中两个数相加等于目标值(去重set)

    题目描述 给定一个整数数组,找出其中两个数相加等于目标值 输入 [1,3,5,7,9,11] 10 输出 1,9 3,7 代码: import java.util.HashMap; import ja ...

  5. 【剑指offer学习】求和为定值的两个数(拓展)

    接着上面一篇文章: http://blog.csdn.net/u013476464/article/details/40651451 接下来我们拓展一下题目,如果数组是乱序的,并且规定数组中的元素所有 ...

  6. 【LeetCode】两个数相加

    [问题]给定两个非空链表来表示两个非负整数.位数按照逆序方式存储,它们的每个节点只存储单个数字.将两数相加返回一个新的链表. 你可以假设除了数字 0 之外,这两个数字都不会以零开头. [实例] 输入: ...

  7. php不用第三个变量,交换两个数的值

    //字符串版本 结合使用substr,strlen两个方法实现 $a="a"; $b="b"; echo '交换前 $a:'.$a.',$b:'.$b.'< ...

  8. Flex学习第一天(两个数相加)

    <?xml version="1.0" encoding="utf-8"?><s:Application xmlns:fx="htt ...

  9. 剑指offer用位运算实现两个数相加,及python相关的位操作

    题目:写一个函数,求两个整数之和,要求在函数体内不得使用+.-.*./四则运算符号. 代码: # -*- coding:utf-8 -*-class Solution:    def Add(self ...

随机推荐

  1. Python用PIL将PNG图像合成gif时如果背景为透明时图像出现重影的解决办法

    最近在用PIL合成PNG图像为GIF时,因为需要透明背景,所以就用putpixel的方法替换背景为透明,但是在合成GIF时,图像出现了重影,在网上查找了GIF的相关资料:GIF相关资料 其中有对GIF ...

  2. CentOS8安装fastdfs6.06

    目录 一.准备环境 二.解压并编译安装 1.解压下载好的包 2.编译安装 2.1.编译安装 libfastcommon 2.2.编译安装 fastdfs 2.3.安装 nginx 和 fastdfs- ...

  3. linux各目录及重要目录的详细介绍

    1 目录说明 根目录 (/) /bin bin是Binary的缩写, 这个目录存放着最经常使用的命令,比如ls,cat,mkdir等 /dev dev是Device(设备)的缩写, 该目录下存放的是L ...

  4. 解释一下什么是 aop?(未完成)

    解释一下什么是 aop?(未完成)

  5. Python学到什么程度可以面试工作(解答一)

    本文整理了 26 个 Python 有用的技巧,将按照首字母从 A~Z 的顺序分享其中一些内容. all 或 any 人们经常开玩笑说 Python 是“可执行的伪代码”,但是当你可以这样编写代码时, ...

  6. Salesforce LWC学习(十) 前端处理之 list 处理

    本篇参看:https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/Array list是我们经 ...

  7. X-Admin&ABP框架开发-租户管理

    软件即服务概念的推动,定制化到通用化的发展,用一套代码完成适应不同企业的需求,利用多租户技术可以去做到这一点.ABP里提供了多租户这一概念并且也在Zero模块中实现了这一概念. 一.多租户的概念 单部 ...

  8. Go中锁的那些姿势,估计你不知道

    什么是锁,为什么使用锁 用俗语来说,锁意味着一种保护,对资源的一种保护,在程序员眼中,这个资源可以是一个变量,一个代码片段,一条记录,一张数据库表等等. 就跟小孩需要保护一样,不保护的话小孩会收到伤害 ...

  9. Scala实践9

    1.特征 Traits用于在类之间共享接口和字段.它们类似于Java 8的接口.类和对象可以扩展特征,但是特征不能被实例化,因此没有参数. 定义一个特征 最小特征只是关键字trait和标识符: tra ...

  10. Frogger POJ - 2253(求两个石头之间”所有通路中最长边中“的最小边)

    题意 ​ 题目主要说的是,有两只青蛙,在两个石头上,他们之间也有一些石头,一只青蛙要想到达另一只青蛙所在地方,必须跳在石头上.题目中给出了两只青蛙的初始位置,以及剩余石头的位置,问一只青蛙到达另一只青 ...