1. cublasSscal
  1. //Example 1. Application Using C and CUBLAS: 1-based indexing
  2.  
  3. #include <stdlib.h>
  4. #include <math.h>
  5. #include <cuda_runtime.h>
  6. #include "cublas_v2.h"
  7. #include <stdio.h>
  8. #define M 6
  9. #define N 5
  10. #define IDX2F(i,j,ld) ((((j)-1)*(ld))+((i)-1))
  11. static __inline__ void modify (cublasHandle_t handle, float*m, int ldm, int
  12. n, int p, int q, float alpha, float beta){
  13. cublasSscal (handle, n-p+, &alpha, &m[IDX2F(p,q,ldm)], ldm);
  14. cublasSscal (handle, ldm-p+, &beta, &m[IDX2F(p,q,ldm)], );
  15. }
  16. int main (void){
  17. cudaError_t cudaStat;
  18. cublasStatus_t stat;
  19. cublasHandle_t handle;
  20. int i, j;
  21. float* devPtrA;
  22. float* a = ;
  23. a = (float*)malloc (M * N * sizeof(*a));
  24. if(!a) {
  25. printf("host memory allocation failed");
  26. return EXIT_FAILURE;
  27. }
  28. for(j = ; j <= N; j++) {
  29. for(i = ; i <= M; i++) {
  30. a[IDX2F(i,j,M)] = (float)((i-) * M + j);
  31. printf("%7.0f",a[IDX2F(i,j,M)]);
  32. }printf("\n");
  33. }printf("\n");
  34. cudaStat = cudaMalloc ((void**)&devPtrA, M*N*sizeof(*a));
  35. if(cudaStat != cudaSuccess) {
  36. printf ("device memory allocation failed");
  37. return EXIT_FAILURE;
  38. }
  39. stat = cublasCreate(&handle);
  40. if(stat != CUBLAS_STATUS_SUCCESS) {
  41. printf ("CUBLAS initialization failed\n");
  42. return EXIT_FAILURE;
  43. }
  44. stat = cublasSetMatrix (M, N, sizeof(*a), a, M, devPtrA, M);
  45. if(stat != CUBLAS_STATUS_SUCCESS) {
  46. printf ("data download failed");
  47. cudaFree (devPtrA);
  48. cublasDestroy(handle);
  49. return EXIT_FAILURE;
  50. }
  51. modify (handle, devPtrA, M, N, , , 16.0f, 12.0f);
  52. stat = cublasGetMatrix (M, N, sizeof(*a), devPtrA, M, a, M);
  53. if(stat != CUBLAS_STATUS_SUCCESS) {
  54. printf("data upload failed");
  55. cudaFree (devPtrA);
  56. cublasDestroy(handle);
  57. return EXIT_FAILURE;
  58. }
  59. cudaFree (devPtrA);
  60. cublasDestroy(handle);
  61. for(j = ; j <= N; j++) {
  62. for(i = ; i <= M; i++) {
  63. printf ("%7.0f", a[IDX2F(i,j,M)]);
  64. }
  65. printf ("\n");
  66. }
  67. free(a);
  68. return EXIT_SUCCESS;
  69. }

cubla sample-code的更多相关文章

  1. android studio2.2 的Find Sample Code点击没有反应

    1 . 出现的问题描述:           右键点击Find Sample Code后半天没有反应,然后提示 Samples are currently unavailable for :{**** ...

  2. 如何将经纬度利用Google Map API显示C# VS2005 Sample Code

    原文 如何将经纬度利用Google Map API显示C# VS2005 Sample Code 日前写了一篇如何用GPS抓取目前所在,并回传至资料库储存,这篇将会利用这些回报的资料,将它显示在地图上 ...

  3. IOS开发苹果官方Sample Code及下载地址

    IOS开发苹果官方Sample Code及下载地址 在线浏览地址:https://developer.apple.com/library/ios/navigation/#section=Resourc ...

  4. OAF Sample Code(转)

    原文地址: OAF Sample Code

  5. Sample Code之Web scene-slides

    这是我的第一篇随笔,在开始正文前说几句. 这个系列会记录我学习Arcgis js API 4.10的全过程,希望能对自己也对其他有需要的人有帮助.很多时候上网看一些大神的帖子会感到一头雾水,一是自己水 ...

  6. sample code java pom.xml

    pom.xml <?xml version="1.0" encoding="UTF-8"?> <project xmlns="htt ...

  7. sqoop sample code

    本文使用的数据库是mysql的sample database employees. download url:https://launchpad.net/test-db/employees-db-1/ ...

  8. Sample Code for Qp_preq_pub.Price_request Api to Simulate an Ask for Promotion Modifier

    DECLARE p_line_tbl QP_PREQ_GRP.LINE_TBL_TYPE; p_qual_tbl QP_PREQ_GRP.QUAL_TBL_TYPE; p_line_attr_tbl ...

  9. 虹软人脸识别Android Sample Code

    AFR_FSDKInterface engine = new AFR_FSDKEngine(); //用来存放提取到的人脸信息, face_1 是注册的人脸,face_2 是要识别的人脸 AFR_FS ...

  10. Apache Flink Training and sample code

    http://training.data-artisans.com/ https://github.com/dataArtisans/blog-post-code-samples https://gi ...

随机推荐

  1. 团体程序设计天梯赛-练习集L2-008. 最长对称子串

    L2-008. 最长对称子串 时间限制 100 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者 陈越 对给定的字符串,本题要求你输出最长对称子串的长度. ...

  2. Quartz任务调度快速入门(转)

    概述 了解Quartz体系结构 Quartz对任务调度的领域问题进行了高度的抽象,提出了调度器.任务和触发器这3个核心的概念,并在org.quartz通过接口和类对重要的这些核心概念进行描述: ●Jo ...

  3. 在WIN32 DLL中使用MFC库遇到的问题

    今天写了一个DLL,DLL中用到的一个类里用到的MSXML的COM组件,所以在DLL中要包含afx.h头文件,也就不可避免的要用到MFC的类库了,但在编译时出现了错误:mfcs42d.lib(dllm ...

  4. POJ 3786 Adjacent Bit Counts (DP)

    点我看题目 题意 :给你一串由1和0组成的长度为n的数串a1,a2,a3,a4.....an,定义一个操作为AdjBC(a) = a1*a2+a2*a3+a3*a4+....+an-1*an.输入两个 ...

  5. HDU4756+Prim

    题意简单:去掉最小生成树的某一条边并补上一条,求MaxVal 思路:贪心(借鉴Yamidie的思路...) 分别求出最小生成树和次最小生成树,再在这两棵树上求最小生成树 #include<std ...

  6. hadoop No FileSystem for scheme: hdfs

    http://stackoverflow.com/questions/17265002/hadoop-no-filesystem-for-scheme-file This is a typical c ...

  7. [itint5]任务调度

    http://www.itint5.com/oj/#10 拓扑排序.首先按照题目给出的数据结构复杂度不会是O(v+e)的,所以先要变换数据结构.二来写的时候用一个stack会更好点.还有就是题目里其实 ...

  8. Android 如何动态改变Actionbar上的item图标

    1.Activity菜单机制 (与dialog类似) Activity有一套机制来实现对菜单的管理,方法如下: 1.public boolean onCreateOptionsMenu(Menu me ...

  9. ColorBox常见问题

    发现colorbox官方网站的troubleshoot写的比较好,转载一下. 1,flash覆盖colorbox: This is not a ColorBox specific problem, b ...

  10. android 电容屏(一):电容屏基本原理篇

    平台信息: 内核:linux3.4.39系统:android4.4 平台:S5P4418(cortex a9) 作者:瘋耔(欢迎转载,请注明作者) 欢迎指正错误,共同学习.共同进步!! 关注博主新浪博 ...