0_Simple__fp16ScalarProduct】的更多相关文章

使用cuda内置无符号整数结构(__half2)及其汇编函数,计算两个向量的内积. 源代码: #include <cstdio> #include <cstdlib> #include <ctime> #include "cuda_runtime.h" #include "device_launch_parameters.h" #include "cuda_fp16.h" #include "help…