▶ <大规模并行处理器编程实战>第15章,关于OpenACC 的部分,散点 ● OpenACC 中,主机存储器和设备存储器是分开处理的,程序员只要制定要传输的存储器对象即可,编译器会自动生成存储器的分配.复制和释放的代码 ● OpenACC 不提供任何在执行单元之间的同步机制,只有在线程分支和聚合的时候才进行存储器栅栏同步(唯一的同步方式) ● 使用 parallel 构件时,OpenACC 会在加速器的上创建多个 gang 来执行并行域,每个 gang 默认状态下只有一个 worker(称为…