1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
碎片内容
CUDA 寄存器是由()
Grid 中所有线程共享B
一个 Block 中所有线程共享C
一个 Warp 中所有线程共享D
每个线程独享答案:D2
SIMD 并行化时遇到对齐问题,高效的处理方法是()
直接使用 SIMD 不对齐访存指令B
将数据拷贝到对齐的内存地址C
重写算法保证对齐访问D
串行处理到对齐边界,然后进行 SIMD 对齐访存答案:D3
使用一个信号量实现“主线程等待 4 个从线程完成任务”,信号量初始值应设置为()
4答案:A4
对这样的循环 for(i=0;i
该用户很懒,什么也没介绍