CUDA 寄存器是由()
Grid 中所有线程共享 B
一个Block 中所有线程共享 C
一个Warp 中所有线程共享 D
每个线程独享 答案:D 2
SIMD 并行化时遇到对齐问题,高效的处理方法是()
直接使用SIMD 不对齐访存指令 B
将数据拷贝到对齐的内存地址 C
重写算法保证对齐访问 D
串行处理到对齐边界,然后进行SIMD 对齐访存 答案:D 3
使用一个信号量实现“主线程等待4 个从线程完成任务”,信号量初始值应设置为()
4 答案:A 4
对这样的循环for(i=0; i1 D
可能随着处理器数量增大趋向于0 答案:B 11
SSE intrinsics_mm_store_sd 命令的功能是()
对齐向量存单精度浮点数 B
未对齐向量存单精度浮点数 C
对齐标量存双精度浮点数 D
未对齐标量存双精度浮点数 答案:C 12
和一对多广播对应的组通信操作是()
多对一收集 B
多对多收集 C
多对一归约 D
多对多归约 答案:C 13
对一个串行程序进行SIMD 并行化,应重点考虑的程序部分是()
声明语句 B
条件分支语句 C
循环语句 D
输入输出语句 答案:C 14
若SIMD 并行化时遇到对齐问题,下列说法正确的是()
只能使用不对齐访存指令 B
不能进行SIMD 并行化 C
对齐开销可能完全抵消SIMD 并行收益 D
以上皆错 答案:C 15
使用()无法直接实现“主线程唤醒4 个从线程去执行任务”
1 个信号量 B
1 个互斥量 D
4 个互斥量 答案:C 16
在使用条件变量时,还需配套使用一个()