l.SSEintrinsics_mm_store_ps 命令的功能是()。A. 对齐向量存单精度浮点数B. 未对齐向量存单精度浮点数C. 对齐标量存单精度浮点数D. 未对齐标量存单精度浮点数答案:A2. for(i=0;i<16;i+=l){L 二 A[i+0]-B[i+0];D 二 D+abs(L);},此循环()。A. 可完全向量化B. 不可向量化C. 不确定D. 可部分向量化答案:D3. 对这样的循环 for(i=0;i<100;i+=l)A[i+0]=A[i+0]+B[i+0];进行向量化,基本技术手段是()。A. 循环划分B. 循环消除C. 循环展开D. 以上皆错答案:C4. MMX 有()个专用寄存器。A. 4B. 8C. 16D. 32答案:B5•编译器编译 OpenMP 并行循环时,会自动生成一些代码,其中不包括()。A. 创建和管理线程代码B. 循环划分给线程的代码c.找出数据依赖的代码D.线程同步的代码答案:C6. 创建线程时,我们通过()将线程号分别传递给每个线程A. 全局变量B. 局部变量C. 动态分配变量D. pthread_create 的“线程函数参数”参数答案:D7. 下列哪项不是这门课程的目标?()A. 学会肯定能优化程序性能的方法B. 学会用并行思维思考问题C. 学会常用的并行编程工具D. 理解软件到并行架构的映射答案:A8. 编写 n 个数求和的 OpenMP 程序,最高效的方法是()。A. 多线程直接并发累加到共享变量B. 将累加操作设置为临界区C. 在累加操作前设置障碍D. 采用归约指令答案:D9. 静态线程编程模式的缺点是()。A. 线程管理开销高B. 系统资源利用率低C. 线程负载不均D. 线程通信开销高答案:B10. 采用 MPI 主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送 10 行作为一个任务相对于每次发送 1 行的优点是()。A. 更有利于负载均衡B. 减少了通信开销C. 降低了计算次数D. 减少了从进程空闲答案:B11.MPI 收发各一条消息的 API 是()。A. MPI_SendrecvB. MPI_SendC. MPI_RecvD. MPI_Replace答案:A12.两个矩阵相乘,若矩阵规模大于 cache 大小,则优化访存的可行方法是()。A. 先将两个矩阵读入 cache 再进行乘法B. 先转置第一个矩阵再进行乘法C. 先转置第二个矩阵再进行乘法D. 以上皆错答案:C13. 多个线程进行并行求和,每个线程将自己负责的值依次读入局部变量 x,累加到全局变量 sum 上,sum+=x,对此,下面说法正确的是()。A. 读取 x 存在数据依赖,不能并发进行B. 累加顺序被改变,结果是错误的C. 加法操作是简单运算,无需同步D. 加法操作不是原子操作,需要同步保证数据依赖答案...