南开大学20秋《并行程序设计》在线作业

下载本文档

阅读 165
下载 26
格式 docx
大小 21.17 KB
约11页
2025-05-03 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/11页

2/11页

3/11页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/11

文本预览下载提示常见问题

l.SSEintrinsics_mm_store_ps 命令的功能是()。A. 对齐向量存单精度浮点数B. 未对齐向量存单精度浮点数C. 对齐标量存单精度浮点数D. 未对齐标量存单精度浮点数答案：A2. for(i=0;i<16;i+=l){L 二 A[i+0]-B[i+0];D 二 D+abs(L);}，此循环()。A. 可完全向量化B. 不可向量化C. 不确定D. 可部分向量化答案：D3. 对这样的循环 for(i=0;i<100;i+=l)A[i+0]=A[i+0]+B[i+0];进行向量化，基本技术手段是()。A. 循环划分B. 循环消除C. 循环展开D. 以上皆错答案：C4. MMX 有()个专用寄存器。A. 4B. 8C. 16D. 32答案：B5•编译器编译 OpenMP 并行循环时，会自动生成一些代码，其中不包括()。A. 创建和管理线程代码B. 循环划分给线程的代码c.找出数据依赖的代码D.线程同步的代码答案：C6. 创建线程时，我们通过()将线程号分别传递给每个线程A. 全局变量B. 局部变量C. 动态分配变量D. pthread_create 的“线程函数参数”参数答案：D7. 下列哪项不是这门课程的目标?()A. 学会肯定能优化程序性能的方法B. 学会用并行思维思考问题C. 学会常用的并行编程工具D. 理解软件到并行架构的映射答案：A8. 编写 n 个数求和的 OpenMP 程序，最高效的方法是()。A. 多线程直接并发累加到共享变量B. 将累加操作设置为临界区C. 在累加操作前设置障碍D. 采用归约指令答案：D9. 静态线程编程模式的缺点是()。A. 线程管理开销高B. 系统资源利用率低C. 线程负载不均D. 线程通信开销高答案：B10. 采用 MPI 主从模型解决矩阵每行排序问题，主进程每次向一个从进程发送 10 行作为一个任务相对于每次发送 1 行的优点是()。A. 更有利于负载均衡B. 减少了通信开销C. 降低了计算次数D. 减少了从进程空闲答案：B11.MPI 收发各一条消息的 API 是()。A. MPI_SendrecvB. MPI_SendC. MPI_RecvD. MPI_Replace答案：A12.两个矩阵相乘，若矩阵规模大于 cache 大小，则优化访存的可行方法是()。A. 先将两个矩阵读入 cache 再进行乘法B. 先转置第一个矩阵再进行乘法C. 先转置第二个矩阵再进行乘法D. 以上皆错答案：C13. 多个线程进行并行求和，每个线程将自己负责的值依次读入局部变量 x,累加到全局变量 sum 上，sum+=x，对此，下面说法正确的是()。A. 读取 x 存在数据依赖，不能并发进行B. 累加顺序被改变，结果是错误的C. 加法操作是简单运算，无需同步D. 加法操作不是原子操作，需要同步保证数据依赖答案...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容