高性能计算练习题1、一下哪种编程方式适合在单机内并行
哪种适合在多机间并行
单机:Threading线程、OpenMP;多机:MPI
2、例题:HPC集群的峰值计算能力:一套配置256个双路X5670处理器计算节点的HPC集群
X5560:2
93GHzIntelXS5670Westmere六核处理器,目前主流的Intel处理器每时钟周期提供4个双精度浮点计算
峰值计算性能:2
93GHz*4Flops/Hz*6Core*2CPU*256节点=36003
8GFlops
Gflops=10亿次,所以36003Gflops=36
003TFlops=36
003万亿次每秒的峰值性能
3、Top500排名的依据是什么
HighPerformanceLinpack(HPL)测试结果4、目前最流行的GPU开发环境是什么
CUDA5、一套配置200TFlops的HPC集群,如果用双路2
93GHzIntelwestmere六核处理器X5670来构建,需要用多少个计算节点
计算节点数=200TFlops/(2*2
93GHz*6*4Flops/Hz)=14226、天河1A参与TOP500排名的实测速度是多少,效率是多少
57PFlops55%7、RDMA如何实现
RDMA(RemoteDirectMemoryAccess),数据发送接收时,不用将数据拷贝到缓冲区中,而直接将数据发送到对方
绕过了核心,实现了零拷贝
8、InfiniBand的最低通讯延迟是多少
3usecMPIend-to-end,0
9-1usInfiniBandlatencyforRDMAoperations9、GPU-Direct如何加速应用程序运行速度
通过除去InfiniBand和GPU之间的内存拷贝来加速程序运行
GPUsprovidecosteffectivewayforbuildingsup