电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

高性能计算习题及答案教材VIP免费

高性能计算习题及答案教材_第1页
1/15
高性能计算习题及答案教材_第2页
2/15
高性能计算习题及答案教材_第3页
3/15
高性能计算练习题1、一下哪种编程方式适合在单机内并行?哪种适合在多机间并行?单机:Threading线程、OpenMP;多机:MPI。2、例题:HPC集群的峰值计算能力:一套配置256个双路X5670处理器计算节点的HPC集群。X5560:2.93GHzIntelXS5670Westmere六核处理器,目前主流的Intel处理器每时钟周期提供4个双精度浮点计算。峰值计算性能:2.93GHz*4Flops/Hz*6Core*2CPU*256节点=36003.8GFlops。Gflops=10亿次,所以36003Gflops=36.003TFlops=36.003万亿次每秒的峰值性能。3、Top500排名的依据是什么?HighPerformanceLinpack(HPL)测试结果4、目前最流行的GPU开发环境是什么?CUDA5、一套配置200TFlops的HPC集群,如果用双路2.93GHzIntelwestmere六核处理器X5670来构建,需要用多少个计算节点?计算节点数=200TFlops/(2*2.93GHz*6*4Flops/Hz)=14226、天河1A参与TOP500排名的实测速度是多少,效率是多少?2.57PFlops55%7、RDMA如何实现?RDMA(RemoteDirectMemoryAccess),数据发送接收时,不用将数据拷贝到缓冲区中,而直接将数据发送到对方。绕过了核心,实现了零拷贝。8、InfiniBand的最低通讯延迟是多少?1-1.3usecMPIend-to-end,0.9-1usInfiniBandlatencyforRDMAoperations9、GPU-Direct如何加速应用程序运行速度?通过除去InfiniBand和GPU之间的内存拷贝来加速程序运行。?GPUsprovidecosteffectivewayforbuildingsupercomputers【GPUs提供高效方式建立超级计算机】?Densepackagingofcomputeflopswithhighmemorybandwidth【使用高端内存带宽的密级封装浮点计算】10、网络设备的哪个特性决定了MPI_Allreduce性能?集群大小,TimeforMPI_Allreducekeepsincreasingasclustersizescales,也就是说集群的规模决定了MPI_Allreduce的性能。11、现排名世界第一的超级计算机的运行速度?Kcomputer:10PFlops也就是10千万亿次,93%12、以下哪些可以算作是嵌入式设备:A路由器B机器人C微波炉D笔记本电脑13、选择嵌入式操作系统的头两个因素是:A成本B售后服务C可获得源代码D相关社区E开发工具14、构建嵌入式Linux的主要挑战是:A需要广博的知识面B深度定制的复杂性C日益增加的维护成本D稳定性与安全性E开源项目通常质量低下15、TheYoctoProject的主要目的是:A.构建一个统一的嵌入式Linux社区B.提供高质量的工具帮助你轻松构建嵌入式Linux,从而专注于其上的研究工作C.包括一组经过测试的metadata,指导最核心的一些开源项目的交叉编译过程D.提供灵活的扩展接口,可以方便的导入新的项目,或是新的板级支持包(BSP)16、请描述交叉编译一个开源项目需要完成哪些工作?Patch-Configure-Compile-Install-Sysroot-Package-Do_rootfs17.Top500排名的依据是什么?答:HighPerformanceLinpack(HPL)测试结果18.Writecodestocreateathreadtocomputethesumoftheelementsofanarray.答:Createathreadtocompletethesumoftheelementsofanarray.structarguments{double*array;intsize;double*sum;}intmain(intargc,char*argv){doublearray[100];doublesum;pthread_tworker_thread;structarguments*arg;arg=(structarguments*)calloc(1,sizeof(structarguments));arg->array=array;arg->size=100;arg->sum=∑if(pthread_create(&worker_thread,NULL,do_work,(void*)arg)){fprintf(stderr,”Errorwhilecreatingthreadn”);exit(1);}...}void*do_work(void*arg){structarguments*argument;inti,size;double*array;double*sum;argument=(structarguments*)arg;size=argument->size;array=argument->array;sum=argument->sum;*sum=0;for(i=0;i

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

高性能计算习题及答案教材

确认删除?
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群