第6章并行处理机和相联处理机第6章阵列处理机6.1阵列处理机的原理6.2SIMD计算机的互连网络6.3共享主存构形阵列处理机中并行存储器的无冲突访问6.4脉动阵列处理机第6章并行处理机和相联处理机6.1并行处理机原理6.1.1阵列处理机的构形和特点1.阵列处理机的构形阵列处理机有两种构形,差别主要在于存储器的组成方式和互连网络的作用不同。图6-1是采用分布式存储器的阵列处理机构形。第6章并行处理机和相联处理机图6-1具有分布式存储器的阵列处理机构形第6章并行处理机和相联处理机为了高速有效地处理向量数据,这种构形要求能把数据合理地预分配到各个处理单元的局部存储器中,使各处理单元PEi主要用自己的局存PEMi中的数据运算。分布于各PEM的数据,可以经系统数据总线从外部输入,也可以用控制总线经控制部件播送。在执行向量指令时,可使用屏蔽位向量控制,让某些PE不工作(不活跃)。运算中,PE间可通过互连网络(InterconnectionNetwork,ICN)来交换数据。互连网络的连通路径选择也由控制部件统一控制。第6章并行处理机和相联处理机处理单元阵列通过控制部件接到管理处理机SC上。管理处理机是一种通用机,用于管理系统资源,完成系统维护、输入/输出、用户程序的汇编及向量化编译、作业调度、存储分配、设备管理、文件管理等操作的功能。因此包括处理单元阵列、互连网络和控制部件在内的阵列处理部分,可以看成是系统的后端处理机。采用这种构形的阵列处理机是SIMD的主流。典型机器有ILLIACⅣ、MPP、DAP、CM-2、MP-1、DAP600系列等。第6章并行处理机和相联处理机图6-2是采用集中式共享存储器的阵列处理机构形。系统存储器是由K个存储分体(MM0~MMK-1)集中组成,经互连网络ICN为全部N个处理单元(PE0~PEN-1)所共享。为使各处理单元对长度为N的向量中各个元素都能同时并行处理,存储分体个数K应等于或多于处理单元数N。各处理单元在访主存时,为避免发生分体冲突,也要求有合适的算法能将数据合理地分配到各个存储分体中。第6章并行处理机和相联处理机图6-2具有集中式共享存储器的阵列处理机构形第6章并行处理机和相联处理机与分布式存储器构形不同的另一个地方是互连网络ICN的作用不同。其互连网络是用于在处理单元与存储器分体之间进行转接构成数据通路,希望各处理单元能高速灵活地动态与不同的存储分体相连,使尽可能多的PE能无冲突地访问共享的主存模块。因此有的阵列处理机称它为对准网络(AlignmentNetwork)。采用这种构形的典型机器有BSP。第6章并行处理机和相联处理机2.并行处理机的特点并行处理机的单指令流多数据流处理方式和由它产生的特殊结构是以诸如有限差分、矩阵、信号处理、线性规划等一系列计算问题为背景发展起来的。这些计算问题的共同特点是可以通过各种途径把它们转化成为对数组或向量的处理,而并行处理机正好利用多个处理单元对向量或数组所包含的各个分量同时计算,从而获得很高的处理速度。与同样擅长于向量处理的流水线处理机相比,并行处理机利用的是资源重复,而不是时间重叠;利用并行性中的同时性,而不是并发性。它的每个处理单元要同等地担负起各种运算功能,但其设备利用率却可能没有多个单功能流水线部件那样高。因此,只有在硬件价格有了大幅度下降及系统结构有了较大改进的情况下,并行处理机才能具有较好的性能价格比。并行理机主要是靠增大处理单元个数来提高运算速度,比起向量流水线处理机主要依靠缩短时钟周期来说,速度提高的潜力要大得多。第6章并行处理机和相联处理机与流水线处理机不同的另一方面是阵列处理机使用简单规整的互连网络来确定处理单元间的连接。互连网络的结构形式限定了阵列处理机可用的解题算法,也会对系统多种性能指标产生显著影响,因此,互连网络的设计是重点。阵列处理机在机间互连上比固定结构的单功能流水线灵活,使相当一部分专门问题上的工作性能比流水线处理机高得多,专用性强得多。如果习惯上把流水线处理机归属于通用计算机的话,阵列处理机则被看成是一种专用计算机,它是以一定数量的专门算法为背景的。另一方面,由于总希望阵列处理机解题算法的适应性更强一些,应用面更广一些,因此,与...