实用标准文案精彩文档NvidiaGPU性能对比目前Nvidia推出支持CUDA架构用GPU运算的图形处理器分别:GeForce系列、Quadro系列、及专业GPUTesle系列。从价格上来排序为GeForce最便宜为Tesla的1/2不到。Quadro价格比Tesla更高暂不评测。从Nvidia推出GPU运算以来,很多专业人士就不断尝试用GeForce显卡来做GPU运算,核心数量一样,价格有很大优势,从表面上看就是内存好像比Tesla少了些。究竟性能如何来看一下,下面测试GeForceGTX470性能测试。GeForceGTX470参数:下面用GPU基准测试软件对GTX470各个方面进行了测试,NvidiaGTX470单精度浮点运算性能为1049Gflops,而TeslaC2050的单精度浮点运算为1.03Tflops,说明在单精度浮点运算方面GTX470与C2050性能相当。实用标准文案精彩文档下面再在对比一下双精度浮点运算。由下图可能看出GTX470的双精度浮点运算为134Gflops,是单精度浮点运算的1/8,我们再来看一下C2050的双精度浮点运算为515Gflops.由此可见Nvidia采用Fermi架构后双精度浮点运算能力C2050要远远大于GTX470。下面再来看一下GTX470其它方面的性能实用标准文案精彩文档实用标准文案精彩文档TeslaC2O50参数实用标准文案精彩文档GTX470与C2050硬件参数对比GTX470C2050CUDA核心数量448448CUDA核心频率1.2GHZ1.15GHZ单精度浮点性能(峰值)1.04Tflops1.03Tflops双精度浮点性能(峰值)134Gflops515Gflops专用存储器容量1.28GBGDDR53GBGDDR5专用存储器频率1.67GHZ1.5GHZ专用存储器带宽133GB/秒144GB/秒由上图对比可以看出GTX470与C2050除内存不同、与内存带宽不同其它几乎相同。而Nvidia为什么推出专业的GPU运算处理器Tesla系列,而不采用GeForce显卡来做并行运算呢?而TeslaC2050系列处理器将近GeForceGTX470价格的三倍,到底不何不同呢?根据测试及Nvidia官方资料做出了以下总结:首先,Tesla系列比GeForce系列内存要高出一倍,而通过CUDA开发的程序要做一个并行运算,首先要把数据调入显存,显存与GPU的每个核心交换数据,这样显卡的内存越大对大规模的并行运算程序越好。运行小程序中表现不出来。通过以上测试GeForce显卡双精度浮点运算约为单精度浮点运算的1/8,而TeslaFermi系列双精度约为单精度的1/2.这是因为Nvidia设计不同,GeForce采用了openGL图形加速度技术。而降低的双精度浮点运算的性能。Tesla不支持openGL加速度技术,而增强的双精度浮点运算性能。Geforce显卡还支持3D立体幻影、NVIDIAPureVideo等。Tesla支持异步传输、并行datacache技术等,由此可见GeForce专为图形处理而设计,Tesla专为并行运算而设计。.建议用户在选择购买GPU时根据需求来选择是用Tesla还是GeForce。如果你是企业用户主要工作处理大规模地震资料,石油及天燃汽应用最好选择Tesla系统,因为这些程序所处理的数据一般为TB甚至PB的海量数据,需要大容量内存支持。如果你所应用程序为分子动力学等软件,可选择采用GeForce系列。选择Geforce时为能达到高的稳定性最好选择降频使用。