CUDA架构

下载本文档

阅读 85
下载 13
格式 pdf
大小 989.46 KB
约13页
2025-01-28 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/13页

2/13页

3/13页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/13

文本预览下载提示常见问题

第二章 C U D A 架构 2.1 CUDA 的编程模型 CUDA(Compute Unified Device Architecture)，是一种由NVIDIA 推出的并行计算架构，非常适合大规模数据密集型计算。CUDA 使 GPU 的超高计算性能在数据处理和并行计算等通用计算领域发挥优势。它包含了 CUDA 指令集架构（ISA）以及 GPU 内部的并行计算引擎。随着显卡的发展，GPU 越来越强大，在计算上已经超越了通用的CPU。如此强大的芯片如果只是作为显卡会造成计算能力的浪费，因此 NVIDIA 推出CUDA，让显卡可以用于图像渲染以外的目的。CUDA的GPU 编程语言基于标准的C 语言，通过在标准 C 语言的基础上增加一小部分关键字，任何有 C 语言基础的用户都很容易地开发 CUDA 的应用程序。CUDA3.0 已经开始支持 C++和 FORTRAN。 2.1.1 主机和设备 CUDA 编程模型在设计结构上采用了异构编程的模式，将CPU 作为宿主(Host)，GPU作为设备(Device)，在同一个系统中可以有同时存在多个设备，但是只能有一个宿主。在 CUDA 程序架构中，主程序由CPU 来执行，而当遇到数据并行处理的部分，CUDA 就会将程序编译成 GPU 能执行的程序，并传送到GPU。CUDA 使用被称为块（Block）的单元，每个块都由一些CUDA 线程组成，线程是CUDA 中最小的处理单元，将这些较小的子问题进一步划分为若干更小的细粒度的问题，我们便可以使用线程来解决这些问题了。对于一个普通的NVIDIA GPU，其 CUDA 线程数目通常能达到数千个甚至更多，因此，这样的问题划分模型便可以成倍地提升计算机的运算性能。GPU 是由多个流水多处理器构成的，流水处理器以块（Block）为基本调度单元，因此，对于流水处理器较多的GPU，它一次可以处理的块（Block）更多，从而运算速度更快，时间更短。而反之对于流水处理器较少的GPU，其运算速度便会较慢。 CUDA C 是C 语言的一个扩展，它允许程序员定义一种被称为内核函数（Kernel Functions）的C 函数，内核函数运行在 GPU 上，一旦启动，CUDA 中的每一个线程都将会同时并行地执行内核函数中的代码。内核函数使用关键字__global__来声明，运行该函数的CUDA 线程数则通过<<<...>>>执行...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

CUDA架构

第二章 C U D A 架构 2

1 CUDA 的编程模型 CUDA(Compute Unified Device Architecture)，是一种由NVIDIA 推出的并行计算架构，非常适合大规模数据密集型计算

CUDA 使 GPU 的超高计算性能在数据处理和并行计算等通用计算领域发挥优势

它包含了 CUDA 指令集架构（ISA）以及 GPU 内部的并行计算引擎

随着显卡的发展，GPU 越来越强大，在计算上已经超越了通用的CPU

如此强大的芯片如果只是作为显卡会造成计算能力的浪费，因此 NVIDIA 推出CUDA，让显卡可以用于图像渲染以外的目的

CUDA的GPU 编程语言基于标准的C 语言，通过在标准 C 语言的基础上增加一小部分关键字，任何有 C 语言基础的用户都很容易地开发 CUDA 的应用程序

0 已经开始支持 C++和 FORTRAN

1 主机和设备 CUDA 编程模型在设计结构上采用了异构编程的模式，将CPU 作为宿主(Host)，GPU作为设备(Device)，在同一个系统中可以有同时存在多个设备，但是只能有一个宿主

在 CUDA 程序架构中，主程序由CPU 来执行，而当遇到数据并行处理的部分，CUDA 就会将程序编译成 GPU 能执行的程序，并传送到GPU

CUDA 使用被称为块（Block）的单元，每个块都由一些CUDA 线程组成，线程是CUDA 中最小的处理单元，将这些较小的子问题进一步划分为若干更小的细粒度的问题，我们便可以使用线程来解决这些问题了

对于一个普通的NVIDIA GPU，其 CUDA 线程数目通常能达到数千个甚至更多，因此，这样的问题划分模型便可以成倍地提升计算机的运算性能

GPU 是由多个流水多处理器

小辰4 + 关注: 实名认证
内容提供者

出售各种资料和文档

收藏店铺进入空间

CUDA架构

CUDA架构

您可能关注的文档

相关文档

热门下载

相关标签