CUDA 共享内存的 Bank Conflict 实例分析与优化-伙伴云

CUDA 共享内存的 Bank Conflict 实例分析与优化

网友投稿 1301 2022-05-29

CUDA 共享内存的 Bank Conflict 实例分析与优化

引言

cuda 将 shared memory 按照 4 字节或 8 字节（默认 4 字节，可以设置为 8 字节）被划分到 32 个 bank （楼）中，不同 bank 之间的内存能同时读写，但是同一个 bank 的不同地址（同一栋楼的不同层）的数据则只能串行读写（如果是同一个 bank 的同一个地址则可以 broadcast，不会出现 bank conflict），因此当同一个 warp 的线程去访问 shared memory 数据时，如果有两个以上线程访问了同一个 bank 的不同地址的数据，就会产生多余的内存事务（transaction）请求（后面有具体实例图示）影响程序的性能.

假设在共享内存上申请了 1024 个 float 数据 —— __shared__ float data[32][32]，由于每个 float 正好是 4 字节，且 data 按行存储，则 data[0][0] 就位于第 0 个bank，data[0][1] 位于第 1 个 bank，以此类推 data[row][col] 就被划分在了第 col 个 bank 中，即 col 相同的数据划分至了同一个 bank 的不同地址上。如果一个 warp 的线程按 col 处理 data 那么就会造成 bank conflict.

任务调度

即时通讯系统搭建的必要性与AI优化策略探讨

1301 2022-05-29

CUDA 共享 内存的 Bank Conflict 实例分析与优化

即时通讯系统搭建的必要性与AI优化策略探讨

轻松搭建网盘系统，实现文件共享与安全存储的完美结合

论坛系统搭建的实用指南与技巧，助你构建高效互动平台

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜

智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

什么是在线文档？怎么发在线文档

家居定制平台是什么？

友情链接

CUDA 共享内存的 Bank Conflict 实例分析与优化

微信扫一扫：分享

推荐文章

最近发表

热评文章

友情链接