用户
 找回密码
 立即注册
发表于 2022-2-16 21:07:49
41090
本帖最后由 wangzyon 于 2022-2-16 21:09 编辑

cuda核做矩阵乘法,用共享内存做缓存,为什么一维共享内存要优于二维共享内存(实验1优于实验2)?为什么二维共享内存做内存填充,性能反而下降(实验3劣于实验2)?启动核函数时线程块划分都一样

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
使用道具 举报 回复
发新帖
您需要登录后才可以回帖 登录 | 立即注册