用户
 找回密码
 立即注册
LJF 该用户已被删除
发表于 2012-11-3 16:34:03
18131
怎么让nvcc输出device或是global函数所使用的register数量?
使用道具 举报 回复
发表于 2012-11-3 16:42:58
请在编译时加上--ptxas-options=-v选项
或者用visual profile运行一次你的CUDA程序,visual profile将会非常详细的给出你的内核执行情况:包括register使用量,shared memory使用情况,global memory访问性能等
使用道具 举报 回复 支持 反对
发新帖
您需要登录后才可以回帖 登录 | 立即注册