论坛
BBS
会员中心
Space
用户
登录
用户名
Email
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
本版
帖子
用户
本版
帖子
用户
CUDA
技术
工具
资源
入门
社区
论坛
开启辅助访问
切换到宽版
好友
帖子
收藏
道具
勋章
任务
设置
我的收藏
退出
腾讯QQ
微信登录
论坛
›
社区信息
›
灌水驿站
›
查看内容
发表新帖
查看:
3384
|
回复:
1
怎么让nvcc输出device或是global函数所使用的register数量?
LJF
该用户已被删除
LJF
|
显示全部楼层
|
阅读模式
1
#
电梯直达
发表于 2012-11-3 16:34:03
3384
1
怎么让nvcc输出device或是global函数所使用的register数量?
使用道具
举报
回复
tianyuan08
|
显示全部楼层
2
#
发表于 2012-11-3 16:42:58
请在编译时加上--ptxas-options=-v选项
或者用visual profile运行一次你的CUDA程序,visual profile将会非常详细的给出你的内核执行情况:包括register使用量,shared memory使用情况,global memory访问性能等
使用道具
举报
回复
支持
反对
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
发表回复