用户
 找回密码
 立即注册
发表于 2011-9-28 18:39:42
Edward_kula 发表于 2011-9-20 11:03
如何针对一个给定的程序进行优化?
另外,如何确定grid block thread数目,
以及如何确定使用哪种内存? ...

得看并行算法
使用道具 举报 回复 支持 反对
发表于 2011-9-28 18:41:28
朕醒中华 发表于 2011-9-21 08:24
使用VisualStudio开发CUDA程序时,为什么会发生Debug与Release下编译成功的程序执行结果不一样哪?Debug执行 ...

Debug会默认为没有初始化的参数赋初值0
Release不会为这些值赋0
我觉得你程序有bug,可能不注意的bug
使用道具 举报 回复 支持 反对
发表于 2011-9-28 18:42:03
hypermusic 发表于 2011-9-21 14:15
请问进行CUDA编程该选择什么显卡?
我指服务器上使用,用GTX460/560是否可以,性能与Tesla组合差多少

可以用,不过性能会比tesla差一些,大概多少得看核心数目和频率
使用道具 举报 回复 支持 反对
发表于 2011-9-28 18:42:31
zhyihao66 发表于 2011-9-21 16:28
请问偏向研究性质的情况下,应该使用什么样的N卡?

游戏卡就可以了,Geforce的卡就可以
使用道具 举报 回复 支持 反对
发表于 2011-9-28 18:44:06
zhongliangv 发表于 2011-9-22 08:46
Nexus开发环境现在能用吗?能用的话,能否介绍一下其使用啊?谢谢你啊。

现在叫Nsight吧?可以用了
使用道具 举报 回复 支持 反对
发表于 2011-9-28 18:53:05
zhongliangv 发表于 2011-9-22 16:05
你好,我有几个问题:1. Fermi所谓的“分支预测”是如何处理的?2. Fermi中同时调度两个warp,一个warp使用 ...

1.Fermi里面支持的是分支断定,不是分支预测,这个只能说是分支预测的雏形
2.这个没变
3.可以这么理解,以前是每一个block都需要占用的资源比较多,需要一个执行完了再执行下一个,现在fermi能提供更多的资源
使用道具 举报 回复 支持 反对
发表于 2011-9-28 18:53:15
myisland 发表于 2011-9-24 18:45
请问在学习CUDA之前需要有哪些方面的知识作为基础?

C语言编程基础
使用道具 举报 回复 支持 反对
发表于 2011-9-28 20:23:39
本帖最后由 zhongliangv 于 2011-9-28 20:24 编辑
OpenHero 发表于 2011-9-28 18:53
1.Fermi里面支持的是分支断定,不是分支预测,这个只能说是分支预测的雏形
2.这个没变
3.可以这么理解, ...


您好,最后还想问您个问题,就是第二个问题,您的回答是说Fermi中一个warp的执行和以前一样也是需要4个时钟周期,那么是如何执行的呢?是不是还是使用8个sp来执行呢?如果是的话,那么并发的双warp就占用2*8=16个sp,那么岂不是剩余的16个sp是闲置的?
总结一句话,我想咨询的就是32个Core是如何被充分使用的?
期待您的回复。非常感谢
使用道具 举报 回复 支持 反对
发表于 2011-9-28 23:33:42
使用道具 举报 回复 支持 反对
发表于 2011-9-29 10:49:03
在cuda by emaple的最后的附录中有一个哈希锁
但我发现数据很大时,比方100万
哈希锁是会崩溃的
感觉是竞争同一个锁的线程太多的问题
例子中用了for(i = 0; i < 32; i++) tid % 32 == i
这个循环的方法来解决
但似乎数据很大时依然会崩溃

比方,我想在一个数组中插入元素
要保证一个接一个的插入
不用锁,似乎很难
因为要维护一个索引变量
使用道具 举报 回复 支持 反对
您需要登录后才可以回帖 登录 | 立即注册