发表新帖
ice 发表于 2013-5-2 23:32 LZ您好,您不妨用NVVP跑一下,看看有什么提示没有。再根据NVVP的结果,调整您的代码,或者能有所启示。 ...
iHakka 发表于 2013-5-3 00:46 我用GTX 650 下指令nvcc *.cu -arch=sm_30 float跑出來是 18.876352/542.477690
横扫千军 发表于 2013-5-3 03:57 无法理解了。好奇怪的。 以及,建议第二个kernel进行#pragma unroll下。循环体太小。
dyanwithu 发表于 2013-5-3 12:20 您好, 刚才我又试了一下,没有用visual studio 2010 自己在命令行里编译 nvcc kernel.cu -arch=sm_21
yixi 发表于 2013-5-3 12:25 根据您的回复,个人猜测您之前在VS2010中可能用debug模式编译运行的。 故建议您尝试下在VS2010中用releas ...
dyanwithu 发表于 2013-5-3 12:26 谢谢,是用debug模式运行的,会有很大的区别吗?why?
yixi 发表于 2013-5-3 12:28 debug是调试模式,为了调试,必然会加入一些“额外”的代码(更具体的我也不清楚,期待横扫版主更详细的回 ...
dyanwithu 发表于 2013-5-3 12:30 根据您的建议,切换到release模式下运行,果然速度有了很大的提升。 请教一下您,debug/release为什么会 ...
yixi 发表于 2013-5-3 12:33 我知道的已经再16#说清楚了。我VS用的也不是很多。更多的内容。可以等横扫或者ICE版主回答。(我属实不清 ...