|
发表于 2013-7-26 17:07:36 28451
有一个比较小的问题想请教一下大家
我的数据的size是2000,因为要并行计算,所以就直接开了一个kernel,给的kernel function的参数是<<<2000,1>>>,
就是我是直接用了2000个block,每个block里面只有一个thread。
如果我把kernel function的参数设置为<<<10,200>>> 的话,是否运行会更快一些?
但是我的kernel里面的计算 并没有设计到thread之间的通信。
所以想问问。怎样的选择会更好?
谢谢.

|
|