发表新帖
横扫千军 发表于 2013-7-4 13:25 楼主您好: 一般说数据较大较好,较小反而不容易体现出速度(因为各种开销和您的实际计算比起来份额较大了 ...
maifen 发表于 2013-7-4 15:40 问题是如果需要的计算超过了硬件所具备的计算资源,在GPU上实际也变成了轮流占有SM的串行执行方式,这样 ...
横扫千军 发表于 2013-7-4 17:15 显然不会, 如果您的算法只占用一个SM(假设该卡10个SM), 显然最多只能发挥出10%的显卡的峰值性能。
maifen 发表于 2013-7-4 19:56 这么说吧,如果有10个SM,我的程序占有1个,那么此时我的加速比(跟串行CPU相比)确实不是最高,如果我的 ...