tonycdy1991 发表于 2013-9-9 11:18 
各位网友及版主好!
我有一个问题:如何测试一个实际 CUDA程序的浮点计算速度,就是前面说的GFlop/s衡量的 ...
楼主您好,
新问题请新开贴。
这个数据需要您自己计算:
(1)统计您每个线程的计算次数
(2)将此值乘以您的线程总数
(3)统计出总时间(利用profiler或者自己计时),将2中的值(所有线程的计算次数)除以计算时间,您将得到每秒的计算次数。
(4)因为3中的值往往较大,所以大家一般使用GFlops来衡量(Giga float operations per second),
1G次运算 = 10 ^ 9次方次运算。
感谢来访(请注意开头的话)。 |