用户
 找回密码
 立即注册
apple_jeep 该用户已被删除
发表于 2014-9-5 14:31:18
65922
我调用的是2维的fft  3维的也试过,但是,得到的执行结果 mkl比fft快10+倍。
下边是我测试得到的数据:

其中200x200是表示fft(200, 200)
执行次数1:代表计时是执行一次fft(200,200)计时
执行次数500:表示计时是对fft(200,200)执行50次计时
线程数(threads):是通过export MKL_NUM_THREADS 调整 mkl 的执行线程数。
左图中是mkl 比 cufft 的加速比。。

cuda官网的测试性能是:

我测到的和官网的结果差异太大了。。
为什么?
测试程序的源代码见附件!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
使用道具 举报 回复
发表于 2014-9-7 20:06:10
楼主用的是什么计算能力的卡?我看你的代码中是double类型的变换。是不是你的卡不支持double类型?
使用道具 举报 回复 支持 反对
发表于 2020-7-29 15:16:23
代码 没法下载了,请问用的什么开发
使用道具 举报 回复 支持 反对
发新帖
您需要登录后才可以回帖 登录 | 立即注册