本帖最后由 yht1120 于 2013-11-28 12:09 编辑
谢版主了
GPU代码的计时如下
cudaEventRecord(start,0);
DataCopyGPU<<<10000,1024>>>(pBufChar_D,pBufFloat_D);
cudaEventRecord(stop,0);
cudaEventSynchronize(stop);
cudaEventElapsedTime(&elapsedTime,start,stop);
CPU代码的计时如下
QueryPerformanceCounter(&Lstart);
DataCopyCPU(pBufChar,pBufFloat,10000*1024);
QueryPerformanceCounter(&Lend);
elapsedTime=(float)(Lend.QuadPart-Lstart.QuadPart)/Frequency.QuadPart*1e3;
这两段计时代码好像没什么问题吧,都是在论坛上搜到的 |