请问 (如果是我的问题没有说清,或者是概念出现问题请在放入灌水区之前能否提醒我一下,谢谢)
我在参照CUDA5.0自带的例子CUDA Sample中的simpleStreams进行学习的时候,发现这句
cudaMemcpyAsync(hAligned_a, d_a, nbytes, cudaMemcpyDeviceToHost, streams[0]);为什么出现在kernel函数
init_array<<<blocks, threads, 0, streams[0]>>>(d_a, d_c, niterations) 之前,而且程序中没有出现
cudaMemcpyAsync(hAligned_a, d_a, nbytes, cudaMemcpyHostToDevice, streams[0]);呢
|