用户
 找回密码
 立即注册
hrbspider 该用户已被删除
发表于 2013-7-11 13:20:11
41263
要对一个3000×11000的3通道影像做处理。由于影像太大,内存和显存都有限,我不能将其全部读入内存,然后拷贝到显存里,只能分块拷贝,我是按3000×2048一块进行拷贝,需拷个5次。
用cuda实现后发现和原来处理时间差不多,有时候还慢一点,请问有什么办法可以解决这个问题啊。
因为这是每个影像处理算法都会遇到的问题(很多时候影像太大,只能分块拷贝),这个问题解决了,cuda的效率才能真正发挥出来。
使用道具 举报 回复
发表于 2013-7-11 15:03:52
怎么没有大神来回复啊
我自己先顶一下
使用道具 举报 回复 支持 反对
发表于 2013-7-11 17:20:30
测试了下时间,发现cuda运算部分用了1.4s左右,cpu 运算部分用了11s左右。
主要时间还是cpu占用了。看来也不是cuda的问题
使用道具 举报 回复 支持 反对
发表于 2013-7-11 17:33:51
cpu 的部分没有做具体的计算,主要是分配内存、影像分块读取、输出影像,cpu部分似乎很难并行化。唉。。
使用道具 举报 回复 支持 反对
发新帖
您需要登录后才可以回帖 登录 | 立即注册