大家好:
本人最近在学习opencl,想通过opencl对算法进行加速,但是现在发现如果只计算kernel运行时间的话,确实比cpu运算速度加快了,但是加上内存的transfer时间的话,速度还不如原来直接用CPU运算的速度,那这样就起不到优化加速的作用了,所以请教大神,有没有遇到富哦相同的困惑,还有处理这个问题一般用什么思路啊?多谢!!!
本人最近在学习opencl,想通过opencl对算法进行加速,但是现在发现如果只计算kernel运行时间的话,确实比cpu运算速度加快了,但是加上内存的transfer时间的话,速度还不如原来直接用CPU运算的速度,那这样就起不到优化加速的作用了,所以请教大神,有没有遇到富哦相同的困惑,还有处理这个问题一般用什么思路啊?多谢!!!