본문 바로가기
Program Language/OpenCL

global memory replay overhead

by Leo 리오 2012. 12. 21.
반응형

쓸모없는 barrier를 제거 하였더니 

global memory replay overhead가 줄었다.

성능이 크게 올라갔다.



//barrier(CLK_GLOBAL_MEM_FENCE);

//mem_fence(CLK_GLOBAL_MEM_FENCE);






반응형

'Program Language > OpenCL' 카테고리의 다른 글

GPGPU Computing의 기본 개념.  (0) 2013.04.19
OpenCL 에러  (0) 2013.01.21
[CUDA] occupancy  (0) 2012.11.07
NVIDIA clEnqueueReadBuffer non-blocking bug(?)  (0) 2012.11.02
Intel opencl platform analyzer  (0) 2012.10.15

댓글