반응형
쓸모없는 barrier를 제거 하였더니
global memory replay overhead가 줄었다.
성능이 크게 올라갔다.
//barrier(CLK_GLOBAL_MEM_FENCE);
//mem_fence(CLK_GLOBAL_MEM_FENCE);
반응형
'Program Language > OpenCL' 카테고리의 다른 글
GPGPU Computing의 기본 개념. (0) | 2013.04.19 |
---|---|
OpenCL 에러 (0) | 2013.01.21 |
[CUDA] occupancy (0) | 2012.11.07 |
NVIDIA clEnqueueReadBuffer non-blocking bug(?) (0) | 2012.11.02 |
Intel opencl platform analyzer (0) | 2012.10.15 |
댓글