반응형
void boo()
{
if(get_local_id(2)!=0) return;
foo();
barrier(CLK_LOCAL_MEM_FENCE);
}
작동 안한다.
알아서 작동할 줄 알았는데....
void boo()
{
if(get_local_id(2)!=0)
foo();
barrier(CLK_LOCAL_MEM_FENCE);
}
이렇게 하자.
atomic 함수는 shared-reg에 써도 느리다.
왠만하면 피하자!
branch divergence를 유발한다!
반응형
'Program Language > OpenCL' 카테고리의 다른 글
GPGPU Computing의 기본 개념. (0) | 2013.04.19 |
---|---|
global memory replay overhead (0) | 2012.12.21 |
[CUDA] occupancy (0) | 2012.11.07 |
NVIDIA clEnqueueReadBuffer non-blocking bug(?) (0) | 2012.11.02 |
Intel opencl platform analyzer (0) | 2012.10.15 |
댓글