반응형 Program Language56 NVIDIA clEnqueueReadBuffer non-blocking bug(?) clEnqueueReadBuffer를 CL_FALSE로 불러도 계속 read될때 까지 기다린다.Intel CPU OpenCL은 non-blocking이 잘 된다.AMD는 안해봤는데 아마 잘 될듯하다. 이걸로 1.5일을 헤매었다. CUDA 4.2.1OpenCL 1.1을 사용 하였다. NVIDIA는 끝까지 OpenCL을 숨기려는듯하다.OPENCL 페이지도 없어지고,1.2도 공개안하고, VisualProfiler도 CUDA 5.0에선 작동을 안한다. 째튼 NVIDIA 예제코드도 확인결과 다 blocking 된다. overrap예제만 빼고.. 뭐가 다른가lib? inc? 다 바꿔봤지만 그대로..context? device? queue? 다 똑같다. 결론은asynchronous pinned transfers 쓰자.. 2012. 11. 2. Intel opencl platform analyzer http://software.intel.com/sites/landingpage/opencl/user-guide/index.htmhttp://software.intel.com/sites/landingpage/opencl/user-guide/Using_the_Intel(R)_Graphics_Performance_Analyzers_(Intel(R)_GPA)_Platform_Analyzer.htm AMD OpenCL컴파일러가 병맛같기 때문에 Intel용 툴을 써봤다. 1. GPA TOOL 다운 http://software.intel.com/en-us/vcsource/tools/intel-gpa 2. 프로파일 파일 생성 2-1. 환경 변수 설정 2012. 10. 15. DeviceQuery NVIDA OpenCL SDK에 들어있는 DeviceQuery 프로그램 결과들 OpenCL SW Info: CL_PLATFORM_NAME: NVIDIA CUDA CL_PLATFORM_VERSION: OpenCL 1.1 CUDA 4.2.1 OpenCL SDK Revision: 7027912 OpenCL Device Info: 1 devices found supporting OpenCL: --------------------------------- Device GeForce GTX 550 Ti --------------------------------- CL_DEVICE_NAME: GeForce GTX 550 Ti CL_DEVICE_VENDOR: NVIDIA Corporation CL_DRIVER_VERSI.. 2012. 10. 8. OpenCL 포팅 1. C로 구현. int j = 0;for( int i=0 ; i 2012. 10. 5. 이전 1 2 3 4 5 6 ··· 14 다음