반응형
http://software.intel.com/sites/landingpage/opencl/user-guide/index.htm
AMD OpenCL컴파일러가 병맛같기 때문에 Intel용 툴을 써봤다.
1. GPA TOOL 다운
http://software.intel.com/en-us/vcsource/tools/intel-gpa
2. 프로파일 파일 생성
2-1. 환경 변수 설정
Environment Variable | Default Value |
CL_GPA_CONFIG_ENABLE_API_TRACING | True |
CL_CONFIG_USE_GPA
= True
2-2. Intel GAP Monitor 실행
2-3. 커맨드 설정
Command Line에 실행 Full Path와 argument씀.
Working Folder 설정.
2-4. 프로파일 설정.
Manage Profiles...
a. Enable trigger (단축키로 실행시킬 수 있지만, 귀찮)
b. Apllication Time, >= 0 ( 시작부터)
c. Frame and Trace Capture (Frame은 생성이 안된다;)
d. Retrigger Delay : 1secs (1초마다 생성, 어플이 끝날 때 한번 하고 싶었지만 모르겠다...)
2-5. Run
아래 내문서 폴더에 생성됬다고 뜬다.
1초마다 생성되어?
여러개가 생성되었다.
3. Intel opencl Platform Analyzer
맨 마지막 파일을 실행시키면
4. 분석하기
PS. 근데 위에 환경변수들을 켜놓으면
성능이 엄청 나빠진다.
- 해결
반응형
'Program Language > OpenCL' 카테고리의 다른 글
[CUDA] occupancy (0) | 2012.11.07 |
---|---|
NVIDIA clEnqueueReadBuffer non-blocking bug(?) (0) | 2012.11.02 |
DeviceQuery (0) | 2012.10.08 |
OpenCL 포팅 (0) | 2012.10.05 |
Release (0) | 2012.09.24 |
댓글