반응형 분류 전체보기205 Intel Parallel Studio 사용법 문서: 영문 http://gem.yonsei.ac.kr/~tskim/pds/ifort_quick.pdf Use Intel C++ compiler 자동병렬화 방법 Configuration을 release로 하자. 자동 병렬화는 O2 옵션에서만 작동한다. (다음 스샷들은 실수..) 자동 병렬화 이다. 컴파일러가 알아서 해준다. /Qparallel /Qpra-threshold[0-100]0이면 안전한 한 항상.100이면 확실한 성능증가 때만. /Qpar-report[1,2,3]레포트 lvlControls the auto-parallelizer’s diagnostic levels as follows: 0 – Displays no diagnostic information. 1 – Indicates loops su.. 2012. 7. 16. visual studio 출력창 종료 With the new visual studio 2010 you might see this behavior even when you use ctrl f5 aka "start without debugging". This is most likely because you created an "empty project" instead of a "Win32 console application". If you create the project as a "Win32 console application" you can disregard this as it does not apply.In the older versions it would default to the console subsystem even if you s.. 2012. 7. 6. amd opencl __constant AMD에서 __kernel argument 를 __constant 로 못받는듯하다; HOST:: //create buffer read onlycl_mem cltmp = clCreateBuffer(context, CL_MEM_READ_ONLY, 2048, 0, &err);clEnqueueWriteBuffer(... cltmp...);cl_mem clarg = cltmp; //copy buffer clSetKernelArg(... clarg...);clEnqueueTask(...); DEVICE::__kernel void k(... __const mem...){} 이렇게 하면 Intel 에선 잘 작동하지만. amd에선 argument가 cl_mem주소가 아닌 0으로 넘어온다.. 왜그런진 모르겠지만. 2012. 6. 20. printf debugging printf로 디버깅 할때 끝에 \n newline을 넣어도 print가 제대로 안 될때가 있다. 이땐 printf후에 fflush(stdout); 을 해주면 출력하고 버퍼를 비우게된다. (당연히 속도는 늦어진다.) 2012. 6. 19. 이전 1 ··· 17 18 19 20 21 22 23 ··· 52 다음