CUDA 소개

GPU와 CUDA 프로그래밍 소개

안녕하세요. GPU, CUDA 프로그래밍에 관심이 있으신 여러분 환영합니다. GPU 프로그래밍에 대해서 일반적으로 가지는 인식은 다음과 같습니다:

연산 속도를 빠르게 하기 위해
많은 양의 계산을 한번에 처리하기 위해 이런 장점이 있음에도 불구하고 배우기 어렵다는 선입견 때문에 쉽게 접근하기 어려운 것도 사실입니다. GPULab.kr에서 제공하는 강의를 통해 관심 있으신 분들이 누구나 쉽게 GPU 프로그래밍을 배울 수 있도록 하는 것이 저희의 목적입니다.

“그래서 GPU가 CPU보다 얼마나 빠른데?” 궁금하신 분들을 위해 CPU와 GPU의 코어 수를 비교해 보겠습니다.

공정한 비교를 위해 데스크톱 시리즈를 살펴보겠습니다. AMD Ryzen 시리즈의 경우:

AMD Ryzen 프로세서 사양을 보면 최대 CPU 코어 수가 16개입니다.

AMD Ryzen 9000 series

반면, 데스크톱용 고성능 GPU의 코어 수를 확인해보면 21,760개에 달합니다. 물론 코어의 수가 컴퓨터 연산 속도를 그대로 반영하지는 않지만, 16개와 21,760개라는 차이는 매우 큽니다.

rtx5090 series

아래 그래프는 GPU와 CPU의 연산 속도를 로그 스케일로 나타낸 것입니다:

cpu_vs_gpu

CPU가 지속적으로 발전하고 있지만, 단일 GPU로도 연산 속도가 CPU보다 약 100배 정도 빠르다는 것을 확인할 수 있습니다.

결국 쉽게 말해서:

CPU에서 1초 걸리는 연산이 GPU에서는 0.01초
CPU에서 1분 걸리는 연산이 GPU에서는 1초
CPU에서 1시간 걸리는 연산이 GPU에서는 1분
CPU에서 하루 걸리는 연산이 GPU에서는 20분 이렇게 단축된 시간으로 새로운 산업들이 발전할 수 있게 되었습니다. 실시간 자율주행, 의료 영상 처리, 시뮬레이션, 금융 산업 등의 복잡한 연산이 가능해진 것입니다. 이러한 가치들이 여러분이 CUDA를 배워야 하는 이유입니다

이렇게 빠른 GPU를 활용하는 방법에는 AMD의 ROCm, 애플의 Metal이 있고, 칩 제조사와 무관하게 활용하는 방법으로는 OpenCL이나 WebGPU 등이 있는데, 왜 NVIDIA의 CUDA를 사용해야 할까요?

당연하게도 오랜 역사와 성공적으로 시장을 장악한 CUDA를 통해 배우는 것이 가장 접근성이 높기 때문입니다. CUDA는 2008년에 처음 출시되었고, 지속적인 버전 업그레이드와 라이브러리 업데이트를 통해 광범위한 지원을 받을 수 있습니다.

그렇다고 해도 GPULab.kr의 CUDA 강의는 GPU 프로그래밍 알고리즘과 GPU 하드웨어에 더 초점을 맞출 것이므로, 나중에 다른 프로그래밍 언어나 다른 칩을 사용하게 되더라도 아주 쉽게 적응할 수 있을 것입니다.

그럼 CUDA를 통한 병렬 프로그래밍 강의를 바로 시작하겠습니다.