본문 바로가기

AI Feed
Tech & Product/AI, 더 쉽게

인공지능 시장에서 제일 귀하신 몸, GPU를 알아보자

 

안녕하세요! 에디터 SA입니다. 여러분은 인공지능에 대해 알게 되셨을 때, 가장 신기했던 사실이 무엇이었나요? 아직도 AI린이인 에디터 SA이지만, 더 AI 알못이었던 제게 신기하게 다가온 것은 바로 ‘GPU’ 였답니다. 아마 여러분들은 AI에 대해 잘 알고 계시니, “AI에 GPU가 뭐 어때서?”라고 생각하셨을 수 있겠어요. 😂

에디터 SA에게 GPU란 멋들어진 그래픽의 게임이나 영상을 컴퓨터 즐길 때 영향을 미치는 부품 정도로 받아들여졌었는데요. 어떤 분들은 ‘GPU’라는 이름 자체가 생소하신 경우도 있을 거예요. GPU가 뭔데? 컴퓨터에 있는 거라고? 그게 인공지능 개발에 쓰인다고? 물음표 한가득 머릿속에 담고 계실 분들을 위해서, 오늘은 ‘AI, 더 쉽게’라는 이름에 걸맞은 맞춤 콘텐츠를 준비했습니다. 😎

 

 

 

[ 그래서 GPU가 뭔데요? 어쩌다가 GPU가 인공지능에 쓰이게 됐나요? ]

 

GPU는 Graphics Processing Unit의 각 첫 글자를 딴 줄임말입니다. 단어의 뜻 그대로, 그래픽 처리에 쓰이는 유닛인 건데요. 연산을 처리하는 수천 개의 코어로 구성되어 있습니다. 그래픽 산출을 위한 연산은 병렬 방식으로 처리하는데요. 이 글의 시작에서 GPU에 대해 “게임이나 영상 등의 그래픽”에 영향을 미치는 부품으로 이해했었다고 말씀드렸었는데요. 2010년 초까지만 해도 GPU는 그 용도로 쓰였었습니다.

우리에게 ‘보는 즐거움’을 주던 GPU가 새로운 자리를 찾은 것은, 정확히 2006년이라고 합니다. CPU의 응용 프로그램을 계산하는 데에 GPU의 병렬 연산 처리를 사용해서 범용 계산을 한 건데요. GPGPU(General-Purpose computing on Graphics Processing Units)라고 합니다. 엔비디아가 제시한 개념이에요. 17년이 지나고, 엔비디아는 이제 ‘GPU’로 전 세계 인공지능 업계를 꽉 쥐고 있지요. 😮

GPU를 연산 처리에 이용하게 되면서, 전 분야에 큰 변화가 일어나게 되었습니다. 기존에는 과학, 의학 분야나, 서버, 미디어처럼 대규모 데이터 처리가 필요한 분야 등에서 데이터를 처리할 때 CPU를 활용했었는데요. 이 자리를 GPU가 대체하기 시작했습니다. 기존에 CPU로 진행하던 과학, 의학 등의 분야는 물론, 서버나 미디어 등 대규모 데이터 처리를 GPU가 대신하게 되었어요. 그리고 인공지능 개발을 위한 머신러닝, 딥러닝에서까지 GPU가 쓰이게 되었습니다.

 

 

 

[ GPU가 그렇게 좋은가요? GPU 요새 구하기 힘들다던데… ]

 

여기까지 읽으셨다면 궁금해지실 거예요. “그럼, GPU보다 CPU가 좋은 건가요?”나 “GPU가 그럼 CPU를 대체하게 되는 건가요?”라고 물으실 수도 있을 텐데요. 답부터 드리자면, “아니요.”입니다. GPU라는 선택지가 생겼다고 보시는 게 좋을 것 같아요. 🤓

GPU는 현시점의 인공지능 개발에 있어 단순 연산을 처리하는 데 최적의 반도체입니다. 인공지능 개발에는 기본적으로 많은 양의 단순 사칙 연산이 필요한데요. GPU는 단순 연산을 다중으로 처리하는 데 적합한, ‘병렬식 연산’이 가능한 구조라서 인공지능 개발에 쓰이는 것입니다. 반면 CPU는 복잡한 단일 연산 처리에는 뛰어나지만 다중 처리에는 비효율적이고요. 그렇다고 해서 CPU가 GPU보다 열등한 것은 아니니까요. 단지, ‘병렬’로 연산을 처리하는 GPGPU의 활용성처럼 CPU가 줄 수 없는 GPU의 특장점이 분명해서, 인공지능 개발에서는 GPU가 핵심 요소로 자리 잡을 수밖에 없지요. 🤔

 

지난 달(8월) 공개된 NVIDIA의 신제품 GH200

 

인공지능에 대한 대중의 관심이 높아지고, ChatGPT를 포함한 여러 인공지능 기술이 공개됨에 따라 그 바탕에 있는 GPU가 큰 관심을 받을 수밖에 없었습니다. 워낙 떠들썩한 이야기라 들어보신 적이 있으시겠지만, GPU가 인공지능 개발의 키(key)가 되면서, 엔비디아의 위상은 완전히 달라졌습니다. “주가가 올랐다”는 표현이 비유만이 아니라 실제가 되었어요.

엔비디아가 내놓는 신제품들은 줄곧 화제가 되고 있습니다. ‘GPU’에 대한 관심은 유례가 없을 정도이기 때문에, GPU 시장 우위를 점하고 있던 엔비디아에서 그만큼의 관심과 구매 요청을 감당하기는 쉬운 일이 아니겠지요. 요새는 GPU 물량을 확보하는 것이 전 세계적 과제가 되었습니다.

이렇게 GPU가 인공지능 개발에 있어 중요하고, 또 물량은 부족하니 국가 간의 견제와 경쟁까지 일어나고 있습니다. 미국 정부가 NVIDIA와 AMD에게 중국, 러시아로의 GPU 수출을 제한하는 명령을 내렸으니까요.

 

 

 

[ GPU, 구하기 힘들고 비용도 많이 드는데, 어떻게 하면 효율적으로 쓸 수 있죠? ]

GPU의 단점은 없을까요? 당연히 있습니다. 여러분도 모두 아실 텐데, GPU는 품귀 현상이 일어날 정도로 물량 확보가 어려운 상황이지만, 구매 비용도 매우 높습니다. 만약 인공지능 개발을 위한 GPU 확보에 성공했다 해도, 다음 관문이 기다리고 있습니다. 바로, GPU가 모든 인공지능 개발에 적합한 것은 아니라는 거예요.

GPU는 병렬식 연산 처리로, 인공지능 개발의 연산 과정을 최적화하므로, 대용량 데이터 처리가 필요한 산업군에서 활용하기에 좋습니다. 하지만, 인공지능이 꼭 대량 학습으로 결과를 내거나 판별해 내는 기능만 있는 것은 아니잖아요. 물론 대체로는 그렇지만, 일부 그렇지 않은 특별한 인공지능도 있을 거예요. 그 인공지능의 경우에는 GPU의 효율이 크게 와 닿지 않겠지요. 심지어 전력 소모량도 많고, 구매를 포함하여 유지 비용도 매우 많이 듭니다. 어쩌면 투자 대비 효율이 떨어지는 결과를 초래할 수도 있겠어요.

 

 

이렇듯 비싸고, 전력 소모도 많은 GPU를 하나의 인공지능 개발, 학습에만 사용할 수는 없는 노릇이지요. 그래서 GPU를 최대한 효율적으로 사용하기 위한 다양한 노력이 존재합니다. 그중 하나가 저희 TEN이 서비스하고 있는 AI Pub과 Coaster이고요. 😊

GPU를 효율적으로 사용하기 위한 방법들에는 여러 가지가 있겠으나, AI Pub과 Coaster를 예로 들어 설명할 수 있을 것 같아요. 보통 인공지능 개발, 학습과 AI 기반 서비스 운영을 위해 GPU를 활용하는 경우, 하나의 모델에 하나 이상의 하드웨어 유닛, 즉, GPU를 할당하게 됩니다. 인공지능 모델 하나에 꼭 하나의 GPU만 필요하리란 법은 없으니까요. 만약 여러 개의 인공지능 모델을 동시에 개발하고 학습, 활용하려면, GPU를 무척 많이 보유하고 있어야겠지요? 그러나 실제로 인공지능 모델을 개발하고 학습하면서 검토해 본 바로는 GPU가 반드시 하나, 두 개 같은 낱개의 개수로 필요하지 않을 수 있습니다. 실제로 기준이 되는 건 GPU 개수가 아니라, ‘용량’이니까요.

 

 

그래서 AI Pub은 보유하고 있는 GPU를 여러 인공지능 모델이 쓸 수 있도록 나눠, 각 모델이 필요한 만큼 할당해 주는 서비스를 제공합니다. 마치 우리가 PC를 사용하면서 C 드라이브, E 드라이브, F 드라이브 등을 나누는 것처럼요. 그와 동시에 GPU가 문제없이 사용되고 있는지를 확인할 수 있는 효율적인 관리 서비스를 제공합니다.

앞으로 더 많은 연산을 처리할 수 있는 GPU 신모델이 계속 출시될 테니, AI Pub과 같은 인공지능, MLOps 솔루션처럼 GPU를 얼마나 효율적으로, 야무지게 사용할 수 있게 해주는지가 인공지능 개발에서 중점이 될 도움일 수 있을 것으로 생각되네요. 🤔

 

 

 

최근에는 인공지능 처리에 특화된 반도체인 ‘NPU’도 양산에 들어갔는데요. NPU는 GPU보다 전력 소모는 적고 결과물은 많이 산출한다고 합니다. 운영비용은 매달 1천700만 원을 줄일 수 있을 정도라고 하니, 실제 사용 후기도 궁금하고, 새롭게 바뀔 시장 판도도 궁금해지는데요. 과연, GPU의 시대가 이렇게 금방 지나가고, NPU의 시대가 열릴까요? 😖 언젠가는 ‘AI, 더 쉽게’를 통해 NPU를 집중적으로 소개하는 날이 왔으면 좋겠네요.