엔비디아가 개발해 공급하는 그래픽처리장치(GPU) H100의 모습.           로이터연합뉴스
엔비디아가 개발해 공급하는 그래픽처리장치(GPU) H100의 모습. 로이터연합뉴스
"그래픽처리장치(GPU) 부족이 현상이 마치 코로나19 대유행 기간 화장지 품귀 현상 같습니다."(샤론 저우 라미니 공동 창업자)

월스트리트저널(WSJ)은 29일(현지시간) 챗GPT가 불붙인 생성형 인공지능(AI) 붐이 확산되면서 AI 학습에 필수인 GPU 확보 경쟁이 치열하게 벌어지고 있다고 보도했다.

생성형 AI 개발에 필수적인 GPU는 현재 수요가 공급을 훨씬 추월했다. 세계 GPU 공급량의 90% 가량을 엔비디아에서 공급하고 있다. GPU를 활용하면 텍스트 분석과 문장 생성 등 생성AI 학습을 병렬도 동시에 진행할 수 있어 작업을 훨씬 빠르게 할 수 있다.

GPU 품귀 현상으로 인해 아마존웹서비스(AWS), 마이크로소프트 등 글로벌 주요 클라우드 서비스 업체들도 AI 모델을 개발하는 고객들에게 제공하는 처리 능력을 제한하고 나섰다. AI 개발사들은 AI 모델을 개발, 운영하기 위해 클라우드 서버 용량이 필요하지만 이조차도 확보에 어려움을 겪고 있는 것이다.

AI 분야에서 이름을 날리고 있는 핵심 인물들조차도 클라우드 용량을 확보하기 어려운 상황이다. 샘 알트만 오픈AI 최고경영자(CEO)는 지난 16일 미국 의회 청문회에 나와 "GPU 병목현상이 심각하다"며 "챗GPT를 쓰는 사람이 적으면 더 좋을 것"이라고 말하기도 했다.

생성형 AI 붐으로 인해 더 많은 GPU가 필요해졌다. 투자은행 UBS에 따르면 챗GPT의 이전 버전에는 약 1만개의 GPU가 필요했다고 추정했다. 챗GPT의 최근 버전은 이보다 3~5배 더 많이 필요하다고 알려졌다.

일론 머스크 테슬라 CEO는 "현 시점에서 GPU는 마약보다 구하기 훨씬 어렵다"고 언급했다. 머스크는 상대적으로 인기가 적은 클라우드 업체인 오라클의 여유 서버 공간을 상당 부분 확보한 것으로 알려졌다. 오픈AI 대변인은 "GPU를 구하려는 강력한 수요가 확인됐다"며 "고객을 위한 용량을 확보하기 위해 최선을 다하고 있다"고 밝혔다.

AI 학습을 위한 컴퓨팅 용량을 확보하기 위해 일부에서는 네트워크를 샅샅이 뒤지고 있으며 일부는 공유 가능한 프로세서와 서버 용량을 대량 주문하기 위해 조율하고 있다. 일부 스타트업들은 GPU 부족에 대응해 자체적으로 물리적 서버를 구입하거나 품귀 현상이 해결될 때까지 오라클 등과 같은 상대적으로 인기가 적은 클라우드 공급사와 거래하는 등 대안을 찾고 있다.

이같은 GPU 품귀 현상은 적어도 내년까지 지속될 것이라는 게 AI 업계의 판단이다. GPU를 선불로 지불했더라도 몇 주를 기다려야 하는 상황이다. 서버 제조업체와 그 고객들은 엔비디아의 최신 GPU를 구하기 위해 6개월 이상 기다려야 한다. 서버 제조업체 슈퍼마이크로는 GPU를 장착한 시스템의 이월 주문이 사상 최고 수준이며 서버 공급 능력을 확대하기 위해 서두르고 있다고 밝혔다.

실리콘밸리=서기열 특파원 philos@hankyung.com