테크 & 사이언스

그래픽 처리에 쓰이는 GPU
병렬 연산으로 딥러닝 등 최적

삼성전자·구글·그래프코어
AI 전용 프로세서 앞다퉈 개발
엔비디아의 GPU 테슬라 V100.

엔비디아의 GPU 테슬라 V100.

“인공지능(AI) 반도체는 AI와 데이터 생태계의 핵심 기반이자 한국 산업의 새로운 성장동력이다.”

최기영 과학기술정보통신부 장관이 지난 4월 정부의 AI 반도체 개발을 본격화하면서 한 말이다. 정부는 이 자리에서 SK텔레콤, ETRI(한국전자통신연구원), 서울대 등을 개발 수행기관으로 선정하고 향후 10년간 2500억원을 투자할 것이라고 발표했다.

세계적으로 AI 반도체를 둘러싼 기업, 국가 간 경쟁이 치열해지고 있다. AI 반도체는 AI가 학습하고 추론할 때 데이터를 읽어들이고 연산해주는 기능을 하는 ‘AI의 두뇌’라고 할 수 있다.

데이터를 처리하는 가장 대표적인 반도체는 중앙처리장치(CPU)다. CPU는 명령어가 입력된 순서대로 데이터를 처리하는 직렬 방식으로 연산한다. CPU 내 캐시 메모리를 두고 연산에 필요한 데이터를 불러와 빠르게 처리하도록 돕는다. 문서작업 등 일상생활 속 작업을 빠르게 수행하도록 설계됐다.

AI 시대 주목받는 GPU(graphics processing unit)는 3차원(3D) 그래픽 등을 처리하는 데 특화된 프로세서다. 여러 명령을 동시에 처리하는 병렬 연산 방식을 사용해 화면 속 3D 이미지를 보여줄 때 CPU에 비해 월등한 성능을 보인다. 캐시메모리가 상당한 비중을 차지하는 CPU와 달리 GPU는 계산을 담당하는 산출연산처리장치(ALU)를 대폭 늘린 구조다. 이는 많은 정보를 동시에 처리해야 하는 딥러닝 연산에서도 장점으로 작용한다. GPU 개발회사 엔비디아가 AI 시대 주목받는 이유다.

현재 AI 컴퓨터는 연산이 빠른 CPU와 병렬 데이터 처리에서 강점을 지닌 GPU를 조합해 구성한다. 가령 구글의 알파고는 1920개의 CPU와 280개의 GPU로 구성된다.

글로벌 기업들은 AI 시대에 맞춘 전용 반도체 개발에 속도를 내고 있다. AI 전용 반도체의 핵심은 ‘저전력’ ‘고성능’이다. 구글이 자체 개발한 TPU(tensor processing unit)가 이 같은 사례다. TPU는 구글의 AI 학습 소프트웨어 ‘텐서 플로’에 최적화된 반도체다. 구글은 2017년 2세대 TPU를 출시할 당시 “TPU는 GPU·CPU보다 수십 배의 전력 효율을 내는 동시에 수십 배 빠른 성능을 자랑한다”고 설명했다. 구글이 2017년 내놓은 TPU 기반 ‘알파고 제로’는 GPU를 기반으로 한 ‘알파고’에 비해 전력 소모가 10분의 1에 불과했다.

CPU 넘어 GPU·TPU로 진화하는 'AI 프로세서'

영국의 AI 반도체 기업인 그래프코어의 IPU(intelligence processing unit)도 차세대 기술로 주목받고 있다. IPU의 가장 큰 특징은 프로세서에 직접 메모리를 배치했다는 점이다. 기존 반도체들은 데이터를 떨어져 있는 D램 메모리에 저장했다. 데이터가 옮겨지는 찰나의 순간에 지연현상이 발생하기도 했다. IPU는 연산장치에서 가장 밀접한 곳에 메모리를 배치해 지연 시간을 최소화했다. 그래프코어에 따르면 IPU는 기존 CPU 및 GPU 조합보다 데이터 처리 속도가 10배에서 최대 100배까지 빠르다.

국내 기업도 AI 반도체 개발에 공을 들이고 있다. 삼성전자는 AI 연산 속도를 7배 높인 ‘엑시노스9820’을 갤럭시 S10시리즈에 적용하기도 했다. 정부 AI 반도체 수행기관에 선정된 SK텔레콤도 자체 AI 반도체 개발에 들어갔다. SK텔레콤 관계자는 “연산 성능을 시중에 나와 있는 AI 반도체들의 10배 넘는 수준까지 끌어올릴 것”이라고 말했다.

구민기 기자 kook@hankyung.com

ⓒ 한경닷컴, 무단전재 및 재배포 금지