Getty Images Bank
Getty Images Bank
테크기업들이 초거대 인공지능(AI) 개발 및 고도화에 적극 나서고 있다. 초거대 AI는 대용량 연산이 가능한 컴퓨팅 인프라를 기반으로 대규모 데이터를 스스로 학습하는 기술이다. AI가 ‘인간의 뇌’와 한층 더 비슷해진다는 얘기다. LG, 카카오 같은 기업들은 자체 개발한 초거대 AI를 산업 현장의 효율성을 높이고 새로운 서비스를 개발하는 데 활용하고 있다.
GPT-3 공개가 전환점
초거대 AI는 2020년께부터 주목받기 시작했다. 일론 머스크 테슬라 최고경영자(CEO) 등이 설립한 AI 연구업체 오픈AI가 초거대 AI 언어모델 GPT-3를 공개하면서다. 파라미터는 인간 뇌의 뉴런 사이를 연결해 정보를 학습하고 기억하는 시냅스와 유사하다.

이론상 파라미터가 많을수록 AI가 더 정교한 학습을 할 수 있는 것으로 알려져 있다. 인간의 뇌 속 시냅스는 약 1000조 개다. GPT-3는 1750억 개의 파라미터를 갖췄다. 파라미터 수만 단순 비교해도 기존 GPT-1의 1000배이자 GPT-2의 117배에 달한다.
'인간의 뇌' 닮은 초거대 AI가 온다
GPT-3 등 초거대 AI는 자연어 이해 분야에서 주로 활용되고 있다. 자연어 이해는 컴퓨터가 사람의 언어를 이해하도록 만드는 연구 분야다. 기계가 사람의 언어를 사용하게 하는 작업은 AI의 핵심 기술로 꼽힌다. 자연어 이해가 고도화되면 AI가 정확한 번역을 넘어 보고서 작성 같은 서류 작업 등도 가능하다. 업무 생산성이 크게 향상될 것이란 전망이 나온다.
LG, 엑사원 활용 영역 넓혀
LG ‘엑사원’ 기반 가상인간 ‘틸다’
LG ‘엑사원’ 기반 가상인간 ‘틸다’
국내 대기업 가운데선 LG가 적극적이다. LG AI연구원은 수년간 공들인 초거대 AI 엑사원(EXAONE)을 지난해 12월 발표했다. 엑사원은 ‘인간을 위한 전문가 AI’란 뜻이다. 엑사원의 파라미터는 약 3000억 개다. 파라미터 수로만 보면 한국에서 학습 능력이 가장 우수한 AI로 평가된다.

엑사원은 언어를 넘어 이미지와 영상에 이르기까지 인간의 의사소통과 관련된 다양한 정보를 습득하고 다룰 수 있는 멀티모달리티(multi-modality: 여러 가지 형태와 의미로 컴퓨터와 대화하는 환경) 능력을 갖췄다. 이를 위해 LG AI연구원은 말뭉치 6000억 개와 언어·이미지가 결합된 고해상도 이미지 2억5000만 장 이상의 빅데이터를 활용했다.

멀티모달 AI 기술이 고도화되면 AI가 데이터를 습득해 이해하는 수준을 넘어 추론하고 시각과 청각 등 다양한 감각 영역을 넘나드는 창조적 생성을 할 수 있다. 지난 2월 뉴욕패션위크에서 대표적인 사례가 나왔다. LG의 멀티모달 AI를 기반으로 한 가상 인간 틸다가 스스로 디자인한 의류를 공개한 것이다. LG는 금융·패션·유통·교육 등 다양한 글로벌 파트너사와 함께 연합을 결성해 초거대 AI 활용 영역을 넓혀 나가고 있다.
네이버 ‘하이퍼클로바’ 한국어에 강점
네이버, 카카오 같은 국내 플랫폼업체들도 초거대 AI의 선두주자로 평가된다. 네이버는 2021년 5월 초거대 AI인 하이퍼클로바를 공개했다. 한국 기업 중 가장 앞선 시점이었다.

정석근 네이버 클로바CIC(사내독립기업) 대표는 “글로벌 기술 대기업들은 초대형 AI의 파괴적 혁신을 기대하고 투자를 가속화하고 있다”며 “한국의 AI 기술이 글로벌 플랫폼에 종속되지 않기 위해서는 이미 공개된 기술을 활용하고 따라잡는 수준에 그칠 수 없다고 판단했다”고 설명했다.

하이퍼클로바의 파라미터는 2040억 개다. 영어가 학습 데이터의 대부분을 차지하는 오픈AI의 GPT-3와 달리 하이퍼클로바의 학습 데이터는 한국어 비율이 97%에 달한다. 네이버 관계자는 “영어 중심의 글로벌 AI 모델과 달리 한국어에 최적화한 언어 모델을 개발함으로써 AI 주권을 확보한다는 의미가 있다”고 강조했다. 네이버는 다른 언어로 모델을 확장하고 언어뿐만 아니라 영상이나 이미지 등도 이해하는 멀티모달 AI로 하이퍼클로바를 발전시켜 나갈 계획이다.

카카오는 AI 연구 전문 자회사인 카카오브레인을 통해 2021년 11월 GPT-3 모델의 한국어 특화 AI 언어 모델인 KoGPT를 최대 오픈소스 커뮤니티인 깃허브에 공개했다. 12월엔 둘째 초거대 AI 모델인 민달리(minDALL-E)를 선보였다. 김일두 카카오브레인 대표는 “순차적으로 초거대 AI의 다양한 모델을 공개할 것”이라며 “차세대 딥러닝 구축을 위한 필수 연구 과정으로 해당 모델을 오픈소스로 공개해 한국의 정보기술(IT) 생태계 기술 발전에 기여할 것”이라고 말했다.

최근 카카오브레인은 의료 분야에서 협업을 강화하고 있다. 지난 24일 고려대 안암병원과 의료 분야 초거대 AI 모델 연구를 위한 업무협약(MOU)을 맺었다. 난치병 진단, 의료영상 판독을 포함해 초거대 AI로 의료 서비스 품질을 향상할 방법을 공동 연구할 계획이다.지난달 25일엔 가톨릭중앙의료원과도 손잡고 의료영상 분야에 초거대 AI를 적용하기 위한 MOU를 체결했다. 김 대표는 “다양한 병원과의 협력을 통해 초거대 AI 헬스케어 연구개발에 속도를 내 글로벌 헬스케어 시장 진출에 도전장을 내밀겠다”고 말했다.

황정수 기자 hjs@hankyung.com