“초거대 인공지능(AI)이 산업 현장의 맞춤형 ‘돌파구(break-through)’가 된다면 얼마나 놀라울지 상상해 보십시오. LG의 ‘전문가 AI’는 고객 개인을 위해 새로운 물질을 개발하고, 질병을 진단하거나 금융 상품 가격을 예측해줄 수 있습니다.”(배경훈 LG AI연구원장)

LG그룹의 초거대 AI 전략은 인터넷 서비스 기반 B2C 업체인 네이버 카카오 등 빅테크와 다르다. 산업 고도화에 곧바로, 공격적으로 활용할 수 있는 AI의 확보와 실증이다.

14일 LG AI연구원이 자사 초거대 AI 모델 ‘엑사원(EXAONE)’을 공개하며 내비친 청사진에도 전자 화학 의료 등 산업군 타깃이 명확히 언급돼 있다. 구글의 미공개 칩으로 컴퓨팅 인프라를 고도화하고, 사상 최대 규모의 데이터를 엑사원에 학습시킨 데는 계열사를 통해 B2B AI 적용 ‘실증 사례’를 대거 확보함으로써 초거대 AI 경쟁에서 확실한 우위를 점하겠다는 강한 의지가 담겨 있다는 분석이다.
14일 진행된 ‘LG AI 토크 콘서트’에서 배경훈 LG AI연구원장이 ‘초거대 AI’ 관련 성과를 발표하고 있다. 이날 LG는 자사 초거대 AI '엑사원'을 공개했다.
14일 진행된 ‘LG AI 토크 콘서트’에서 배경훈 LG AI연구원장이 ‘초거대 AI’ 관련 성과를 발표하고 있다. 이날 LG는 자사 초거대 AI '엑사원'을 공개했다.

모든 데이터 학습하는 ‘멀티 모달’ AI

이날 LG AI연구원이 엑사원을 공개하며 방점을 찍은 가장 강력한 요소는 ‘멀티 모달(multi-modality)’이다. 기존 국내 초거대 AI 개발은 언어 모델 구성에 머물러 왔다. 글을 해석하고 써내는 능력은 갖췄지만, 할 수 있는 일이 챗봇 등에 한정돼 있었다. 멀티 모달은 텍스트 음성 이미지 영상 등 서로 다른 양식의 데이터를 자유자재로 이해하고 변환할 수 있다. 마치 사람과 같이 배우며 생각하고 추론할 수 있다는 얘기다. 한국어, 영어도 원어민처럼 구사하는 것은 물론 시각, 청각 등 다양한 감각을 활용한 창작 작업도 할 수 있다. 예를 들어 “호박 느낌의 모자를 디자인해 줘”라고 말하면 주문자의 평소 기호도를 감안해 모자를 직접 디자인해 준다.

초거대 AI가 스스로 그린 호박 모자. “호박 모양의 모자를 만들어줘”라고 말하면 엑사원이 주문자의 평소 취향을 반영해 디자인한다.
초거대 AI가 스스로 그린 호박 모자. “호박 모양의 모자를 만들어줘”라고 말하면 엑사원이 주문자의 평소 취향을 반영해 디자인한다.
LG AI연구원은 6000억 개 말뭉치와 2억5000만 개 이미지를 동시에 학습시켜 엑사원을 완성했다. 데이터 규모로만 보면 세계 최대 수준이다. LG그룹은 LG전자 LG화학 LG유플러스 등 전 계열사를 통해 수년간 데이터를 모아왔다. 엑사원 이름에 10의 18제곱, 100경(京)을 뜻하는 접두어 ‘EXA’가 포함된 점도 이 때문이다. 보유 논문과 특허 등을 학습시켜 전문성을 더하기도 했다.

LG는 계열사에 AI를 적용하는 실험을 줄곧 벌여왔다. 성과도 만만찮다. 신약 후보물질을 AI가 추천하거나 유기발광다이오드(OLED) 디스플레이에 활용되는 600만 개 발광 재료 후보를 AI가 탐지하는 기술이 대표적이다. 배터리 전압과 온도를 학습해 이상 여부를 판매하는 AI, 과거 제품 판매량을 학습하고 원자재 구매 수량을 예측하는 AI도 있다. 일부 과제는 엑사원을 통해 내년도 추가 고도화가 진행될 예정이다. 이 밖에 감정을 이해하는 챗봇, 문헌 정보 분석 및 신소재 발굴 AI 등이 계열사에 전면 도입될 계획이다.

산업계·학계 우군 늘리는 LG

엑사원이 내세운 정체성이 ‘상위 1% 수준의 전문가 AI’다. 마치 전문 인재처럼 그룹사들이 쓸 수 있도록 하겠다는 뜻이다. 연구원은 이를 응용프로그램인터페이스(API) 형태로 구현할 방침이다. 각 계열사가 필요하면 가져다 쓸 수 있도록 공용 도구화하겠다는 얘기다.

LG그룹은 LG전자 LG화학 LG유플러스 등 계열사 실증 단계를 넘어 최종적으로 연구, 교육, 금융 등 사실상 전 분야에 활용할 수 있는 초거대 AI를 목표로 하고 있다. 현재 엑사원의 성능을 가늠할 수 있는 ‘파라미터(매개변수)’는 3000억 개로 국내 최고 수준이다. LG AI연구원은 내년에 이를 6000억 개까지 늘릴 예정이다.

이를 위해 LG AI연구원은 구글과 긴밀한 협력 관계를 구축했다. 엑사원의 성패는 결국 많은 양의 데이터를 얼마나 빠르게 학습시킬 수 있느냐에 달려 있는데, 구글이 컴퓨팅 인프라 확보에 파트너 역할을 하고 있다. 구글은 구글클라우드를 통해 미공개 AI 칩 ‘TPU v4’를 엑사원 구축에 제공하고, 구글브레인이 AI 칩 위에 구동되는 소프트웨어(SW) 골조를 만들었다. LG AI연구원은 ‘멀티 모달’인 엑사원 기능의 주요 축인 언어 모델 개발에 이 칩을 활용한 것으로 알려졌다.

구글로선 LG 엑사원의 성공이 절실하다. 후발주자의 설움 때문이다. AI 프로세서 시장은 엔비디아가 사실상 독점하고 있다. 시장 점유율이 80%가 넘는다. AI업계 관계자는 “초거대 AI는 아직 수익이 없어 인프라 분야도 선점 사업자가 없는데, LG가 계열사를 기반으로 B2B 사업 모델을 안착시킨다면 구글은 엔비디아에 도전할 강력한 레퍼런스를 얻는 셈”이라고 말했다.

LG AI연구원은 내년도에 ‘우군’을 더욱 늘려갈 계획이다. “집단 지성으로 초거대 AI 생태계를 조성하기 위해 국내를 포함한 글로벌 AI 연합군을 결성하겠다”는 목표다. 연합체 운용에서 발생할 수 있는 데이터 보안 문제를 해결하기 위해 ‘엑사원 튜닝’이란 알고리즘까지 자체 개발했다. 배경훈 원장은 “캐나다 토론토대, 미국 미시간대, 서울대, KAIST 등 주요 대학은 물론 여러 외부 기업과 파트너십을 맺어 글로벌 초거대 AI 생태계를 주도해 나가겠다”고 말했다.

이시은 기자 see@hankyung.com