LLM이 대세?…'가성비' 무장한 sLLM도 있다

최진석 기자

입력2023.04.21 16:56 수정2023.05.21

마이크로소프트(MS)와 손잡은 오픈AI의 챗GPT, 구글 람다 등 빅테크 대형언어모델(LLM)이 경쟁하는 가운데 소형언어모델(sLLM) 출시 행렬도 이어지고 있다. 소형언어모델은 파라미터(매개변수가) 대형에 비해 적지만 훈련 및 운영 비용 부담 또한 낮다. 또한 LLM과 달리 오픈소스로 공개해 누구나 무료로 사용할 수 있다는 장점도 있다. 빅테크 간 LLM 기술 경쟁과 함께 소형언어모델과의 주도권 경쟁도 뜨거워질 것이라는 전망이 나온다.

‘가성비’ 앞세운 소형언어모델 ‘러시’

21일 관련 업계와 외신 등에 따르면 미국의 인공지능(AI) 스타트업 스테빌리티닷AI는 최근 소형언어모델 ‘스테이블LM’을 출시했다. 텍스트와 이미지, 코드를 생성할 수 있는 대화형 오픈 소스 언어 모델이다. 파라미터 규모는 30억, 70억개 두 가지 버전이다. 챗GPT 등 LLM과 달리 오픈소스로 공개했다. 누구나 스테이블LM을 무료로 사용해 새로운 제품이나 기술을 만들 수 있다.

언어 모델의 크기를 결정하는 파라미터는 오픈AI GPT-3.5의 경우 1750억개, 구글 람다는 1370억개에 달한다. 이에 비해 소형언어모델은 파라미터가 수십억 내지 수백억대로 상대적으로 적다. 소형언어모델은 미세조정 과정을 통해 다른 LLM의 성능을 따라잡을 수 있도록 한 것이 특징이다. 훈련 및 운영 비용도 저렴해 적은 부담으로 활용할 수 있다는 장점이 있다.

스테이블LM에 앞서 스탠포드대학교 연구진의 ‘알파카’, 데이터브릭스 ‘돌리’, 갓잇AI의 ‘엘마’ 등이 출시됐다. 파라미터 규모가 70억개인 알파카의 경우, 컴퓨터 8대를 이용해 3시간 만에 훈련을 끝냈다. 훈련비용은 600달러(약 80만원) 정도다. 오픈AI의 GPT-3는 훈련비용으로 1000만달러(약 132억원)이 투입된 것으로 알려져 있다.

스탠포드 연구진은 알파카의 성능을 측정한 결과 기대 이상이라고 평가했다. 이메일이나 소셜 미디어의 글 작성, 생산성 도구 등에서 알파카는 90개 항목, GPT는 89개 항목에서 성능이 상대보다 앞섰다는 것이다. 하지만 소형언어모델의 경우 미세조정을 해주지 않으면 성능이 크게 떨어지는 현상도 보였다.

갓잇AI의 엘마는 클라우드를 활용하지 않는 온프레미스(사내구축형)를 겨냥한 모델이다. 피터 레란 갓잇AI 회장은 “모든 기업이 크고 강력한 모델이 필요한 것은 아니다”라며 “데이터가 외부로 반출되는 것을 원하지 않는 기업도 많다”고 설명했다. 보유한 데이터를 활용해 맞춤형 언어 모델을 구축하려는 기업들도 있다는 것이다.

LLM vs sLLM 주도권 싸움 격화되나

오픈AI의 챗GPT를 앞세운 MS와 구글, 메타, 아마존 등 빅테크 간 생성AI 경쟁이 치열한 상황이다. 주도권 경쟁에서 치고 나간 챗GPT를 견제하기 위해 테슬라 최고경영자(CEO)인 일론 머스트 뛰어들었다. 미국 네바다주에 엑스닷에이아이를 설립한 그는 “‘트루스GPT’를 개발하겠다”고 선언한 상황이다.

GPT-4 기반 생성AI 모델도 쏟아져 나오고 있다. 이 중 가장 주목받고 있는 건 오토GPT다. AI 스타트업 시그니피컨트그래비타스가 지난달 말 내놓은 오토GPT는 최종 목표만 설정해 놓으면 스스로 목표 달성을 위한 작업을 수행해 결과를 내놓는다. 챗GPT를 사용할 때 사람이 직접 입력해야 하는 프롬프트(지시어)를 스스로 생성할 수 있다는 것이다.

예를 들어 오토GPT를 요리사라고 설정하고 “부활절과 같은 특정 기념일에 사용할 독창적인 레시피를 만들어달라”고 명령하면 오토GPT가 직접 레시피를 찾기 위해 검색하고, 시행착오를 거치는 ‘자율반복’ 과정을 통해 새로운 레시피를 내놓는 작업을 수행할 수 있다. 이를 두고 일각에선 오토GPT가 범용인공지능(AGI)과 가장 가깝다는 평가도 나온다. 반면, 지나친 기대감은 섣부르다는 평가도 있다. 엔비디아에서 AI를 연구하는 짐 판 리서치 과학자는 “오토GPT가 간단한 특정 작업은 잘 해결할 수 있지만, 어려운 작업의 경우 신뢰할 수 없었다”라며 “중요하고 복잡한 의사결정을 안정적으로 해결하는 것은 불가능하다”고 지적했다. LLM과 이를 기반으로 개발한 생성AI 모델들이 계속 등장하는 상황에서 개인정보유출 등 다양한 부작용이 우려되는 만큼 이에 대한 적절한 통제가 필요하다는 의견도 있다.

업계에선 빅테크 간 LLM 경쟁과 함께 LLM과 sLLM 간 영역 싸움도 갈수록 치열해질 것으로 보고 있다. 폐쇄형인 LLM과 오픈소스를 강점으로 내세운 sLLM 진영이 시장의 주도권을 놓고 경쟁한다는 것이다.

최진석 기자 iskra@hankyung.com

관련 뉴스

1

"이게 나왔어?" 500만명 '우르르'…넷마블 주가 '기대감 폭발'

넷마블이 신작 액션게임 '나 혼자만 레벨업:어라이즈'(나혼렙) 흥행에 반색하고 있다. 최근 출시된 '나혼렙'은 현재 국내 양대 애플리케이션(앱) 마켓 상위권에 오르는 등 상승세를 타고 있다.'나혼렙'은 17일 기준 구글 플레이스토어 누적 다운로드 수 1000만회를 돌파했다. 게임 인기 순위로는 1위다. 애플 앱스토어에선 4위에 올랐다. 출시 당일인 지난 8일엔 애플 앱스토어에서도 매출 1위를 달성했다. 구글 플레이스토어에선 출시 닷새 만에 매출 1위를 기록했다. 첫날 매출만 140억원, 일간활성이용자수(DAU)는 500만명을 기록했다.글로벌 흥행에도 청신호가 켜졌다. 출시 당일 애플 앱스토어 기준으로는 79개국, 구글 플레이스토어 기준 66개국에서 인기 게임 순위 1위를 차지했다. 싱가포르, 프랑스 등 글로벌 15개국에서 구글 플레이스토어 매출 톱10에 들었다.액션 역할수행게임(RPG)인 '나혼렙'은 2018년 연재를 시작해 전 세계 누적 조회수 143억회를 기록한 동명의 인기 웹툰을 기반으로 제작됐다. 올 1월엔 애니메이션으로도 방영됐는데 넷플릭스, 크런치롤, 애니플러스 등 글로벌 온라인동영상서비스(OTT) 최상위권에 오를 만큼 인기를 끌었다.'나혼렙'의 흥행 기대감은 사전등록에서부터 고조됐다. 넷마블이 지난 3월 국내를 포함해 글로벌 전역에서 사전등록을 진행한 결과 사전등록 이틀 만에 100만명이 몰렸고 출시를 하루 앞둔 지난 7일 사전 등록자 수는 1500만명을 돌파했다.넷마블은 올해 1분기까지 2개 분기 연속 영업이익이 흑자 전환했다고 밝혔다. 지난해 3분기까지만 해도 7개 분기 연속 적자에 허덕였지만 올해 실적 기대주로 떠오를 정도로 상황을 반전시켰다. 넷마블은 &#
2

'머스크 라이벌 등장'에 환호…"고졸 괴짜 촌뜨기" 그는 누구?

지난달 24일 오전 7시32분 뉴질랜드 마히아 발사장. 국내 최초 양산형 초소형 군집위성인 ‘네온샛 1호’가 로켓랩의 일렉트론 발사체에 실려 힘차게 솟아올랐다. 오후 3시44분 남극 세종과학기지 지상국과 교신에 성공하자 위성을 제작한 KAIST에서 탄성이 터져 나왔다. 대한민국 우주 개발의 한 페이지가 장식되는 순간이었기 때문이다. 네온샛 발사 성공을 바란 사람은 또 있었다. 일렉트론 제작사인 로켓랩 창업자 피터 벡 최고경영자(CEO)다. 국내 위성이 로켓랩의 발사체를 이용한 것은 이번이 처음이다. ○스페이스X의 대안으로 부상한 로켓랩17일 업계에 따르면 로켓랩은 뉴질랜드 출신인 벡 CEO가 2006년 설립한 민간 로켓 회사다. 벡 CEO는 로켓을 만들고 싶다는 꿈 하나로 독학으로 공부해 창업까지 한 ‘괴짜형 천재’다. 고등학교 졸업 후 대학에 진학하지 않고 취업 전선에 뛰어들어 현장에서 소재와 가공 기술을 익혔다. 몸으로 터득한 로켓 엔지니어링을 바탕으로 2006년 30세에 로켓랩을 창업했고, 2009년 자신이 개발한 최초의 로켓인 ‘아테아-1’ 발사에 성공하며 남반구 기업 최초로 로켓을 우주에 진입시켰다.2013년 벡 CEO는 사업을 확장하기 위해 미국 실리콘밸리로 건너가 백방으로 투자자를 찾아다녔다. 하지만 검증되지 않은 그에게 시간과 돈을 쓰려는 투자자는 없었다. 당시 실리콘밸리 벤처업계에선 벡 CEO를 가리켜 ‘미친 키위(crazy kiwi)’라고 불렀다. 연구자 정통 코스를 밟지 않은 채 허황한 꿈을 꾸는 ‘뉴질랜드 촌뜨기’라고 비꼰 것이다.자금 조달이 원활하지 않자 벡 CEO는 2013년 본사를 미국 캘리포니아로 옮겼다. 이후 록히드마틴의 눈에 띄어 투자를
3

엔비디아 GPU보다 2배 빠르다…'괴물칩' NPU 베팅한 리벨리온

인공지능(AI) 패권을 둘러싼 빅테크 기업 간 경쟁이 치열해지면서 AI 반도체의 가치가 뛰고 있다. 그동안 이 분야에서는 엔비디아의 그래픽처리장치(GPU)가 공급량의 90% 이상을 점유했다. 최근엔 신경망처리장치(NPU)가 GPU의 대체재로 떠오르고 있다.17일 업계에 따르면 국내에서 가장 앞선 NPU 경쟁력을 보유한 기업으로는 스타트업 리벨리온이 꼽힌다. 박성현 리벨리온 대표(사진)의 이력은 화려하다. KAIST 전기및전자공학과를 수석 졸업한 뒤 미국 매사추세츠공대(MIT) 전기공학 및 컴퓨터과학부에서 석·박사 학위를 취득했다. 이후 인텔과 스페이스X를 거쳐 모건스탠리에서 상무급으로 퀀트(계량분석) 트레이딩을 담당했다. 이후 한국으로 건너와 2020년 리벨리온을 창업했다.과학기술정보통신부는 이창윤 1차관 주재로 지난 16일 경기 성남 리벨리온 본사에서 ‘이공계 활성화 TF 4차 회의’를 열었다. 이 회사의 주력인 NPU가 AI 시대의 핵심 부품으로 떠올라서다. NPU는 인간의 두뇌를 모방한 반도체다. 뇌에서 수많은 신경세포가 서로 연결돼 신호를 주고받는 것과 같은 원리로 작동한다. 통신망 없이 실시간으로 빠르게 데이터를 처리할 수 있어 딥러닝에 최적화된 기술이다.엔비디아 GPU는 고용량 데이터 병렬 연산에 강점을 보여 챗GPT 등 거대 AI를 구동할 때 필수다. 하지만 GPU 기반 AI 칩은 가격이 비싸고, 구동 시 소음과 전력 소모가 심하다. NPU는 범용성은 다소 부족하지만 딥러닝 연산에 특화했다. GPU보다 빠른 연산이 가능하고 전력 효율도 높다. 박 대표는 “엔비디아가 분식(GPU) 맛집이라면 리벨리온은 돈가스(NPU) 맛집”이라고 비유했다.리벨리온은 2021년 아이온(ION) 출시로 NPU 시대의 포문