김인중이 전하는 딥러닝의 세계<4> 새로운 패러다임,초거대 AI

이관우 기자

입력2021.10.21 07:00 수정2021.10.21 07:00

한동대 교수

최근 2~3년간 AI기술의 주요 트랜드 중 하나는 거대 AI모델들의 약진이다. 2018년 GPT와 BERT가 개발된 후 자연어처리 분야에 사용되는 AI모델의 규모는 계속 증가해왔다. 특히 2020년 발표된 GPT-3의 규모와 성능은 큰 화제가 되었다. 이러한 트랜드는 화웨이의 판구알파 및 네이버의 하이퍼클로바로 이어졌으며, 아직 출현하지 않은 GPT-4도 벌써부터 규모와 성능에 대한 궁금증을 자아내고 있다. 초거대 AI모델들이 딥러닝의 새로운 패러다임이 된 이유와 그들의 한계는 무엇인가?

초거대 AI가 출현한 이유

데이터기반 AI들은 작업을 수행하는데 필요한 지식을 데이터로부터 학습한다. 딥러닝 기술의 발전으로 인해 AI의 학습능력은 과거와 비교할 수 없을만큼 강력해졌다. 그럼에도 불구하고 데이터기반 AI의 성능은 여전히 학습데이터의 규모와 품질에 좌우된다. 충분한 학습데이터를 확보할 수 있는 작업에는 높은 성능을 얻을 수 있으나 그렇지 않은 작업에는 높은 성능을 얻기 어렵다.

이러한 한계를 극복하기 위해 널리 사용되는 방법은 타 작업을 위해 학습된 신경망의 지식을 전이해 사용하는 것이다. 목표 작업을 학습하기 위한 데이터가 부족할 경우 데이터가 풍부한 유사 작업에 대하여 신경망을 사전학습한 후 그 모델을 전용하면 목표 작업에서 비교적 우수한 성능을 얻을 수 있다. 예를 들어 소량의 데이터만으로 강아지와 고양이를 구분하는 AI를 개발해야할 경우 대규모 물체영상 데이터로 학습된 신경망을 전용해 상위 1~2개의 계층만을 강아지와 고양이 영상으로 추가학습한다. 이러한 전이학습이 효과적인 이유는 유사 작업을 수행하기 위해 습득한 지식이 목표 작업에도 도움이 되기 때문이다.

전이학습의 효과는 사전학습에 의해 습득된 지식이 풍부하고 목표 작업과 많이 관련될수록 증가한다. 따라서 사전학습에는 일반적으로 대규모 데이터가 사용된다. 풍부한 지식을 학습하기 위해서는 AI의 학습능력 역시 강력해야 하는데, 이는 거대모델들이 사용되는 가장 중요한 이유이다. 잘 학습된 거대모델들은 다양하고 풍부한 지식을 보유하고 있어서 목표 작업에 전용될 경우 소량의 학습데이터만으로도 우수한 성능을 얻을 수 있다. 이들은 여러 작업에 전용될 수 있는 기반지식을 보유하고 있다는 의미에서 기반모델(foundation model)이라고 불리운다.

초거대 기반모델들의 원리와 한계

대표적 기반모델인 GPT-3는 뛰어난 성능에도 불구하고 여러 한계를 노출하였는데 기반모델들의 원리를 이해하면 그 이유를 쉽게 찾을 수 있다. 기반모델들은 특정 작업을 목표로 학습되기 때문에 일반성에 한계를 갖는다. 자연어처리 분야에서 널리 사용되는 사전학습 방법은 AI모델이 주어진 텍스트로부터 다음 단어, 또는 텍스트 가운데 빈 단어를 맞추도록 학습하는 것이다. 이 방법은 별도의 정답 레이블을 요구하지 않기 때문에 대규모 데이터로부터 유용한 지식을 학습하는데 효과적이다. 그러나, 이러한 사전학습을 통해 AI가 습득한 지식은 내용에 대한 이해가 아니라 전후의 문맥으로부터 단어를 맞추기 위한 조건부 확률이다. 학습 완료 후 사용시에는 조건부 확률에 의해 단어들을 순차적으로 예측함으로써 문장을 합성한다. 조건부 확률이 학습데이터의 분포를 반영하기 때문에 GPT-3가 합성한 문장은 보통 언어적으로 적법하며 내용도 제법 타당하게 보인다. 또한 막대한 양의 데이터로부터 학습되었기 때문에 여러 질문에 적절히 답할 수 있다.

조건부 확률이 충분히 정확하여 주어진 질문에 대한 답을 적절히 합성할 수 있다면 GPT-3가 텍스트를 어느정도 이해했다고 볼 수도 있다. 그러나 합성된 문장의 사실성, 논리적 무결성, 상황에 대한 적절성 등을 보장하기에는 충분하지 않다. 학습데이터에 포함되지 않았고 여러 단계의 추론을 필요로하는 질문, 비유나 암시, 중의적 표현이 포함된 문장 등이 입력될 경우 부적절한 답을 출력하기도 한다. 그 외에도 현재의 기반모델들은 지식 표현 및 학습 방식이 비효율적이어서 막대한 계산을 요구하며, 높은 수준의 추상화가 어렵고, 인과관계나 수학적/물리적 개념을 이해하지 못한다. 윤리성, 양심, 배려 등을 기대하기 어려운 것은 물론이고 데이터에 존재하는 오류나 편견, 부적절한 표현 등을 여과없이 학습할 위험성도 있다. 또 한가지 심각한 문제는 기반모델을 이용한 AI가 증가하고 있음에도 불구하고 기반모델이 학습한 내용이 무엇인지 검증하기 어렵다는 점이다.

지금까지 개발된 초거대 기반모델들은 의미있는 성과인 동시에 많은 한계를 가지고 있다. 대규모 기반모델에 대하여 지나치게 기대하거나 현재의 기반모델들이 가진 한계에 너무 실망하기보다는 지속적인 연구를 통해 위에서 열거한 문제점들을 극복하는 동시에 부작용이 최소화되도록 지혜롭게 활용하는 것이 바람직하다.

한동대 교수

관련 뉴스

1

의사가 놓친 폐질환 찾아내고, 수학문제 3초 안에 풀어주는 AI

헬스케어, 메타버스, 자율주행차, 핀테크, 교육, 반도체, 로봇, 법률, 패션, 인테리어, 마케팅….‘코리아 AI 스타트업 100 선정위원회’가 선정한 100대 인공지능(AI) 스타트업의 사업 분야다. 미래 핵심 신산업과 한국의 주요 산업을 총망라한다. 이는 AI가 전(全) 산업을 아우르는 기반 기술임을 보여주는 동시에 국내 AI 스타트업의 활약이 전방위로 확산되고 있는 증거라는 평가가 나온다. 선정위원회는 100대 기업 중 절반 이상이 향후 5년 안에 ‘유니콘기업(기업가치 1조원 이상 스타트업)’이 될 가능성이 있다고 평가했다. 루닛·뷰노·스탠다임, AI로 의료산업 혁신유망 AI 스타트업을 선정하는 프로젝트로 글로벌 시장조사기관 CB인사이트의 ‘글로벌 100대 AI 스타트업’이 잘 알려져 있다. 유망 AI 기업·기술을 조명하고, 스타트업에 대한 투자를 유도함으로써 AI 생태계 활성화에 기여한다는 평가를 받는다. 코리아 AI 스타트업 100 프로젝트는 비슷한 성격의 민간 주도 행사를 국내에서도 열어보자는 시도다. 한국경제신문과 KT AI원팀이 기획했다. AI원팀은 KT가 중심이 돼 만든 산·학·연 AI 협력체다. 100대 AI 스타트업 선정은 학계·산업계·투자업계 전문가로 꾸린 외부 선정위원회가 수행했다.약 5개월간의 평가·심사 끝에 개별 산업 17개 분야 68개 업체, 산업공통 6개 분야 32개 업체가 100대 AI 스타트업으로 선정됐다.개별 산업 분야에선 헬스케어가 15곳으로 가장 많았다. 한국의 바이오헬스산업이 세계적 수준으로 성장하자 AI와 헬스케어의 융합도 활발해졌다는 평가다. AI로 각종 질병을 조기에 정확히 진단해주는 기술 개발이 특히 활발하다. 루닛과 뷰노가 대표적이다. 루닛은 폐암을 비롯한 폐 질환을 찾아내는 ‘루닛 인사이트 CXR’ 등을 개발했다. CXR은 제너럴일렉트릭(GE), 필립스 등 글로벌 의료기기 업체가 도입할 정도로 기술력을 인정받고 있다. 뷰노는 뼈 나이를 측정해주는 ‘뷰노메드 본에이지’와 알츠하이머 진단 보조 의료기기 ‘뷰노메드 딥브레인’으로 잘 알려져 있다. AI로 신약 개발 성공률을 높여주는 플랫폼을 보유한 스탠다임도 AI 스타트업 100에 이름을 올렸다. 딥바이오, 메디픽셀, 제이엘케이 등 헬스케어 AI 기업도 명단에 포함됐다. 세계적 기업 성장한 매스프레소·뤼이드미디어·콘텐츠(9개), 금융·보험(9개), 교통·운송(9개), 교육(8개) 등 분야에서도 대표 AI 스타트업을 많이 배출했다. 미디어·콘텐츠 분야는 센드버드, 딥브레인AI, 마이셀럽스, 보이저엑스, 비브로컴퍼니 등이 선정됐다. 센드버드는 올 4월 1억달러 규모 시리즈 C 규모 투자를 유치하며 유니콘 반열에 올랐다. 이 기업은 기업용 온라인 채팅 플랫폼을 제공한다. AI 기반으로 고객사 특징에 맞게 맞춤형 서비스를 제공해 채팅 솔루션 분야 세계 1위에 올라 있다.금융 분야에선 파운트, 디셈버앤컴퍼니자산운용, 아이지넷, 어메스, 콰라소프트 등이 이름을 올렸다. 최근 금융 AI업계에선 AI 알고리즘이 금융 시장을 분석해 투자자의 자산을 운용해주는 ‘로버어드바이저(RA)’가 주목받고 있다. RA 시장 규모는 2019년 9600억원에서 올 7월 말 1조8000억원으로 커졌다. 파운트와 디셈버앤컴퍼니자산운용은 RA 시장의 선두주자로 꼽힌다.교통 분야에선 자율주행차 관련 AI 솔루션을 개발하는 스타트업의 활약이 커지고 있다. AI 스타트업 100에도 선정된 스트라드비젼, 팬텀AI, 라이드플럭스, 아우토크립트, 인피닉 등이 대표적이다. 스트라드비젼은 자율주행차용 AI 기반 카메라 인식 소프트웨어(SW)를 만든다. 국내외 10여 개 자동차 회사의 1300만 대 차량에 자사의 SW를 공급하고 있다.교육 분야의 매스프레소와 뤼이드는 세계적인 기업으로 평가받는다. 매스프레소가 만든 ‘콴다’ 앱은 세계 50여 개국에서 1200만 명이 이용하고 있다. 콴다는 수학 문제를 사진으로 찍어 올리면 평균 3초 안에 상세한 문제 풀이를 제시해준다. 뤼이드는 AI 기반 토익 학습 앱 ‘산타토익(현 뤼이드 튜터)’으로 유명하다. 3억 건 이상의 토익 데이터를 학습시킨 AI로 맞춤형 교육 서비스를 제공해준다. 몰로코 로앤컴퍼니 퓨리오사AI 등도 AI 100 선정 몰로코는 세일즈·마케팅 분야에서 대표 AI 기업으로 선정됐다. 몰로코는 "어떻게 하면 광고를 잘 할까"라는 기업들의 영원한 숙제를 AI로 해결해주고 있다. 독자적인 AI 머신러닝(기계학습) 알고리즘과 빅데이터 분석으로 광고의 수익성을 극대화해준다. 디즈니, 넥슨, 넷마들 등 대기업을 고객사로 두고 있다. 증강·가상현실(AR·VR) 등 메타버스 기술을 인테리어에 접목한 어반베이스도 AI 대표 스타트업으로 뽑혔다. 법률 분야에선 로앤컴퍼니가 유일하게 AI 스타트업 100에 선정됐다. 로앤컴퍼니는 '로톡'이란 앱으로 AI 기반 형량 예측 솔루션을 구현한 기업이다. 이 회사는 올 하반기 법률 전반의 리서치 업무 효율성을 AI로 향상시키는 서비스를 새로 내놓을 예정이다. 다양한 산업에 사용 가능한 AI 솔루션·플랫폼을 개발하는 스타트업도 13곳이 선정됐다. AI가 작동하려면 데이터를 AI 분석에 맞게 가공하는 '라벨링'이 필수적이다. 슈퍼브에이아이는 라벨링 분야 높은 전문성으로 삼성전자, 현대자동차, LG 등에 서비스를 제공하고 있다. AI 산업이 커지면서 AI 분석에 특화된 'AI 반도체' 개발 경쟁이 세계적으로 치열하다. 한국의 퓨리오사AI, 리벨리온, 딥엑스 등은 독자적인 AI 반도체 기술을 확보해 성장 가능성이 크다는 평가를 받았다. 코리아 AI 스타트업 100 시작을 기념해 이날 서울 잠실 소피텔앰배서더호텔에서 열린 콜로키움 행사는 유튜브에서 다시 보기를 할 수 있다. 서민준 기자 morandol@hankyung.com
2

매출·독창성·ESG…평가 모델 개발에만 3개월

차세대 인공지능(AI) 생태계를 이끌 스타트업 ‘100대 리스트’는 업체가 지닌 가능성을 과학적으로 분석한 결과물이다. 연구기관 위탁을 통해 AI 스타트업용 평가 모델을 수립하고, 학계·산업계·벤처캐피털(VC) 등 각 분야 고위 전문가들로 구성된 선정위원회가 힘을 보탰다.선발 과정 핵심인 스타트업 평가 모델은 KAIST AI대학원과 경영대학 교수진이 담당했다. 지난 5월부터 개발에 착수해 3개월이 소요됐다. 정량 지표와 정성 지표를 모두 고려해 우수한 ‘교집합 기업’을 찾으려 한 점이 특징이다.정량 지표에는 시장·재무·인력·제품 4개 영역이 반영됐다. 세부적으론 목표 시장 규모와 매출·기업가치 등 기본 요소, 창업자 과거 창업 성공 횟수, 경영관리 경험, AI 제품 매출 비중 등도 담겼다. 정성 지표엔 창업 배경에 대한 스토리텔링, 비즈니스 모델의 독창성 등 정량 요소가 반영하지 못하는 사항을 지표화했다. 환경(E)·사회(S)·지배구조(G) 등 사회적 영향력까지 따졌다는 설명이다.100개사 최종 선정 작업까지는 추가로 3개월이 더 걸렸다. 선정위원회(위원장 이경전 경희대 교수)가 예정된 기한을 넘기면서까지 촘촘한 종합 토론을 더했다. 임종우 한양대 AI대학원 학과장, 최호영 LG전자 인공지능연구소 리더, 송은강 캡스톤파트너스 대표 등 전문가 10인이 참여했다. 올해 선정 경쟁률은 약 3 대 1을 기록했다.이시은 기자 see@hankyung.com
3

"가짜 AI기업 너무 많아…'진짜'끼리 모여 변화 바람 일으키자"

“요즘 인공지능(AI)이란 단어의 힘은 막강합니다. 1990년대 ‘인터넷’, 2000년대 ‘모바일’이라는 키워드가 그랬듯 AI가 붙으면 일단 주목을 받습니다. 이런 시기엔 ‘진짜 AI’ 기업들이 현실 문제를 제대로 해결해내는 게 중요합니다.AI 스타트업 뤼이드의 장영준 대표는 20일 서울 잠실 소피텔앰배서더호텔에서 열린 ‘코리아 AI 스타트업 100 콜로키움’의 기조강연자로 나서 이렇게 말했다. 그는 “이름에 AI만 붙으면 많은 투자금을 끌 수 있는 분위기다 보니 발뒤꿈치 각질제거기 이름에도 AI가 붙을 정도”라며 “이번 기회에 선별된 곳들은 ‘진짜 AI’ 기업으로 볼 수 있다. 힘을 합쳐 변화를 이루자”고 제안했다. 뜻을 함께하는 스타트업이 모여 논문을 함께 쓰자는 의견도 냈다. 장 대표는 “AI 기술로 사용자의 불편한 점을 해결하는 것이 ‘AI 붐’ 이후 기업 생존 여부의 관건이 될 것”이라며 “AI 스타트업 100 콜로키움을 통해 각 스타트업이 데이터를 구축하고, 각자 발견한 사업 인사이트나 기술을 함께 나누게 되길 바란다”고 했다.남세동 보이저엑스 창업자 겸 대표는 딥러닝 기반 스타트업의 잠재력에 대해 발표했다. 딥러닝은 컴퓨터가 스스로 반복학습을 통해 수많은 데이터 처리법을 익히고 축적하는 방식이다. 이를 통하면 막대한 데이터를 순식간에 처리하고, 처리 방식을 계속 자체 고도화하는 고기능 소프트웨어를 만들 수 있다. 이는 사람이 특정 데이터 처리 방식을 입력하는 기존 프로그래밍만으로는 절대 구현할 수 없는 일이다. 남 대표는 “지금은 작아 보여도 앞으로는 크게 성장할 수 있는 AI 기술이 매우 많다”고 강조했다.이어진 좌담회에선 한국이 AI 강국으로 도약하기 위해 국내 AI산업 생태계가 ‘환골탈태’해야 한다는 지적이 나왔다. 이경전 경희대 경영학·빅데이터응용학과 교수는 ‘AI스타트업이 유니콘으로 가기 위한 혁신 생태계 조성’을 주제로 한 기조발제에서 “혁신은 정보기술(IT) 분야 창업·경영자만이 아니라 온 국민이 동시에 하는 과제”라고 강조했다. 이 교수는 “아직까지 국내 AI산업 생태계는 혁신과 성장에 대한 책임을 기업가에게만 지우는 것이 문제”라며 “정부뿐만 아니라 기업 임직원·노동조합과 시민단체 등도 각각 혁신의 주체임을 인식하고 국가·도시·학교 등 각 단위에서 전방위적 ‘동시 혁신’을 이뤄야 한다”고 설명했다.AI 스타트업 투자 생태계를 민간 위주로 재편하기 위한 논의도 이어졌다. 유망한 스타트업이 빠르게 클 수 있도록 초반부터 자금 지원이 활발히 이뤄지도록 해야 한다는 얘기다. 토론에 참여한 이병헌 대통령비서실 중소벤처비서관은 “국내 벤처캐피털(VC)의 투자는 어느 정도 성장해 자리를 잡은 스타트업 위주로 이뤄지고 있기 때문에 이것만으로는 스타트업 생태계의 지속 가능성이 보장되기 힘들다”며 “정부는 그 앞단 격인 초기 스타트업에 투자를 늘리고 AI·스타트업 분야 교육 과정 등도 지원할 것”이라고 말했다.송은강 캡스톤파트너스 대표는 “일각에선 최근 AI 스타트업 투자 붐을 두고 ‘거품’이라고 우려하지만 실제는 그렇지 않다”며 “지금은 수요와 공급이 일치하는 수준”이라고 했다. 그는 “예전엔 행정·사법고시를 봤을 인재들이 이제는 스타트업을 창업하고 있다”며 “VC들은 이 생태계를 지원하기 위해 꾸준히 노력할 것”이라고 했다.선한결 기자 always@hankyung.com