[김인중이 전하는 딥러닝의 세계] <7> 딥러닝 역사의 전환점들

입력2022.02.17 06:38 수정2022.02.17 17:26

AI의 역사에서 대중들에게 널리 알려진 사건들로는 1996년 딥블루가 세계챔피언 가리 카스파로프와의 체스대결에서 승리한 사건, 2011년 왓슨이 제퍼디 쇼에서 퀴즈의 최고수들을 압도한 사건, 그리고, 2016년 알파고가 이세돌 9단과의 대국에서 승리한 사건 등이 있다. 이러한 사건들은 대중들에게 AI에 대한 관심을 불러일으킴으로써 AI와 관련된 산업과 연구에 대한 투자가 활성화되는 계기가 되었다. 그러나, 기술적인 관점에서는 이들보다 훨씬 중요한 전환점들이 많다. 지금까지 AI 분야에는 수 많은 기술들이 출현하였으나 본 글에는 딥러닝을 중심으로 선정한 몇 가지 주요 기술들을 소개하겠다.

오류 역전파 학습 알고리즘

딥러닝의 기반이 되는 신경망은 꽤 오랜 역사를 가지고 있다. 세계 최초의 신경망이 1943년에 발표되었고, 현대 신경망의 주요 개념들을 소개한 퍼셉트론도 1957년에 개발되었다. 그러나 이들은 구조가 간단해서 단순한 작업들만 수행할 수 있었다. 신경망을 이용해 복잡한 작업을 수행하게 된 결정적인 계기는 다층 구조의 신경망을 학습할 수 있는 오류 역전파 알고리즘의 발견이다. 오류 역전파 알고리즘은 1986년 럼멜하트, 힌튼, 그리고 윌리엄스에 의해 개발되었는데 미분공식 중 하나인 연쇄법칙(chain rule)에서 유도되었다. 지금까지 수 많은 학습 알고리즘이 개발됐지만 오류 역전파 알고리즘은 딥러닝에서 가장 널리 사용되는 학습 알고리즘이다.

사전학습에 의한 딥러닝

계층의 수가 증가할수록 신경망은 더 복잡한 작업을 효율적으로 학습할 수 있다. 그러나, 계층이 매우 많은 심층신경망은 오류 역전파 알고리즘만으로는 잘 학습되지 않는다. 이러한 한계를 극복하게 된 계기는 2006년 힌튼이 개발한 심층신뢰망(DBN, deep belief network)이다. 뒤에 설명할 순환신경망 LSTM과 CNN이 각각 1997년과 1998년에 발표되었으나, 본격적인 딥러닝 시대의 시작을 알린 연구는 DBN으로 알려져 있다. DBN의 학습은 먼저 비지도학습 알고리즘에 의해 신경망을 사전학습(pre-train)한 후 일반적인 지도학습 알고리즘에 의해 학습함으로써 이루어진다. 이때 비지도 사전학습이 심층신경망의 학습에 어떠한 역할을 하는지에 대하여 다양한 연구가 있었는데 이는 최근 활발한 비지도학습 연구의 기반이 되고 있다.

CNN, 오류 역전파 알고리즘, 그리고 GPU의 만남

일반인들에게 딥러닝의 위력을 알린 사건이 이세돌-알파고 대국이었다면 AI연구자들 사이에 딥러닝을 알린 사건은 2012년 알렉스넷(AlexNet)이 ImageNet 대규모 영상인식 대회에서 우승한 사건이었다. 우리나라 AI연구자들이 딥러닝에 관심을 갖게 된 계기도 바로 알렉스넷이었다. 알렉스넷은 심층신경망 중에서도 영상처리에 특화된 CNN(합성곱 신경망)의 일종이다. CNN은 1980년에 개발되었으나 1998년 러쿤이 오류 역전파 알고리즘을 CNN에 성공적으로 적용함으로써 그 잠재력이 드러나기 시작했다. 알렉스넷은 많은 사람들에게 GPU를 이용해 구현된 최초의 CNN으로 알려져 있다. 그러나, 실제 CNN 학습에 GPU를 사용한 최초의 사례는 2011년 중국어 필기문자인식대회에서 우승한 시레산(Dan Cireșan)의 다중컬럼 CNN이다. CNN은 영상인식에 탁월한 성능을 보이지만 계산량이 많아 CPU만으로는 학습이 어려웠다. 그런데 GPU기반 병렬처리에 의해 많은 계산이 가능해지자 CNN은 그 성능을 유감없이 보이기 시작했고, 그에 따라 연구도 활발히 이루어졌다. 이 당시에 개발된 대표적인 기술로는 배치정규화와 잔차학습(residual learning) 등이 있는데 이들은 현재에도 매우 중요하게 사용되고 있다.

RNN에 의한 시계열 데이터 처리기술

역사적으로 딥러닝은 영상처리보다 음성인식 분야에 먼저 적용되었다. 그러나, 음성처리 및 자연어처리 분야에 본격적인 변화를 가져온 기술은 RNN(순환신경망)을 이용한 시계열(time-series) 데이터 분석 및 합성 기술이다. 그 전까지 심층신경망은 길이가 일정한 벡터 형태의 정보를 주로 처리할 수 있었는데, 텍스트나 음성과 같은 시계열 데이터는 길이가 일정하지 않아 딥러닝을 적용하는데 어려움이 있었다. 그러나, 2013~14년 RNN LSTM을 이용해 시계열 데이터를 분석하거나 합성하는 기술이 출현하였고, 이는 비슷한 시기에 발전한 단어 벡터화 기술과 결합하여 자연어 처리 분야에 큰 발전을 가져왔다. 현재 RNN은 병렬처리의 어려움과 학습 능력의 한계로 인해 2017년에 개발된 Transfomer에 의해 대부분 대체되었다. RNN에서 Transformer로의 발전 역시 딥러닝 역사의 큰 전환점이다. 그럼에도 불구하고 RNN 시대에 정립된 개념들은 아직도 자연어 및 음성 처리 기술의 근간을 이루고 있다.

생성적 모델과 비지도학습의 발전

딥러닝의 역사에 또 하나의 큰 획을 그은 연구는 2014년에 발표된 굿펠로우의 생성적 적대신경망(GAN)이다. 그 이전까지은 데이터를 분석하기 위한 기술은 많이 발전하였으나, 데이터를 합성하기 위한 기술은 그렇지 않았다. 생성적 적대신경망은 해커와 화이트 해커가 경쟁하며 발전하는 것과 유사한 원리에 의해 학습된다. GAN의 출현은 그 자체로 중요한 의미를 갖는다. 그러나, 그 이상으로 중요한 의미는 데이터를 합성하는 생성적 모델의 열풍을 촉발한 계기가 되었다는 점이다. 이러한 열풍을 타고 새로운 생성적 모델들도 개발되었으며, 과거에 있었던 다른 생성적 모델들에 대한 연구도 더욱 활발히 이루어졌다. 과거에는 AI가 분석은 할 수 있으나 창작은 어렵다는 인식이 있었다. 그러나, 현재의 생성적 모델들은 학습 데이터로부터 배운 지식을 이용해 학습 데이터와 유사한 영상, 텍스트, 음성 등을 합성한다. 무에서 유를 창조하는 창작에는 미치지 못하더라도 모방에 의한 창작까지는 가능해진 셈이다. 추가적으로, 생성적 모델들은 각 학습데이터에 대한 정답이 없이도 데이터만으로도 학습이 가능하기 때문에 최근 활발이 연구되고 있는 비지도학습의 핵심 기반 기술이다.
이와 같이 딥러닝의 역사 속에는 기존의 한계를 무너뜨린 창의적인 연구들이 무수히 많다. 이렇게 빠른 발전이 가능했던 이유는 딥러닝의 확장성에 있다. 딥러닝은 여러가지 아이디어를 포용하기 쉬운 유연한 구조를 가지고 있다. 실제로 연구자들은 머신러닝 분야에서 오랫동안 발전해 온 수 많은 기술과 개념들을 딥러닝에 결합함으로써 개선을 이루었다. 과거에도 우수한 성능을 보인 머신러닝 기술들이 많이 있었으나 딥러닝과 같은 확장성을 보인 기술은 아직까지 없었다. 이러한 확장성과 유연성이야말로 딥러닝의 미래를 더욱 기대하게 만드는 가장 중요한 이유이다.

김인중 한동대 교수

관련 뉴스

1

[안현실 칼럼] 왜 정부는 실패하는가

‘왜 대통령은 실패하는가.’ 김종인 전 국민의힘 총괄선대위원장이 쓴 책의 제목이다. “역대 대통령은 하나같이 탐욕 때문에 쓰러졌다”고 했다. 그는 “(이번 대선에서도) 어차피 양당 후보 가운데 한 명이 당선될 텐데 누가 돼도 나라 앞날이 암울하다”고 전망했다. 그렇다면 탐욕 없는 대통령이 들어서면 내일의 세상은 오늘과 다를 것인가.물음을 바꿔보자. 왜 정부는 실패하는가. 오로지 대통령 때문인가. 이런 질문도 가능하다. 자칭 보수든 진보든 역대 대통령마다 꼭 하겠다고 약속한 규제개혁은 왜 실패로 돌아갔는가. 전부 대통령 탓인가. 대통령이 모두 실패한 이유가 탐욕을 부르는 정치권력 구조 때문만은 아닐 것이다. 정치가 지배하는 것처럼 보이는 권력은 관료집단에 위임돼 그들의 수중으로 들어간다. 관료사회가 변하지 않는 한 본질적으로 ‘정부에서 민간으로의 권력 이동’을 의미하는 규제개혁이 될 턱이 없다.한국행정학회·한국정책학회 주최 ‘차기 정부 운영 대토론회’에서 이재명 더불어민주당 대선 후보는 “우스갯소리 같지만 대한민국에 당이 세 개가 있다. 여당·야당·관당(官黨). 오죽하면 ‘관피아’ ‘모피아’ 이런 이야기가 있겠나”라고 했다. 여당·야당이 국민 선택으로 바뀌어도 관료사회는 바뀌지 않는다는 것이지만, 그래서 어떻게 고치겠다는 것인지 청사진이 없다. 개인기로 돌파할 수 있다지만 시스템 개혁 아니면 그때뿐이다. “임명권력은 선출권력을 따르라”고 윽박지른다고 될 일도 아니다. 기획재정부를 해체해도 관료는 남는다. 탄소중립·에너지전환을 위해 기후에너지부를 만든다지만 관료가 헤쳐모일 뿐이다.윤석열 국민의힘 대선 후보는 경제가 정부 중심에서 민간 중심으로 변해야 한다고 했지만, 그것을 모르는 사람은 없다. 문제는 관료지배 시스템이다. ‘청와대 정부’가 아니라 ‘책임장관제’로 가겠다지만, 장관은 ‘객(客)’일 뿐 자신들이 주인이라는 게 관료사회의 뿌리 깊은 인식이다. 공공부문의 효율성을 높이고 맞춤형 정책 서비스를 제공한다는 디지털 플랫폼 정부 공약도, 메타버스 가상부처를 만들겠다는 공약도 다 공허하게 들리는 이유다. 구시대 마차에 인공지능(AI) 내비게이션을 달겠다는 얘기에 다름 아니다.책임총리, 책임장관제를 보장하겠다는 안철수 국민의당 대선 후보는 ‘테크노크라트 전성시대’를 열겠다고 했다. 전문성을 가진 정통 직업관료와 전문가가 공직사회의 중심이 되도록 하겠다지만, 방법론이 무엇인지 알 수 없다. 경영진단으로 정부와 공공기관의 군살을 빼겠다는 약속도 그렇다. 진단 결과는 늘 정부와 공공기관의 팽창으로 간다는 문제의 본질을 간과하고 있다. 과학기술 부총리, 과학기술 수석비서관 설치가 곧 ‘과학기술 강국’인 것도 아니다. 분권화·자율성과 반대로 옥상옥 계층구조로 갈수록 관료의 파워는 더 세지고, 현장 과학기술자의 위상은 더 왜소해진다.“대통령의 힘을 빼는 정부가 되겠다”는 심상정 정의당 대선 후보는 “혁신가형 정부로 가겠다”고 했다. 대전환 시기에 과거의 관행으로 정부를 운영할 수 없다는 진단은 공감이 가지만, “미래를 위한 최초의 투자자가 돼야 한다”는 능동적인 혁신가형 정부는 말로 되는 게 아니다. 혁신과 상극인 관료주의를 타파하지 않으면, 감사원·검찰까지 개혁하지 않으면 불가능한 일이다. 문제의 본질을 꿰뚫은 사람은 정작 한국행정학회·한국정책학회 토론회에 초대받지도 못한 김동연 새로운물결 대선 후보다. ‘전문직 아닌 공무원(관리직) 정년 폐지’ ‘공무원 20% 감축’ ‘존립 목적을 다한 공공기관은 일몰제 적용으로 소멸’ ‘5급 행정고시 폐지’ ‘관리직 공무원의 공공기관 임용 배제’ ‘인허가 과정 시민배심원제 도입’ ‘판·검사 판결과 구형 재량의 대폭 축소’ ‘부패 공무원 가중 처벌’ ‘청와대·고위공무원 퇴직 후 10년간 취업·소득정보 공개’. 34년 공직 경험으로 관료사회의 급소를 찔렀다. 대한민국의 ‘기득권 카르텔’을 깨겠다는 1호 공약이다. 이 정도는 돼야 대선 공약이라고 할 만하다.왜 대통령은 실패하는가. 이 물음만으론 안 된다. 왜 정부는 실패하는가, 왜 규제개혁은 실패하는가. ‘전관예우’ 적폐 하나 척결하지 못하는 현실에서 부처 신설이나 폐지, 디지털 플랫폼 정부는 껍데기 갈기에 불과하다. 관료개혁 없이는 내일도 오늘의 정부를 볼 수밖에 없다.
2

AI를 가장 잘 활용해 G3로 가자!

AI(인공지능) 1등 국가가 되어 G3로 도약하려면, 먼저 AI를 가장 잘 활용하는 나라가 되어야 한다. 개발도 중요하지만 활용은 더 중요하다. 예를 들어, 의료 AI분야는 R&D 예산으로 개발은 많이 했는데 개발한 AI 기술의 현장 도입속도가 느리고, 그 가치를 인정받지 못해 판매가 안되고 있다. 개발에만 정부 지원이 되니 팔 생각 없는 제품을 만드는 경우가 많이 발견된다는 소식이다. 의료 AI의 발전을 위해선 AI 의료 SW에 대한 수가 적용이 필수다. 식약처에서 90여 개 AI의료기기 허가가 났는데 판매는 10%에 불과하다. 복지부 '수가 대상'에서 대부분 배제되고 있다. AI 의료기술 선점 기회를 놓칠 위기다. 복지부는 “선진국이 안했는데 왜 우리가 먼저 해야하냐”는 후진적 생각을 갖고 있다. G3로 가겠다는 의지가 없는 것이다. 따라서, 새로운 대통령이 나서야 한다. 복지부 설명과는 달리, 미국 유럽은 각각 300개 정도되는 솔루션들이 FDA, CE 인증/승인을 받아 나와 있다. 미국은 이미 정식 수가를 받는 솔루션이 있으며, 다수 솔루션이 NTAP(New Technology Add-on Payment)라는 한시적 보조 수가를 받고 있다. 유럽도 제도권 편입을 위한 제도들을 시행 중이다. 일본은 2022년 초 진료보수개정안을 공표했는데, AI 기반 영상의학 솔루션 수가를 책정했다. 한국의 복지부만 복지부동하는 상황이다.의료 다음 시급한 것이 교육이다. 1968년 국민교육헌장이 G9 한국의 인적자본을 만들어냈다면, G3 한국을 이끌 인재를 양성할 ‘초맞춤형 국민 교육 헌장’을 각계 전문가의 토의를 거쳐 제정해야 한다. 현 오프라인 교육 시스템은 대량 생산 체제에 조응하는 표준형 인재 양성 시스템이며, 온라인 교육도 이를 네트워크로 확장한 것에 불과하다. 초맞춤형 교육은, 데이터와 알고리듬에 기반하여, 개별 학생들의 지식 수준과 동기부여 상태, 목적 의식을 반영하여, 적합한 교육 컨텐트를 제공하여, 현 상황을 정확히 자가 진단하게 하고, 목적한 바를 빨리 이루게 하며, 학습을 포기하지 않도록 돕는다. 초맞춤형 교육 헌장은 한국의 환경을 분석하고, 바람직한 인재상을 설정하며, 인재 양성의 교육 철학과 기술적 방법론을 헌장으로 제정하여, 각급 교육의 혁신을 유도할 것이다.1951년 Radio, 1969년 TV, 2000년 인터넷, 2009년 모바일앱 활용 교육으로 발전해온 EBS가 AI기반 초맞춤형 교육의 전형을 제공하게 하여, 공교육 현장의 부담과 가정의 사교육 부담을 동시에 줄여야 한다. 교사가 부족한 초등학교 영어 및 외국어 교육, 초중고 코딩/AI교육에 AI기반 초맞춤형 교육을 미·영·중 등 경쟁국보다 더 많이 충분히 실시하여, 4차산업혁명시대의 글로벌 인재가 될 기회를 공정하게 제공해야 한다. 지난 정부는 초등학교 저학년에서의 영어 수업을 금지하여, 가정의 사교육 부담을 높였다. 어렸을 때부터 외국어 교육을 잘 받으면, 훨씬 더 기회를 많이 가진 글로벌 인재로 성장할 수 있는데, 공교육이 이를 제공하지 못하면 계층간 기회의 격차가 더 벌어진다. 부유층은 사교육으로 영어 및 외국어 교육을 제공하지만, 중산층은 사교육 부담이 커질 뿐이다. 국가는 모든 학생들이 동등한 수준의 외국어 교육을 받을 수 있는 기회를 공정하게 제공해야 하며, 이는 AI 기반 초맞춤형 교육 체제를 통해 가능하다. 이를 통해 외국어 분야, 코딩/AI 교사 부족 문제를 해결할 수 있으며, 외국어 발음 교육 등을 AI가 반복할 수 있어서, 학생들은 24시간 언제나 외국어 교육을 받을 수 있게 된다. 대학입시에 코딩과 AI를 추가하여, 알고리듬을 이해하는 인재를 배출하며, 나아가 한국을 G3 국가로 만들 글로벌 미래형 인재로 양성하는 동시에, 모든 국민에게 디지털과 AI 시대에서 부를 일굴 수 있는 기회를 공정하게 제공해야 한다. 디지털 인재를 갑자기 백만명 양성하겠다는 정책보다는 국민들이 어렸을 때부터 코딩과 AI 교육을 받아서, 성장할 수 있는 기회를 공정하게 부여하는 것이 더 중요하고 근본적인 접근 방법이다. 단기간의 인위적인 인재 양성은 노력해온 인재의 시장 가치를 떨어뜨리는 부작용을 가져올 수도 있으므로, 4차산업혁명시대에 필수적인 알고리듬 리터러시를 위해서라도 초중고 학생 누구나 코딩/AI 교육을 받을 수 있는 권리와 기회를 제공하는 것이 더 필요하다.이렇게, AI 활용 초맞춤형 교육 혁신을 한국에 선도 적용하고 이 경험을 기반으로 한국 에듀테크 산업을 한국이 G3로 가는 새로운 성장 동력으로 만들어야 한다. 에듀테크 유니콘 기업 뤼이드 등이 세계 10대 기업으로 성장할 수 있는 기반이 될 것이며, 독일과 미국 등이 주도했던 교육 제도의 패러다임을 발전적으로 극복하여 새로운 교육 패러다임을 한국이 세계적으로 주도하는 기회가 될 것이다. 한국은 이제 교육체제도 G3를 목표로 뛰어야 한다.전국의 인프라에도 AI와 사물인터넷(IoT)을 적극 활용하여 지능 인프라(Intelligent Infrastructure)를 확충해야 한다. 전국 이면도로를 AI기반 자동결제 유무료 주차장화하여 공유 재산권의 합법적 활용을 꾀하고, 전국의 인프라를 로봇-프렌들리할 수 있게 순차적으로 전환하면서, 이에 대한 국제 표준을 한국이 주도하고, 사실상의 산업 표준을 만들어 내야 한다. 택배, (실내 외)청소, 주방 설거지 등 국민의 수고를 줄일 수 있는 우선 순위 분야부터 로봇화를 진행하며, AI와 IoT를 통해 전국의 쓰레기 배출 체제를 요일별 배출제가 아닌 완전히 시민의 편의 중심으로 바꾸며 나아가 수퍼빈과 같은 디지털·AI기반 순환경제기업 및 산업이 한국에서 비즈니스 모델 테스트를 마치고, 글로벌 시장으로 진출할 수 있도록 전략적으로 육성해야 한다. 또한, 전국의 모든 가정과 사무실에 AI와 IoT를 통한 에너지 절약 시스템(예: 인코어드 테크놀로지의 에너톡)을 의무적으로 적용하여, 가만히 있어도 전국민이 에너지 절약에 동참하게 되는 사회로 만들어야 한다. 이렇게 의료, 교육, 인프라 부문에 AI를 가장 잘 활용하는 나라로 나아가야 한다. 그래야 세계에서 가장 건강한 나라, 세계에서 가장 똑똑한 국민, 세계에서 가장 간편한 나라를 만들 수 있다. AI기반 의료, AI기반 교육, AI기반 인프라 산업에서도 한국의 기업이 세계 10대 기업이 될 수 있는 것은 물론이다. (3편에서 계속)<이경전 경희대·경영학 & 빅데이터응용학과 교수>
3

"스마트 무인매장하면 인터마인즈 떠오르게 만들겁니다"

인터마인즈는 인공지능(AI) 기술로 유통업계의 디지털 전환을 선도하는 스타트업이다. 딥러닝, 컴퓨터 비전, 센서 기술 등을 활용해 일명 ‘스마트 리테일 솔루션’을 제공하고 있다.김종진 인터마인즈 대표는 2016년에 회사를 창업했다. 그는 LG애드, 롯데백화점에서 광고와 유통 분야에서 근무했다. 보광그룹의 홍보 계열사 인터옥스 대표도 맡았다. 인터마인즈의 모기업인 마인즈랩의 초대 최고경영자(CEO)도 역임했다. 마인즈랩은 음성인식 AI 분야 기업이다.인터마인즈는 소비자가 필요한 상품을 어느 곳에서나 쉽게 구매할 수 있는 시스템을 AI로 구현하기 위해 설립됐다. 딥러닝 기술을 바탕으로 소프트웨어와 하드웨어 기술이 결합한 무인 스토어 상용화가 목표다. 구체적으로 미국의 아마존고 같은 서비스를 내놓는 것이다. 아마존고는 미국 최대 전자상거래 기업인 아마존이 운영하는 세계 최초의 무인 가게다. 계산대와 계산원 대신 AI, 머신러닝 등 첨단 기술이 결제 업무를 처리한다.마인즈랩은 2017년 롯데정보통신과 각종 영상을 분석해 상품 인식이 가능한 스마트 카트를 개발했다. 이듬해 무인 사물인터넷(IoT) 기반 점포도 구축했다. 마인즈랩은 같은 해 농협의 통합 무인 매장 점포와 솔루션도 선보였다. 2019년부터는 이마트와 스마트 결제 키오스크 등을 개발하고 있다.인터마인즈의 AI 기술은 정지된 이미지와 과거 데이터를 기억해 의미 있는 동작을 분석할 수 있다는 것이 강점이다. 고도화된 동영상 인식 엔진도 개발해 다양한 상황에 대응할 수도 있다. 무인 편의점 등에 설치된 카메라에 담긴 고객의 움직임을 AI로 자동 분석하는 ‘스마트 비전(Vision)’ 기술도 보유하고 있다. 스마트 비전 기술을 활용해 냉장고에서 물건을 꺼내기만 해도 카드 결제까지 가능한 스마트 냉장고 ‘도어 팝(Door Pop)’을 개발하기도 했다. 인터마인즈는 AI 기술력을 인정받아 이마트, 신세계아이앤씨, 스톤브릿지벤처스 등으로부터 50억원 이상을 투자받았다.인터마인즈는 지난해 12월 식음료 구독 서비스 스타트업 워커스하이와 AI 무인 판매 사업을 위한 업무협약(MOU)을 체결했다. 워커스하이는 롯데칠성음료의 사내 벤처로 출발한 스타트업이다. 두 업체는 AI 기반의 자동화 판매 장치를 개발할 계획이다. 김 대표는 “비대면화 경향이 뚜렷해지고 있는 유통 시장에서 가장 혁신적인 쇼핑 채널을 선보일 것”이라고 밝혔다.김주완 기자