문병로 서울대 컴퓨터공학부 교수 "알파고, 이번엔 질 것…다음 승부는 장담 못해"

입력2016.03.06 20:03 수정2016.03.07 00:11 지면A17

알파고·이세돌 대결 이렇게 본다

알파고의 바둑 실력은…
3000만 수·16만 판 훈련…입력값 1만7000개 넘어
다음 착점 적중률 57%

인공지능, 이제 시작일뿐
발전속도 워낙 빨라 프로기사 수준 곧 능가
AI 한계 예측 어려워

전문가의 예측이 허망하게 틀리는 것을 보는 재미는 의외로 쏠쏠하다. 역발상 투자의 대가로 불리는 데이비드 드레먼에 따르면 미국 애널리스트들의 분기 예측치 50만건을 분석한 결과 평균 44%나 틀렸다. 월스트리트저널이 경제학자들의 6개월 후 금리 예측을 13년 반 동안 조사해본 결과 총 27번의 예측 중 무려 20번이나 방향이 틀린 것으로 나타났다. 공학자인 필자도 비슷한 경험을 했다.

문병로 서울대 컴퓨터공학부 교수 "알파고, 이번엔 질 것…다음 승부는 장담 못해"

인공지능학자도 예측 못한 발전

2009년 한 일간지 바둑전문 기자가 프로 바둑기사에게 8점을 놓고 이긴 컴퓨터 사례를 들며 언제쯤 대등한 조건에서 프로 기사를 이길 컴퓨터가 나올지 물었다. 자신있게 대답했다. “100년 내로는 절대로 못 이긴다. 추상적 사고가 큰 영향을 미치는 바둑에서는 턱도 없다.” 나는 이 의견과 일화를 지난 7년간 재미있는 안줏거리로 삼았다. 2년 전에는 8점 차이가 4~5점 차이로 줄어들었지만 나는 여전히 여유만만했다.

지난 1월28일 서울 강남구 역삼동 구글코리아에서 열린 알파고와 이세돌 9단의 대국 설명회.

2012년 변화의 조짐이 왔다. 세계적인 화상인식대회(ILSVRC)에 참가한 제프리 힌튼 캐나다 토론토대 교수 연구진은 딥러닝(인공지능이 외부 데이터를 분석해 스스로 의미를 찾는 학습 과정)을 통해 이미지 인식의 오류율을 26%에서 단박에 15%까지 낮추며 우승을 차지했다. 통상적 속도였으면 20년 이상 걸릴 기술적 진보였다. 이 사건을 계기로 딥러닝은 컴퓨터 과학 최고의 ‘핫 키워드’가 됐다. 구글과 페이스북은 지난해 이 기술로 팀을 꾸려 경쟁적으로 바둑에 도전장을 냈다.

그럼에도 지난해 구글이 낸 논문을 봤을 때는 내 호언장담을 조금이라도 재고할 필요가 없다고 생각했다. 구글이 지난 1월 네이처지에 발표한 알파고 논문도 접근 방식만 보면 프로 기사를 상대하기엔 역부족한 것처럼 보였다.

하지만 실제 바둑 대결의 결과는 충격적이었다. 유럽의 프로바둑 챔피언을 지낸 판후이 2단에게 다섯 번을 내리 이겼기 때문이다. 한·중·일에 비해 상대적으로 약하지만 그래도 유럽 챔피언을 압도적으로 이겼으니 알파고는 세계 정상급 기사들과는 2점차 이내로 바짝 따라 붙은 것이다.

하드웨어 진보 인공지능 훈련효과 높여

알파고가 다른 바둑 프로그램들을 압도하게 된 결정적인 요인은 두 가지다. 하나는 탐색 비율을 현저히 높인 것이고, 범용그래픽처리장치(GPGPU)로 상징되는 계산 성능의 혁명적 진화도 있었다. 알파고는 인공신경망의 일종인 정책망과 가치망을 결합한 기술이다.

정책망은 다음 착점 후보들을 추려내는 역할을 하고, 가치망은 어떤 착점이 놓인 후의 승리 가능성을 가늠하는 역할을 한다. 알파고는 이들 신경망 구조를 활용해 유리한 판세를 학습했다. 지금까지 총 3000만 수, 판수로는 16만 판을 훈련했다. 지난해 구글이 낸 논문에서는 알파고가 다음 착점을 예상한 적중률은 49.6%였지만 현재 57%까지 향상됐다. 그만큼 불필요한 착점 탐색이 현저히 줄었다. 알파고의 신경망은 상상을 초월할 정도로 방대하다. 바둑판은 가로세로 19칸씩 총 361칸인데 알파고는 이 각각의 칸에 48가지의 특징값을 할당한다. 현재 놓여진 돌의 색깔, 돌이 놓인 시간, 주변에 빈칸이 얼마나 많은가, 착점 직후 각 자리 주변에 빈칸이 얼마나 많은가, 합법적으로 돌을 놓을 수 있는 자리인가 등이 고려 대상이다. 각각의 칸마다 48개 특징값이 지정되다 보니 입력값만 1만7328개가 된다. 알파고는 이런 입력값과 출력값 사이에 여러 층을 만들어 6억개 이상 연결 선을 가진 거대한 신경망을 만든다.

이것을 가능하게 해준 것이 바로 GPGPU다. 원래 GPU는 그래픽계산 속도를 단축해주는 장치였지만 이제는 일반 계산에 활용되고 있다. 여기에 몬테카를로 시뮬레이션이 결합하면서 인공지능의 실력이 탁월해졌다. 경우의 수가 너무 많지만 임의로 추출한 사례로부터 근사적 결론을 내는 방식이다. 알파고는 이를 정책망과 가치망을 결합해 더 많은 의미있는 착점을 찾을 수 있다.

이세돌 어지럽게 둘수록 유리

알파고의 놀라운 점은 그다지 놀랍지 않은 기술로 이 정도 결과를 내고 있다는 것

다. 실력도 계속 늘고 있다. 알파고는 적당히 좁은 지역에서 판을 마무리하는 능력, 판세가 정해질 때의 전투에 유리하다. 컴퓨터의 계산 능력을 발휘할 수 있는 경우들이다. 지난해 판후이 2단과의 대국에서도 최대한 판을 단조롭게 끌어가려는 경향이 있었다. 이세돌 9단이 초반에 국소적으로 여기저기 확정해 버리는 운영방식은 피하는 것이 좋다.

세력의 추상적 위력, 추상적 관계 같은 부분은 이세돌에게 못 미친다. 넓은 지역에서 어지럽게 벌어지는 전투는 이세돌에게 유리하다. 판후이 2단과의 2국에서 알파고는 중후반에 상대의 말을 쉽게 잡을 수 있는 곳에서 실수를 했다. 위쪽으로 공간이 열려 있는 상황에 대해 적절한 판단을 하지 못했다. 초반 포석과 마찬가지로 돌이 많이 없는 상태에서 팻감 가치를 판단하는 정확도도 떨어지는 것으로 보인다. 이세돌 9단은 상대방을 흔드는 데는 일가견이 있어 알파고가 고전할 가능성이 크다.

인공지능이 바둑기사 조만간 이길 수도

알파고에 대해 잘못 알려진 것도 많다. 대표적인 오해가 알파고가 이세돌과 상대하면서 실력이 늘어 매번 더 세질 것이란 주장이다. 하지만 이는 사실과 다르다. 대국 중에는 알파고는 학습을 하지 못한다. 제아무리 알파고라도 이세돌과 둔 몇 판으로 실력이 향상될 가능성은 적다. 16만 판의 방대한 데이터 속에 이세돌과 둔 몇 판의 데이터가 더해진다고 영향을 미치긴 어렵다.

구글은 알파고가 중국 룰로 훈련했기 때문에 양해를 구했다고 한다. 이세돌이 이 룰에 익숙하지 않기 때문에 이세돌에게 나쁜 영향을 미칠 수도 있다. 하지만 이번 경기는 이세돌이 이길 것이다. 인공지능은 많은 일을 할 수 있지만 한계가 뭔지 아직 분명하지 않다. 알파고가 앞으로 몇 년간 이룰 진보는 족히 50년의 진보에 해당하는 것이 될 가능성이 있다. 이제 필자 예측을 깨끗이 접으려고 한다. 인공지능이 이번엔 지더라도 머지않아 세계 최고의 프로기사를 이기는 쪽으로 가고 있기 때문이다.

문병로 < 서울대 컴퓨터공학부 교수 >

관련 뉴스

1

합성 다이아몬드 1기압에서 생산하는 길 열렸다

과학기술정보통신부 산하 출연연구기관인 기초과학연구원(IBS)은 다차원 탄소재료 연구단(단장 로드니 루오프)이 1기압에서 다이아몬드를 합성하는 기술을 처음 개발해 세계 3대 학술지 '네이처'에 실었다고 25일 발표했다.합성 다이아몬드는 1300~1600도 가량 고온에서 5만~10만 기압(5~10기가파스칼) 가량의 고압을 특정 상태의 탄소에 가해야 만들 수 있다. 이 때 합성 가능한 다이아몬드 부피는 1㎤ 정도로 제한된다.연구팀은 온도, 압력 등 다이아몬드 성장 조건을 최적화하는 장비를 자체 개발했다. 그리고 갈륨 77.75%, 니켈 11%, 철 11%, 실리콘 0.25%로 구성된 액체 금속 합금을 만들었다. 이 합금을 1025도 온도와 1기압 조건에서 메탄과 수소에 노출시키면 액체 금속 내부에서 핵이 생성되면서 다이아몬드 결정이 아래로부터 성장하는 것을 발견했다. 원자힘현미경과 주사전자현미경 등으로 이를 증명했다.연구팀은 아울러 이 다이아몬드 안에 '실리콘 공극 컬러 센터' 구조를 새로 발견했다고 덧붙였다. 양자컴퓨터 큐비트 개발에 이용할 수 있는 구조다.연구팀 관계자는 "보다 쉽고 크게 다이아몬드를 만들 수 있는 기술"이라며 "다이아몬드를 성장시키는 액체 금속 성분을 다양화하는 후속 연구를 할 것"이라고 말했다.이해성 기자 ihs@hankyung.com
2

"유튜브 광고 봐야하나"…이통3사 OTT 요금제 '줄인상' 이유

"유튜브를 즐겨봐서 월 만원 수준 요금제를 내고 SK텔레콤 '우주패스' 요금제를 이용했는데 4000원이나 오른다고 하네요. 인상 전까지만 사용하고 통신사를 갈아타려고요."SK텔레콤 가입자인 직장인 배유정(26)씨는 "(요금을 안 내도록) 다시 광고를 보면서 유튜브를 보든지, 아니면 다른 나라로 우회에서 보는 방법을 찾아봐야겠다"며 이 같이 말했다.배 씨의 사례와 같이 국내 통신 3사가 유튜브 프리미엄 구독료를 결합한 ‘온라인동영상서비스(OTT) 결합 요금제’ 가격을 줄줄이 올리고 있다. 소비자들은 월 1만원 이하로 유튜브 프리미엄을 구독할 수 있는 OTT 결합 요금제를 SK텔레콤, KT, LG유플러스에서 찾아보기 힘들게 됐다. 플랫폼 구독료가 지난해 말께부터 줄줄이 인상되면서 '구독플레이션'(구독+인플레이션)이 현실화 수순을 밟는 모습이다.24일 통신업계에 따르면 KT와 SK텔레콤은 각각 유튜브 프리미엄이 포함된 '초이스' 요금제와 '우주패스' 서비스 가격을 인상했다. LG유플러스는 가격 인상 대신 고가 요금제 대상 유튜브 프리미엄 무료 이용 혜택을 제공하는 '유튜브 프리미엄팩' 서비스의 신규 가입을 중단하고 새 서비스를 출시해 사실상 인상에 나섰다.KT의 다음달 1일부터 '초이스(초이스 프리미엄·초이스 스페셜·초이스 베이직)' 요금제 가입자에게 4450원을 추가로 과금하기로 했다. 해당 요금제는 월 9만~13만원 구간에 해당하는 고가요금제다. 다만 오는 30일까지 가입한 후 요금제를 유지할 경우엔 추가 요금 없이 유튜브 프리미엄 서비스를 이용할 수 있어 해당 요금제의 '절판 마케팅'에 나섰다.앞서 KT는 지난 2월 홈페이
3

'韓 로켓 추진 선구자' 윤영빈 교수, 한국판 NASA 이끈다

우주항공청 초대 청장과 우주항공임무본부장에 윤영빈 서울대 항공우주공학과 교수(사진)와 존 리 전 미국 항공우주국(NASA) 고더드우주비행센터 시니어 자문위원이 각각 내정됐다.▶본지 4월 24일자 A2면 참조대통령실은 24일 우주항공청장(차관급), 임무본부장(1급), 차장 인선을 발표했다. 청장으로 발탁된 윤 교수는 서울대 항공우주공학과를 졸업하고 동 대학원에서 석사 학위를 딴 뒤 미국 미시간대에서 항공우주공학 박사 학위를 받았다.그는 액체로켓 분사 시스템, 로켓엔진 연소기 등을 연구한 로켓 분야 권위자다. 우주항공청이 재사용 발사체 개발에 나선 만큼 윤 교수의 로켓 추진 연구 경력이 인선에 결정적인 역할을 했다는 분석이다.임무본부장에 내정된 존 리 전 위원은 2021년까지 NASA 고더드우주비행센터 수석어드바이저로 근무하며 미국 우주 프로젝트 운영을 이끌었다. 고더드우주비행센터는 허블 망원경 등 국제 협력을 주도하는 NASA의 주요 연구센터다. ‘연구개발(R&D) 국제 협력’을 강조해 온 정부가 이곳에서 프로젝트를 이끈 존 리 전 위원의 경험을 높이 평가한 것으로 보인다.임무본부장은 우주항공청의 R&D 기획을 총괄한다. 우주항공청 ‘넘버 2’에 해당하는 보직으로, 청장과 함께 우주항공청의 방향성을 제시하는 역할을 맡는다. 조직 구성안에 따르면 임무본부장 아래 우주수송, 인공위성, 우주과학탐사, 항공혁신 등 4개 부문이 포진한다.임무본부장 연봉은 2억5000만원이다. 대통령을 제외하면 공무원 중 가장 높다. 우주항공청장(약 1억4000만원)보다 많다. 한국 국적만 임용 가능한 청장과 달리 임무본부장은 외국인도 임용할 수 있다. 존 리 전 위원은 한국계