[Smart & Mobile] 바둑 다음은 스타크래프트?…게임 활용해 계속 진화하는 인공지능
이세돌 9단과 구글 딥마인드의 인공지능(AI) 프로그램 알파고의 대국이 끝난 뒤 데미스 허사비스 딥마인드 대표는 다음 도전 목표로 온라인 전략시뮬레이션 게임인 스타크래프트를 지목했다. 인공지능 연구자들은 일찍부터 게임을 인공지능 연구에 적극 활용해 왔다.

허사비스 대표는 이 9단과의 대국 직후 “게임이야말로 인공지능 알고리즘을 개발하고 시험하는 데 가장 최적화된 플랫폼”이라고 말했다.

연구자들은 일찍부터 체스나 장기, 바둑을 인공지능의 실력을 가늠하는 데 활용해 왔다. 초기 게임을 활용한 인공지능 연구는 다음 수를 예측하기 쉬운 체스나 장기에 집중됐다. 다음 수를 가늠하는 경우의 수가 제한된 체스는 1997년 IBM의 딥블루가 인간 챔피언인 게리 카스파로프를 이기면서 인공지능에 승리가 돌아갔다. 361개 점을 채우는 경우의 수가 10의 170제곱에 이르는 바둑 역시 지난해 유럽 챔피언인 판후이 2단에 이어 이번에 바둑 최고수 이 9단을 누르며 인공지능이 우세함을 보였다.

최근 들어 연구자들은 슈퍼마리오와 스타크래프트, 언리얼 토너먼트, 팩 맨, 앵그리버드 같은 비디오 게임을 적극적으로 활용하고 있다. 전문가들은 스타크래프트 같은 실시간 전략시뮬레이션(RTS) 게임과 1인칭 슈팅게임(FPS)은 체스나 장기, 바둑 같은 게임과는 차원이 다른 기술이 필요하다고 보고 있다.

마이크로소프트(MS)는 게임을 활용해 인공지능 연구를 가장 활발하게 하는 회사로 손꼽힌다. MS는 1996년부터 일찌감치 인공지능 연구를 수행하고 있다. 레이싱 게임인 포르자, 게이머가 마치 전지전능한 신이 되는 ‘갓게임’의 일종인 ‘블랙앤화이트’, 슈팅게임인 ‘할로’ 등이 연구에 가장 활발하게 활용되고 있다. 최근에는 인기 게임인 마인크래프트를 인공지능 개발에 활용하는 안을 내놨다.

인공지능은 ‘지도학습’이라는 일종의 기계학습을 통해 인간 플레이어가 한 게임을 바탕으로 상대를 평가하고 행동을 모방하는 능력을 갖춘다. 인공지능은 포상을 최대화하는 결정을 내리도록 학습하는 강화학습을 통해 레이싱 게임 속 운전기술이나 1인칭 전투게임에서 격투술을 배운다.

MS 연구진은 실제로 X박스 게임에 미리 입력된 프로그램과 학습기능이 있는 인공지능이 격투를 벌인 결과 인공지능의 전투력이 월등히 향상된다는 결과를 얻기도 했다.

블리자드가 만든 스타크래프트 역시 적극적으로 활용되고 있다. 미국 스탠퍼드대를 비롯해 인공지능을 공부하는 각국 학생과 과학자들은 사람에 가까운 인공지능 플레이어를 개발하고 있다. 알파고는 다음 수를 두기 위해 한 번에 10만가지 경우의 수를 계산한다. 하지만 상대가 수를 두고 나서도 다음 착점 계산까지 충분한 시간을 가진다. 스타크래프트 같은 게임은 한 번에 수십에서 수백개 캐릭터와 유닛을 활용해 목표를 차지하는 방식이다. 실시간으로 즉각적인 결정을 내려야 하고 동시다발적으로 최단 경로로 안전하게 적 진영에 침투하려면 막대한 경우의 수를 계산해야 한다. 한 번에 한 수씩 두는 바둑과는 전혀 다른 방식이다. 딥마인드가 스타크래프트를 다음 목표로 지목한 이유다.

서로 다른 특성과 전략을 가진 테란과 저그, 프로토스 등 세 종족을 활용해 서로를 공략하는 이 게임은 아직 인간 최고수가 인공지능을 능가한다는 평가를 받고 있다.

지난해 캐나다 앨버타에서 22개 인공지능 소프트웨어 연구팀이 참여한 가운데 세계 최고 게이머와 겨룬 승부에서는 인간이 인공지능을 눌렀다. 하지만 머지않아 바둑처럼 인공지능이 인간을 누를 것이란 전망이 나온다.

박근태 기자 kunta@hankyung.com