Getty Images Bank
Getty Images Bank
이솝우화 ‘토끼와 거북이’ 속 토끼는 거북이와 달리기 경주를 한다. 느릿느릿 뒤처진 거북이를 본 토끼는 안심하고 나무 그늘 아래에서 한숨 잔다. 그 사이 쉬지 않고 기어간 거북이가 결국 이긴다. 하지만 시점을 오늘로, 토끼를 기계로 바꾸면 이야기는 달라진다. 토끼는 방심하지도, 잠을 자지도 않는다.

저자가 ‘생각하는 기계’의 등장에 따른 지각변동을 다룬 신간의 제목을 《잠들지 않는 토끼》로 정한 이유다. 미국계 컨설팅업체와 제약회사에서 일하다 데이터사이언스연구소를 설립한 저자는 잠들지 않는 토끼를 ‘기계 뇌’라고 부른다. 인간과 기계가 하는 일의 경계선은 꾸준히 변해왔다. 기계 뇌의 시대에는 그 경계가 ‘판단’이라는 행위에까지 도달했다. 저자는 “인류 역사상 처음으로 ‘생각하는 일’을 기계가 대신하는 혁명적 변화를 겪고 있다”고 강조한다. 책은 오늘을 ‘인공지능의 시대’가 아니라 ‘기계 뇌의 시대’라 칭한다. 인공지능은 ‘기계 뇌’가 가진 기술 중 하나다. 저자는 이를 “산업혁명을 역직기 혁명이나 증기기관 혁명이라고 부르지 않는 것과 같은 이치”라고 설명한다.

[책마을] 시나리오만 보고 영화 흥행 예측…생각하는 '기계 뇌'의 시대
기계의 학습은 인간의 영역이었던 통계학과도 구분된다. 더 많은 데이터를 투입할수록 정확도는 비약적으로 높아진다. 복잡하게 얽힌 문제를 풀어가면서 스스로 학습하고 진화한다. 평균을 뽑아내고 추세를 가늠하는 통계학과는 차원이 다르다는 것이다. 저자는 “생각하는 기계는 기업의 전략뿐 아니라 개인의 경력, 능력 개발에도 큰 영향을 미친다”며 “총이 발명되면서 전쟁의 양상이 바뀌었듯 새로운 무기가 등장하면 기존 전략과 전술에도 변화가 필요하다”고 강조한다.

저자는 인식하고 분류하고 예측하는 기계 뇌의 능력을 다양한 기업의 실제 사업을 통해 보여준다. 시나리오만 보고 영화 흥행 성적을 내다보는 영국 회사 에파고긱스는 예측하는 기계 뇌의 사례 중 하나다. 2004년 한 대형 영화사는 미공개 영화 각본 9편을 에파고긱스의 알고리즘을 이용해 분석했다. 이후 실제 흥행 수익과 예측값을 비교했다. 9개 중 6개 예측이 적중했다. 당시 에파고긱스는 창업한 지 1년 된 새내기 회사였다. 인공신경망 기술과 독자적인 각본 분석 알고리즘을 통해 영화 제작에 들어간 투자금의 회수 확률을 계산했다. 각본상의 줄거리와 등장인물에 따라 매 장면을 요소별로 분해해 점수를 매겼다. 경험이 축적되면서부터는 예측값이 실제 흥행 수익과 비슷해질 때까지 각 요인에 대한 가중치를 끊임없이 조정해가면서 인공신경망을 학습시켰다. 제작자는 투자액을 회수해야 하기에 영화 제작은 예술 활동인 동시에 경제 활동이기도 하다. 영화 촬영을 시작하지도 않은 상태에서 ‘기계 뇌’의 예측 결과에 따라 줄거리와 배역을 바꿀 수 있다. 인간에게 감동을 주는 영화의 구성을 알고리즘이 제안하는 셈이다. 저자는 “에파고긱스의 각본 평가 데이터베이스와 과거 10여 년간의 사업을 통해 쌓은 흥행 수익 예측 데이터가 이 분야의 진입 장벽을 이루고 있다”고 평가한다.

분야는 다르지만 같은 접근 방식으로 수많은 알고리즘이 의사가 놓칠 만한 질병의 징후를 발견하고 있다. 비행기 관제 시스템에서 고장의 조짐을 찾아내 사고를 예방하기도 한다. 책은 에파고긱스 외에 페이팔과 아마존 후지필름 히타치제작소 라쿠텐 등 다양한 기업이 데이터 활용 범위를 어떻게 넓혀가고 어디에 투자를 집중하고 있는지 알려준다.

기계 뇌를 설계하는 방법과 그것을 운용할 수 있는 조직을 만드는 방법도 안내한다. 다수의 기업들은 엔지니어링 능력과 통계수학적 지식, 실무 경험까지 갖춘 완벽한 데이터 과학자를 찾길 원한다. 하지만 저자는 “한 명의 천재가 아니라 팀으로 문제를 해결해야 한다”며 “데이터 과학팀을 구성하라”고 제안한다. 팀의 필수 요소는 비즈니스 관련 리더와 데이터 과학자 그리고 데이터 엔지니어다. 비즈니스, 과학, 시스템의 균형을 맞추는 것이 핵심이다. 세 구성원이 활발하게 의논할 수 있는 환경도 갖춰야 한다. 이밖에 데이터를 올바로 다루는 방법과 데이터를 다루는 인재를 키우는 법, 프로젝트를 진행할 때 저지를 수 있는 실수 등도 조언한다.

생각하는 기계는 다가올 미래가 아니라 현재진행형이다. 그럼에도 기계 학습의 본질을 이해하거나 이해하려는 사람이 많지 않다는 것이 저자의 걱정이다. 한국의 상황도 다르지 않다. 데이터 과학이 고도화되면서 기업 경쟁 환경의 지각변동은 갈수록 심해지고 있다. 한번 뒤처져 흐름을 놓치면 따라가기 쉽지 않을 것임을 책을 읽으면 알 수 있다.

윤정현 기자 hit@hankyung.com