[전문가 포럼] 인공지능, 기존 데이터 없이 개발할 수 있다
인공지능(AI), 빅데이터 시스템을 개발하려면 데이터가 있어야 한다고 한다. 데이터가 제일 중요하다고 한다. 심지어 데이터는 ‘제2의 석유’라고도 한다. 그러나 그렇지 않다. 기존 데이터는 필요 없다.

새해를 맞아 자신의 방을 깨끗이 정리하고 새롭게 방을 꾸미겠다는 사람이 있을 것이다. 이 사람에게 과거에 방을 어떻게 사용했고 방의 어떤 위치에 어떤 물건들이 놓였는지 분석하는 것은 그리 중요하지 않다. 이제부터가 중요할 뿐이다. 새로운 방의 구조와 새로 배치된 가구가 방을 사용하는 방법을 바꾸게 되고, 그 결과 새로운 방을 사용하는 데 따른 새로운 데이터가 생긴다. 이렇게 새롭게 생성되는 데이터가 중요하다. 빅데이터, 인공지능 시스템은 사실 기존의 데이터로 만드는 것이 아니라 새롭게 데이터를 만들어 구현하는 것이다.

2016년의 ‘알파고’도 처음에는 인간들의 바둑 기보 데이터를 활용했지만 2017년 발표된 ‘알파고 제로’와 ‘알파 제로’는 기존의 데이터를 사용하지 않았다. 이 제로 시리즈의 인공지능 시스템은 기존 인간 사회의 데이터를 사용하는 것이 아니라 새로운 인공지능 시스템 설계의 결과로 새롭게 생성되는 데이터를 가지고 학습한다.

이렇듯 기존 데이터는 중요하지 않다. 새롭게 생성되는 데이터가 중요하다. 따라서 데이터가 있으면 뭐든지 할 수 있다고 주장하는 사람이나 데이터가 없어서 일을 못한다고 주장하는 사람이 있다면 그 사람은 반쪽 전문가다. 데이터와 정보, 지식의 관계에서 한쪽 면만을 보기 때문에 그런 주장을 하게 된다. 전통적으로 데이터를 분석하면 정보가 나오고 정보를 더 정리하면 지식이 나온다고 가르쳤고 배워왔다. 그런데 핀란드 과학자 일카 투오미는 1999년 하와이 국제시스템과학학회(HICSS)에서 이 전통을 비판하고 2000년 경영정보시스템저널(JMIS)에 논문을 게재했다. 지식을 정리하면 정보가 나오고 이 정보를 더 구조화·객관화해 해석의 여지 없이 고정시킨 것이 데이터라는 새로운 설명을 한다.

어떤 기업이 지난 10년간 콜센터에 걸려온 고객 전화 기록을 모두 확보해 이 자료를 기반으로 인공지능 시스템을 만들 수 있을 것이라고 했는데, 그 데이터에는 고객과 통화한 음성 파일은 있지만 그 고객의 문의에 대해 상담원이 어떤 행동을 했는지, 어떤 키보드를 눌러서 어떤 시스템을 작동시켰는지 등에 대한 기록은 없었다고 한다. 이렇듯 과거의 자료는 소용이 없다. 과거 콜센터 통화 데이터를 인공지능 시스템 활용 용도로 만들지 않았기 때문이다. 미래에 학습될 데이터로 생각하고 데이터를 축적한 것이 아니라 단지 법적인 문제에 대처하기 위해 단순 녹음한 결과다. 인공지능 기술이 이렇게 빨리 발전할 것이라고 예상하지 못했기에 어쩔 수 없다.

많은 기업과 기관은 아직 인공지능과 기계학습 시대에 대비한 데이터를 많이 축적하지 못했을 것이다. 이제라도 그 부분부터 시작하면 된다. 인공지능, 빅데이터를 활용한 경영 혁신과 새로운 경영 시스템, 새로운 비즈니스 모델의 개발은 기존 데이터 없이 시작할 수 있다. 새로운 시스템을 설계하고 그 시스템으로 하여금 데이터를 생성하게 하라. 그 데이터를 인공지능, 빅데이터, 기계학습 등 이름이 무엇이든 시스템과 사람이 분석해 다시 피드백할 수 있도록 설계하라.

새해를 맞아 가정과 기업, 정부기관들도 새 출발이 필요할 것이다. 인공지능, 빅데이터 시스템을 개발하고 싶은데 데이터가 없다고 걱정할 필요도, 핑계를 댈 이유도 없다. 새로운 가정경영체제, 기업경영체제, 정부경영체제를 설계하라. 새롭게 설계된 시스템에서 어떻게 새로운 시각의 새로운 데이터가 생성될지 조망하라. 그 새롭게 생성된 데이터가 어떻게 인공지능, 기계학습 시스템에 들어가서 새로운 제품, 서비스, 의사결정으로 나올 수 있을지 설계하라. 이렇게 생성되는 데이터로 인공지능, 빅데이터 시스템을 학습시켜라. 그리고 그 학습된 시스템을 가지고 새로운 제품, 서비스, 의사결정을 만드는 데 활용하라. 인공지능, 기존 데이터 없이도 개발할 수 있다.

이경전 < 경희대 교수·경영학, 벤플 대표 >