미국 뉴욕경찰은 데이터 분석을 통해 범죄를 예측하고 대비한 결과 강도 범죄는 3%, 살인은 4% 줄일 수 있었다. 사진은 버락 오바마 미국 대통령(가운데)이 뉴욕경찰을 방문한 모습이다.
미국 뉴욕경찰은 데이터 분석을 통해 범죄를 예측하고 대비한 결과 강도 범죄는 3%, 살인은 4% 줄일 수 있었다. 사진은 버락 오바마 미국 대통령(가운데)이 뉴욕경찰을 방문한 모습이다.
이번 월드컵에서 우승국 독일 못지않게 스포트라이트를 받은 것은 구글이었다. 조별 예선이 끝나자마자 데이터 분석을 통해 16강 여덟 경기의 결과를 예측했는데 모두 적중했다. 각 팀은 물론 개별 선수들에 대한 각종 데이터를 축적하고, 이를 기반으로 매 경기에 대해 각각 1만번의 컴퓨터 시뮬레이션을 실시해 16강 결과를 맞힐 수 있었다. 결승전에 대한 예측도 내놓았다. 브라질과 아르헨티나가 결승에 오를 것이고, 여기서 브라질이 승리할 확률이 55%라고 발표했다. 물론 이 예측은 틀렸고 구글에 대한 찬사도 거기서 끝났다. 하지만 브라질의 스트라이커 네이마르가 불의의 사고로 경기에 뛰지 못하는 일만 없었다면 구글의 예측이 결승전까지 적중했을 수도 있었다.

빅데이터의 등장은 정보기술의 활용 수준을 한 단계 높였다. 지금까지 정보기술은 어떤 일이든 빨리 처리하도록 하는 데 주로 활용했다. 온라인 뱅킹이나 전자상거래처럼 빛의 속도로 일을 볼 수 있게 하는 것이 최대 장점이었다. 2000년대 초 ‘빠른 것이 큰 것을 이긴다’는 논리가 유행했던 것도 이런 속도 경쟁을 반영한 것이었다. 이에 비해 빅데이터는 ‘빠른 것’을 넘어 ‘정확한 것’을 추구하는 수준까지 올라섰다. 방향과 속도 중 더 중요한 것은 당연히 방향이다. 방향만 옳다면 아무리 더디게 가도 목적지에 도착할 수 있다. 빅데이터는 지금까지 정보기술이 하지 못했던 올바른 의사결정을 가능케 함으로써 인간에게 더욱 유용한 기술로 다가오고 있다.



# 빠른 처리에서 의사결정 도구로 발전

빅데이터의 새로운 가치는 이미 산업현장에서 빛을 발하고 있다. 한 조사 결과에 의하면 빅데이터를 활용한 기업들은 성과와 수익이 각각 26%와 21% 증가했다고 한다. 무엇보다 미래의 경영환경을 정확히 예측할 수 있었기 때문이다. 한 예로 세계 최대 전자상거래 기업 중 하나인 독일의 오토그룹은 37%에 머물던 품목별 수요예측 정확도를 빅데이터 기법을 활용해 89%까지 올렸다고 한다. 그만큼 재고 부담은 줄이면서 수익을 늘릴 수 있었을 것이다. 공공부문도 예외는 아니다. 이미 잘 알려져 있다시피, 미국 뉴욕경찰은 데이터 분석을 통해 범죄를 사전에 예측하고 대비한 결과 강도 범죄는 3%, 살인은 4% 줄일 수 있었다.

빅데이터에 대한 회의론도 적지 않다. 무엇보다 빅데이터의 예측 결과가 기대했던 만큼 정확하지 않다는 것이다. 하지만 여기에는 한 가지 큰 오해가 있다. 데이터 분석이 한 번 실시해 결과를 얻는 일회성 작업일 것이라는 가정이다. 실제로는 그렇지 않다. 빅데이터 분석은 끊임없는 시행착오 속에서 조금씩 예측의 정확도를 높이는 끝이 보이지 않는 반복 작업이다. 일기예보가 이를 잘 보여준다. 한국의 경우 단기예보의 정확도는 2002년 81% 수준에서 조금씩 높아지기 시작해 2009년 90%, 2012년 92%에 이르는 등 아주 더디게 개선되고 있다. 100%의 정확도는 달성할 수 없겠지만 정부가 노력을 멈추지 않는다면 언젠가는 날씨를 의미있는 수준까지 정확히 예측, 엄청난 규모의 사회·경제적 가치를 창출하는 날이 올 것이다.

빅데이터와 관련해 현장에서 제기되는 가장 큰 문제는 도대체 이것을 어떻게 시작해야 하는가 하는 실천적 문제다. 이미 대기업들은 이런저런 형태로 빅데이터를 경영에 접목시키고 있다. 하지만 중소기업들은 빅데이터의 가치를 깨닫더라도 실제 이를 활용하기가 쉽지 않다. 어디서 어떻게 시작해야 하는지 경험지식도 없고, 비용과 시간 등 많은 자원이 소요될까 걱정도 앞선다. 보다 깊이 들여다보면, 빅데이터가 구체적으로 어떤 가치를 가져다 줄지 확신이 안 서는 것도 문제일 것이다.



# 정확할 수록 사회·경제적 가치 급증

빅데이터에 관심이 있는 조직들이 우선적으로 취할 수 있는 첫 번째 조치는 자기와 관련 있는 사례들을 열심히 찾아보고 주의 깊게 연구하는 것이다. 빅데이터를 적용한 사례는 우리 주위에 생각보다 많이 있다. 빅데이터라는 이름이 유행처럼 사용되기 시작한 것이 2010년 이후지만, 그 이전에도 데이터 분석을 통해 올바른 의사결정을 내리려는 프로젝트가 적지 않게 추진됐다. 관심을 가지고 주위를 둘러보면 해외는 물론이고 국내에서도 많은 사례를 발견할 수 있다. 전문가를 불러 의견을 들어보는 것도 좋은 방법일 것이다.

두 번째, 자기가 보유한 데이터를 되돌아보고 이를 전략자원으로 발전시키려는 노력을 시작해야 한다. 지금 당장 빅데이터 분석을 하지 않더라도 데이터를 축적하는 일은 하루라도 빨리 시작해야 한다. 빅데이터 분석은 자신의 데이터와 외부의 데이터를 결합해 의사결정에 필요한 정보를 얻는 일이다. 여기서 자신의 데이터는 자신이 준비할 수밖에 없다. 조직 전체를 포괄하는 데이터 관리전략을 수립해 자신의 의사결정에 필요한 데이터가 어떤 것이 있는지 확인하고, 이런 데이터를 어떻게 확보할 것인지 계획하는 일이 중요하다.

마지막으로 작은 규모라도 데이터 분석을 시도하되 내부 인력이 주도적으로 참여해야 한다. 데이터 분석은 산수문제를 푸는 것과 같은 기계적 작업이 아니다. 데이터 분석이 제대로 이뤄지려면 업의 본질과 풀고자 하는 문제의 특성이 정확하게 반영돼야 한다. 이것은 외부의 데이터 분석가들이 할 수 없는 일이다. 업의 본질과 비즈니스의 특성을 가장 잘 아는 것은 내부 인력일 수밖에 없다. 외부에만 맡긴다면 빅데이터가 알려주는 결과는 아무 쓸모없는 숫자의 나열일 것이다.

분명 빅데이터는 정확한 의사결정을 가능케 하는 미래의 유망한 경영기법이지만 꾸준한 노력 없이는 활용할 수 없는 어려운 기법이기도 하다. 빅데이터에는 왕도가 없다는 사실을 받아들이는 것이 빅데이터를 시작하는 진정한 출발점일 것이다.

황종성 < 한국정보화진흥원 빅데이터센터장 >