[기고] 지금은 데이터로 소통해야할 '포아송 시대'
통계를 공부하다 보면 포아송 분포라는 어려운 용어가 나온다. 잘 발생하지 않는 사건들이 실제로 일어날 확률을 계산하는 방식이다. 불량률이 미미한 제품의 품질검사에 주로 쓰이는 통계적 기법이다. 그러나 말의 뒷발에 차여 사망할 확률이나 빗맞은 당구공에 머리를 맞을 확률 같은 비상식적인 사건을 다룰 때도 포아송 분포가 이용된다. 요즘은 역사적으로 잘 발생할 것 같지 않은 뉴스가 기록을 경신하듯이 경쟁적으로 발생하고 있다. 영국의 브렉시트(Brexit) 선언, 미국 대선에서 극우성향 인사인 정치 이단아 트럼프의 당선, 한국의 최순실 사건 등은 공통점이 있다. 좀처럼 발생하지 않을 것이라고 예측됐지만, 국민의 마음속에는 어느 정도 예측됐고, 소셜네트워크서비스(SNS) 등의 빅데이터(big data) 분석을 통해 사건의 앞뒤가 상당한 정확도를 가지고 예측되고 있다는 것이다.

설마하는 소문이 사실로 드러나고, 희박한 확률의 사건이 실제로 일어나고, 믿고 싶지 않은 일들을 믿어야 하는 세상을 ‘포아송 시대’라 불러도 과언이 아닐 것이다. 이런 역사적인 사건들은 양날의 칼이어서 상당한 힘을 발휘해 세상을 바꾸지만, 다른 한편으로는 기존 질서 속에서 바둥거리고 살아가는 선량한 약자들의 희생을 제물로 삼는다. 우리나라에선 브렉시트가 일어났을 때 주식시장이 요동쳤으며, 발이 느린 개미들이 최대 피해자였다. 트럼프의 대통령 당선이 그의 공약대로 한·미 자유무역협정(FTA) 무효나 미군주둔 비용 증가로 이어진다면 국민이 부담해야 할 비용은 계산하기도 어렵다. 최순실 사태로 인한 국력의 낭비는 한국 정치 현실을 과거로 돌려 놓은 듯하다.

포아송 사건들이 넘쳐나므로 미디어나 포털에서는 뉴스 이외에 실시간으로 SNS 이슈와 관련된 빅데이터 분석을 제공해야 할 것이다. 통계학에서는 이론적으로 포아송 사건이 자주 일어나면 정상적인 분포가 된다고 증명하고 있다. 최근의 사태들은 과거 시각으로는 여간해서는 일어날 것 같지 않은 사건의 연속이므로 이제는 당연히 일어날 수 있는 정상적인 사건 중 몇몇이 됐다고 봐도 무리가 아니라고 본다.

사람들은 이제 스마트폰이나 컴퓨터가 제일 가까운 형제이자 친구이다. 누구에게도 알리지 않는 귀중한 정보를 정보기술(IT)의 바다에 흘려놓는다. 정보의 관음화를 부추기는 부분도 있기는 하지만 쓰레기 더미에 진주가 널려 있는 것과 다를 바가 없다. 미국의 대통령도 맞히고, 바둑의 최고수도 이겼으니, 익명성이 보장된 정보의 쓰레기가 월드컵 우승을 알아맞히는 문어보다 더 소중한 것임은 이제 딱히 증명할 필요가 없어 보인다. 지금은 그런 데이터의 쓰레기를 돈 주고 거래하는 광산이라고 봐야 한다. 거기에 생각보다 훌륭한 정보나 지혜가 있을 수 있기 때문이다.

현재를 포아송 시대라고 부른다면, 새 시대에 맞게 기업이든 정부든 혁신적인 변화를 선도적으로 하려고 할 것이다. 시차가 없는 정보의 세상에서 결국 대중과 기업, 국가는 상호 소통하고 동시에 변화할 것이다. 그리고 소통의 매개체는 데이터이고, 그들을 분석하는 것은 빅데이터이며, 이것의 미래는 인공지능으로 이어지고 있다. 긍정적이든 부정적이든 일련의 사태들은 세상을 변화시키고 있으며, 결과를 모를지라도 대부분의 사람이 마음속으로 원하던 것일 것이다.

김동철 < 데이타 솔루션 전무·공학박사 >