[책마을] 데이터는 알고있다…세상의 이치를
2009년 ‘신종플루’가 급속도로 확산됐을 때 전 세계 공중보건 당국은 공황상태에 빠졌다. 신종플루 신고접수와 실제 상황 사이에는 1~2주의 시차가 발생했고, 전염병이 빠르게 확산되는 상황에서 이 시간차는 ‘영원과도 맞먹을 만큼’ 길었다.

신종플루 발생 몇 주 전, 구글 엔지니어들은 ‘겨울철 미국에서 독감의 확산을 예측할 수 있다’는 내용의 논문을 ‘네이처’에 게재했다. 이들은 전 세계 30억개 이상 검색어 중 독감과 관련 있는 특정 단어의 검색 빈도수와 여러 지역에서의 독감 확산 사이의 상관관계를 찾았다. 그리고 어떤 지역에서 이 단어들을 검색하는지 분석해 독감의 진행 방향을 거의 실시간으로 알아냈다.

[책마을] 데이터는 알고있다…세상의 이치를
이 사례는 ‘스몰 데이터’와 ‘빅 데이터’ 시대의 차이점을 잘 보여준다. 데이터가 광고 등 특정 분야에서 경제적 효율만 높이는 것이 아니라 사회로 스며들어 전체에 영향을 준 것이다. 빅토르 마이어 쇤버거 옥스퍼드대 교수와 케네스 쿠키어 이코노미스트 편집자가 함께 쓴 《빅 데이터가 만드는 세상》은 이런 사례를 들려주며 빅 데이터 시대의 도래를 알린다.

빅 데이터가 인간의 오랜 사고방식도 바꾸리라는 게 이들의 예상이다. 가장 큰 변화는 두 가지다. 첫 번째는 정확성과 세밀함 대신 꼭 들어맞지는 않더라도 ‘일반적 방향성’이 중요해진다는 것. 근대 이후 인간은 대상을 제대로 측정하기만 하면 그것을 이해할 수 있다는 믿음을 가져왔다. 하지만 빅 데이터 시대에는 이 같은 합리적 과학이 아니라 ‘부정밀성에 대한 용인’이 필요해진다고 저자는 말한다. 허용 가능한 오류 안에 있는 데이터를 그만큼 더 손에 쥘 수 있기 때문이다.

두 번째는 인과성 대신 상관성이 주된 인간의 사고 방식이 될 거라는 주장이다. 저자들은 ‘이유’를 찾으려는 인간의 노력에는 ‘상상’이 개입하고, 어떤 결과를 특정 원인 탓으로 돌리기에는 지나치게 많은 요소가 들어 있다고 설명한다. 빅 데이터 시대에는 ‘왜’라는 질문이 중요치 않다. 데이터는 결과만 말한다. 중요한 건 ‘결과’이지 ‘원인’이 아니다.

저자들은 “우리는 빅 데이터의 전령일 뿐 전도사는 아니다”며 “이미 도래한 빅 데이터 시대의 예상 궤적이 어떠할지 살펴볼 뿐”이라고 말한다. 이들은 빅 데이터의 유용성을 소개하는 데 그치지 않고 미래의 ‘빅 브러더’가 될 위험성과 이를 방지할 해결책도 제시한다. 권력에 의한 사생활 침해뿐 아니라 데이터에 의존해 ‘가능성’만으로 감시와 처벌이 이뤄지는 사회가 올 수도 있다. 이 위험을 관리하기 위해 데이터 이용자의 윤리와 함께 ‘사회의 충분한 겸손과 인간성’이 필요하다.

‘왜’라는 질문보다 ‘결과’만 중요한 세상, 미시적 정확성보다 거시적 방향만 바라보는 세상을 상상하면 기술지배사회의 혼돈이 떠오른다. 그러나 밀려오는 기술과 그것이 가져올 변화를 무턱대고 막을 수 없다면 ‘제대로 된 관리’가 필요하다는 게 이 책의 요지 중 하나다. 빅 데이터 시대의 효용뿐 아니라 ‘디스토피아’ 또한 그렸다는 점에서 이 책의 의미를 찾는 것도 좋겠다.

박한신 기자 hanshin@hankyung.com