[기고] 마이 빅데이터
빅데이터의 화두가 세상에 던져진 것도 이제 10년이 넘는다. 비로소 국가적으로 데이터를 모으는 작업들이 시도되고 있다. 데이터 레이크라는 개념이 국가 발전 계획에서 나올 만한 주제로 자리매김하였다. 무엇을 하기위해 빅데이터를 만드는가 하는 질문은 4차산업 시대에는 적절하지 않을 수 있다. 만들어진 빅데이터로 무엇을 할 수 있을지를 생각해 보는 것이 미래를 바라보는 적절한 시각이라고 생각한다.

빅데이터의 초미의 관심은 개인들이 만들어내는 정보의 활용에 있다. 불과 몇 년 전까지만 해도 국민들은 각자가 무슨 데이터를 제공하는지 어떻게 쓰이는지 크게 관심을 갖지않았고, 당연히 본인에 관련된 데이터의 소유권이라는 말도 생소해 보였다. 하지만 여기저기 산재해 있던 개인 데이터들이 이런저런 보안사고를 당하면서 데이터에 대한 중요성이 사회문제로 대두되었다. 2020년 9월에 개인데이터를 익명으로 처리하면서, 국가 기관들 간에 중복적인 개인정보의 규제를 제거하고 정보의 합법적인 활용을 가능하게 하는 소위 데이터3법이라고 하는 개인정보 보호법, 정보통신망법, 신용정보법의 개정안이 의결되었다.

이러한 추세가 만들어낸 용어가 ‘마이 데이터’이다. 데이터를 보관하고 있던 기관들이 데이터의 소유권을 가지는 것이 아니라는 것이다. 데이터의 소유권은 정보를 제공한 개인들이 가지는 것이므로 개인들은 흩어져 있는 본인의 데이터를 쉽게 받아서 활용할 수 있어야 한다. 금융기관들이 이 분야에서 앞서가고 있긴 하지만 아직은 개인들이 본인의 데이터를 가지고 무엇을 현명하게 할 수 있는지 알기까지는 시간이 좀 더 필요할 듯하다.

옛 선조들은 사람은 죽어서 이름을 남긴다 했지만, 현대인들은 태어나면서 한평생 동안 데이터를 남긴다. 종류도 다양하다. 행정기관에 분산되어 있는 데이터, 교육을 받으면서 교육기관에 보관되어 있는 데이터, 병원에 있는 건강에 관련된 헬스케어 데이터, 신용정보와 관련된 금융기관의 데이터, 사회생활을 하면서 만들어 놓은 데이터, SNS에 남겨놓은 정보의 부스러기, 스마트폰에 남겨진 기가바이트급의 자료들. 대충만 봐도 현기증 나게 많은 데이터들이 나를 가리키고 있는 것이다. 갑자기 이러한 데이터의 소유권이 나에게 있으니 요긴하게 사용하라고 한다. 소유하고 있으면 관리도 해야 하는데 가능할까?

과학의 발달은 차원이 다른 데이터의 폭발적 증가를 가져왔다. 미래의료학자 최윤섭 박사의 저서 디지털 헬스케어(2020)에 따르면 개인유전정보의 활용이 이미 시작되고 있다고 한다. 270억달러의 거금이 들어간 13년 동안의 게놈 프로젝트는 30억쌍의 인간 유전자 조합을 읽어내는 것이었다. 이러한 과학의 진보는 개인유전자 정보 분석의 시대를 열었으며, 미국에서는 이미 서비스가 상용화 되었다. 게놈 프로젝트가 완성된 시기가 2003년이니 지금의 기술로는 수시간이면 한사람의 유전자 분석이 가능할 것이며 비용도 백만원 이내가 될 것이다. 개인이 소유하고 있는 유전자의 정보를 마이 데이터로 부르기엔 커도 너무 크다. 마이 빅데이터라고 해야 될 것이다.

유전자를 분석하는 것은 어떠한 인자들이 어떠한 영향을 주고 받을지 알 수 없는 것이어서 인공지능을 이용하여 분석해야 한다. 유전병 등 각종 질병을 사전에 예방 할 수 있는 방법이 여기에 있다. 각종 질병에 대한 위험도가 얼마나 높은지를 알 수 있고, 약물에 대한 민감도 정보를 알아 낼 수 있다. 또한 유전병의 인자를 보유하고 있는지 여부도 알 수 있다. 2013년 안젤리나 졸리는 유전자검사를 통해 높은 유방암 확률을 확인하고 유방절제술을 받았는데, 이 사건으로 유전자검사에 대한 대중의 관심이 커졌다. 미국 FDA는 개인들이 병원을 거치지 않고 직접 유방암 유전자 검사를 할 수 있도록 허가하였다. 세계적으로 유전자검사를 하려는 사람의 수가 폭증하고 있지만, 우리나라에서는 아쉽게도 이러한 서비스 비즈니스가 불법으로 되어 있다. 법이 과학의 발전을 따라가지 못하고 있는 동안 한국사람들의 유전자 데이터는 해외의 기관에 쌓이고 있다.

마이 데이터가 성숙단계에 이르면 세상은 어떻게 변할까? 우리는 엘빈 토플러가 예상했던 미래에 살고 있으며, 또 다른 미래학자인 유발 하라리는 인공지능이 보편화된 미래를 예견하고 있다. 이제부터는 다소 과격한 변화를 그려봐도 되겠다. 교육부 포털에 나의 모든 졸업 증명서를 달라고 말로 요청하면 즉시 등록된 메일로 받아 볼 수 있어야 한다. 말 한마디로 나의 모든 금융자산 내역을 볼 수 있게 된다. 은행, 증권, 보험 등에 관련된 자산과 그 외의 게임에 예치된 돈과 스타벅스에 맡겨 놓은 돈까지 모두 한눈에 볼 수 있게 될 것이다. 내가 사망한 뒤에 유족들은 내가 숨겨 놓은 돈을 쉽게 찾을 수 있을 것이다. 결혼 상대자를 고를 때 유전자 정보를 교환하여 2세에서 발생할 수 있는 안타까운 유전병 가능성을 줄일 수도 있을 것이다.

개인이 허락한다면 개인의 모든 정보는 이용이 가능하다. 이제부터는 회사나 공공기관에 내는 서류는 새로운 데이터만 내면 될 것이다. 입사 서류에 첨부되는 각종 졸업과 성적 증명서는 회사가 직접 학교에 확인하면 된다. 자기 소개서는 새로 만들어진 데이터이므로 작성해서 제출하면 된다. 국세청의 연말정산 프로세스는 이의 신청만 받는 정도로 간소화될 것이다. 바야흐로 데이터의 주권이 생긴 것이다. 데이터를 모으면 힘도 되고 돈도 된다. 인간의 시간은 유한하지만 데이터의 시간은 다르다. 마이 데이터를 위한 기본적인 법들이 이제 태어나기 시작했다. 인간 사후의 마이 데이터는 법적으로 어찌 될지 궁금하다. 이런 것도 이슈를 제기하는 사람이 있을지 모르겠다.

<김동철 유비케어 사외이사>