출처 istockphoto
출처 istockphoto
인간이 지속 생존과 불편한 문제 해결, 자유와 행복을 위해 끝없이 생각하고 투쟁해온 산물이 문명이다. 인간의 모든 생각과 행동은 '현재 상태'를 알려주고 '다음 행동'도 예측하게 해 준다.

배가 고프면 사냥을 하러 갈 것이고, 토끼를 잡으면 집으로 돌아갈 것이다. 그리고 망가진 연장을 수선하며 좀 더 나은 도구를 생각할 것이다.

4차 산업혁명 시대는 인공지능(AI), 사물인터넷(IoT), 클라우드 컴퓨팅(Cloud computing) 등으로 대변되는 디지털 시대이고 비대면 시대이다. 인간의 생각과 행동은 통신이 연결된 컴퓨터에서 대부분 이루어지고 모든 행위는 데이터로 남는다.

각종 IoT 및 센서 등을 통해 사람과 사물, 사물과 사물이 초연결되는 사회에서 폐쇄형 내부 전산망을 이용하는 은행, 정부 등 오프라인으로 이루어진 모든 행동은 물론이고, 온라인 상의 포털, 플랫폼, SNS에서 사용자가 남긴 데이터는 그들의 현재 상태를 정확하게 알려주고 다음 행동을 예측하게 해 준다. 인간의 다음 행동을 예측하는 일은 이다.
DIKW 계층 구조의 흐름도. /  출처 위키피디아
DIKW 계층 구조의 흐름도. / 출처 위키피디아
단순한 기록, 상태에 대한 데이터(data)를 가공하면 유용한 정보(information)가 되고 이를 분석하여 체계화하면 지식(knowledge 또는 know-how)이 된다. 지식이 쌓이면 남에게 이유를 설명하여 이해시킬 수 있는 (understand and explanation- why) 단계에 이른다.

이 수준을 넘어서면 미래를 예측하고 새로운 가치를 창출하는 창의성 있는 지혜를 (wisdom)를 얻을 수 있다. 훌륭한 지혜는 양질의 데이터에서 시작한다.

▲ 데이터 원유의 종류

출처 dreamtimes
출처 dreamtimes
은행, 의료, 유통, 공공기관 등에서 사용자 1명의 데이터를 1년만 모아서 분석하면 신(神)을 흉내 낼만큼 한 개인의 과거와 현재 상태를 정확하게 알 수 있고 다음 행동도 미리 알 수 있는데, 바로 마이 데이터(my data)다.

물론 이때 개인의 정보는 가명이나 익명으로 처리되어 보호한다. 또 한지역, 한 은행, 한 산업(공장, 연구소 등), 플랫폼 및 포털 등 사용자들의 마이 데이터를 대량으로 모아 분석을 하면 빅데이터 (big data)가 된다.

민간과 공공 등 국가의 데이터를 결합하여 인공지능(AI), 데이터 마이닝 등 고도화한 ICT(Information and Communications Technology) 기술을 활용하면 재화와 서비스의 개발, 판매, 광고 등 마케팅을 효과적으로 하고, 미래를 예측하며 새로운 가치를 창출한다.


이 중 국가 등 공공데이터의 활용범위를 가급적 국가보안을 제외하고는 공개 원칙으로 하여야 데이터 생태계가 살아난다. 또 공공데이터를 사용하는 기준 등이 데이터 산업의 핵심, 표준기술이 될 수 있다. 이들을 결합하면 데이터 댐(data dam)이 된다.

한 나라의 잘 구축한 '국가 데이터 댐' (national data dam, 필자 명명)은 민간과 공공 분야 모두에게 유용한 자산이다. 아울러 한국의 모든 것이 담겨있다시피 하는 예민한 안보 자산이다.

데이터 댐은 자국은 물론이고 다른 나라의 마이 데이터와 빅데이터 등 수집하고 결합하며 보강하여 활용하는 나라가 데이터 강국이 된다.

이는 바로 국가 경제와 힘의 원천으로 이어진다. 실제 미국은 2021 년 12월 호주와 데이터 공유 협정을 체결하면서 글로벌 데이터 패권을 확보하기 시작했다.

▲ 데이터 시장, 약 368 조원

디지털 시대에 데이터는 '제2의 원유'라고 불릴 만큼 천연자원과 인적자원 보다 더 가치 있는 디지털 경제 자산이고 지켜야 하는 안보 자산이다.

"TechNavio, Global Big Data Market, 2020"에 따르면 전 세계 빅데이터 시장은 2019년 기준 서비스는 988억 달러(118조 원, 원화 1200원 기준, 이하 같음), 소프트웨어가 665억 달러(80조 원)로 총 1,653억 달러(198조 원)인데 2024년에는 3,069억 달러(368조 원)로 전망한다.

현재 한국의 데이터 산업 규모는 한국데이터산업진흥원(K-DATA)이 공개한 '2021 데이터 산업 현황조사' 통계에 따르면 20조 원 수준이고 종사하는 인력은 39만 4709명이다.

▲ 데이터를 활용한 온라인 광고 시장이 대세

출처 구글
출처 구글
그런데 빅데이터 시장 규모에서 가장 중요한 부문이 누락되었는데 바로 광고 매출이다. 데이터는 AI 등을 통하여 사용자의 다음 행동을 정확하게 예측할 수 있고 일대일 타깃(표적) 광고를 할 수 있다. 구글, 페이스북, 아마존 등은 사용자가 검색, 쇼핑, SNS를 하면서 남긴 다양한 데이터, 사용목적 이외에 추가 데이터 ('잉여가치'라 함)를 무상으로 제공받는다.

이 데이터들은 위치정보를 포함하여 사용자의 과거와 현재 상태를 알려주고 미래 행동도 예측하게 해 준다. 실제 페이스북, 구글을 사용하면 사고 싶은 상품이나 궁금한 것에 대한 광고나 뉴스가 나타난다. 눌러보지 않을 수 없다. 데이터 알고리즘을 이용한 광고다.

세계 최대 미디어 투자관리 전문업체인 그룹엠은 최근 펴낸 글로벌 광고시장 전망 보고서에서 2021년 11월까지 전 세계적으로 광고에 지출된 돈의 규모가 7,632억 달러(약 916 조원)에 달해 지난해 같은 기간보다 22%나 증가한 것으로 나타났다고 밝혔다. 이 중 온라인 광고가 차지한 비중은 무려 64.4%에 달한 것으로 나타났다.

FT는 그룹 엠이 이번 보고서에 추산한 내용을 인용해 “알파벳(구글 모기업), 아마존, 메타 플랫폼스(페이스북 모기업) 등 세 IT 공룡이 지난 5년간 거둔 광고 매출은 4,910억 달러(약 580조 원) 규모로 전년 대비 30%가 넘는 실적 향상을 달성했다”며 이같이 전했다.

중국을 제외한 글로벌 디지털 광고시장의 80~90%가 알파벳, 아마존, 메타 플랫폼스에 장악돼 있다. 사용자가 '검색'하고 '좋아요'를 누르는 것이 모두 무상으로 제공하는 데이터인 것이다.

2020년 기준 구글의 수익구조는 검색광고 57%, 유튜브 광고 11%, 네트워크 광고 13%, 클라우드 7%로 대부분 광고 수익이다. 네이버의 온라인 광고 사업은 회사 매출의 절반을 책임지고 있고, 페이스북 수익 역시 98.84%는 광고 수익이다. 데이터 사업 광고는 지속하여 현금을 확보할 수 있는 캐시카우(cash cow)다.

이제 전 세계 데이터 시장을 필자 주장대로 서비스, 소프트웨어에 디지털 광고를 더하면 연간 2,251억 달러(270조 원)의 규모가 된다. 그리고 이 시장은 연간 10% 이상 지속적으로 성장하는 시장이다.

한국의 우수한 IT 인프라와 우수한 IT 인적자원을 가지고 있는 한국으로는 제2의 반도체 먹거리로 만들 수 있는 신성장 동력이 될 수 있다.

그런데 2가지가 의문이 생긴다. 하나는 데이터 주인의 권한(주권)을 보장하려는 방향으로 개선되고는 있으나 제대로 가고 있는지 의문이 드는데 데이터 제공자에게 전혀 수익 배분이 없다는 점이다. 두 번째는 왜 양질의 데이터를 주고받는 공공서비스 플랫폼에서는 광고가 없을까라는 의문이다.

▲ '데이터 주권'에 왜 수익이 없나?

출처 pixbay
출처 pixbay
구글 등에 무상으로 제공한' 잉여가치'는 누구 것인가? 사용자가 무상으로 남긴 데이터로 막대한 수익이 발생하였는데 구글이나 페이스북이 사용자인 고객에게 데이터 제공 수익을 배분해주었다는 이야기를 들은 적이 없다.

구글 등이 막대한 수익이 발생하는 광고와 서비스에 없어서는 안 되는 귀중한 원료를 제공한 사용자의 데이터 권리는 전혀 없다. 최근 유럽, 미국은 물론이고 한국에서 데이터에 관한 제도와 법을 보완하면서 데이터 주권을 말하지만 주로 '개인정보보호'에 편중되어있다.

한국도 2020년 8월부터 ‘개인정보 보호법’, ‘정보통신망 이용촉진 및 정보보 호 등에 관한 법률(이하 ‘정보통신망법’), ‘신용정보법’ 등 이른바 데이터 3 법이 개정되어 시행되었다. 마이 데이터 사업이 금융권을 시작으로 통신·의료·제조·공공 등 전 분야 확산을 위한 물꼬가 트였다.

또 '개인정보보호위원회'가 컨트롤타워 역할을 맡아, 분야별로 흩어져 있는 데이터 표준화 작업을 진행하고 있다.

2022년 올해는 개인정보의 안전한 활용과 관련하여 대화형 데이터 내 개인정보 탐지기술 등 개인정보 보호 활용 기술 연구개발이 본격화되고 마이 데이터 전 분야 확산을 위한 표준화, 100 만 중소기업 소상공인 대상 맞춤형 지원 강화 등이 본격 추진된다.

대부분 데이터를 이동하고, 결합하여 활용하게 하되 개인정보를 가명, 익명 처리하여 보호하는데 초점이 맞추어져 있지만 데이터로 발생한 수익을 배분하는 문제는 거론조차 되지 않고 있다.
[박대석 칼럼] 새 정부, 데이터 산유국 만들자
고객이 제공한 데이터는 3단계를 거친다. 1단계는 통계청을 포함하여 의료기관, 금융기관, 신용정보기관, 한전 및 통신사, 인터넷 포털사 등이 사용자로부터 데이터를 수집한다.

2단계는 데이터 수집회사 및 기관의 개인정보를 블록체인 등을 활용하여 가명, 익명 등의 비식별 조치(데이터 안심 존)를 취한다.

3단계로 데이터 소비자인 대학, 연구소, 유통 및 제조회사 등 기업에 각종 분석 및 예측 데이터로 활용하게 하는 것이다. 이 단계를 거치며 각종 수익이 발생하지만 원 데이터 제공자인 데이터 주권자에게 수익을 배당해주지 않는다.

다만 또 데이터 제공자인 데이터 주권을 위하여 각 회사에 분산되어있는 금융정보를 통합 관리하는 '마이 데이터'를 지난달 5일부터 전면 시행했다. `22년 상반기 중에는 국세‧지방세‧관세 납세내역 및 건강보험 등 공공정보도 제공한다는 방침이다.

데이터 제공자인 주인이 자신의 어떤 정보가 어디에 있고 또 어느 곳에 제공하는지 통합해서 관리할 수 있게 해주는 것이다. 필요한 일이지만 당연한 조치다.

부동산 등 자산은 소유권, 사용권(임대료), 담보권 등의 권리가 있다. 마찬가지로 경제 자산인 데이터의 제공 자겸 소유권자가 데이터의 사용에 따른 임대료를 받을 수 있는 권리도 있다. 앞으로 한국을 포함하여 세계 시민이 요구하고 개선해야 할 일이다. 그때 비로소 만족할 만한 데이터 주권(consumer data sovereignty)을 확보했다고 말할 수 있다.

자유민주주의의 시민의 주권은 유럽의 왕정과 시민혁명 등 투쟁을 통하여 점진적으로 발전했다. 마찬가지로 데이터 민주주의도 시민의 데이터를 당연한 듯이 무상으로 사용하고, 심지어 권력으로 휘두르는 빅 테크(Big Tech)와 단계적 투쟁을 통하여 개선되고 쟁취해야 할 것이다.

▲ 디지털 플랫폼 정부와 디지털 대전환, 예산 없이 구축하고 데이터 수익 분배

출처 istockphoto
출처 istockphoto
새 정부 대통령 후보들은 '디지털 대전환'과 '디지털 플랫폼 정부'의 필요성을 역설한다. 필요한 일이다. 디지털 플랫폼 정부(이하 약칭 KP24, Korea platform 24, 필자 명명)'는 한 곳에서 모든 민원을 처리하는 원사이트 토털 서비스를 제공하는 일이다.

디지털 기술과 빅데이터에 기반한 국민 맞춤형 서비스 정부를 구축하여야 한다.

대한민국 정부는 정보통신 기술 발달에 맞추어 지속해서 '전자정부를 고도화해왔다. 지금도 '정부 24'를 통하여 민원을 온라인으로 통합 서비스하고 있고, 각 정부 말단 조직까지 개별 홈페이지 등을 통하여 행정서비스를 하고 있다.

하지만 현재 수준은 있는 정보를 한 곳에 모아놓은 수준이다. 이 단계를 예를 들면 '토스'뱅크 앱 서비스와 같이 맞춤형으로 진화하는 일이다.

이 단계에서 수집되는 5천만 명 국민의 개인정보 등 데이터의 양과 질은 중동에 매장된 원유만큼이나 가치가 있다. 원래의 서비스 목적과 별개로 추가하여 수집한 두 가지의 데이터는 각종 의약품 개발, 교육프로그램, 복지정책 등 경제, 산업은 물론이고 국정 전반을 포함한 대한민국 전체의 유용한 자원으로 사용할 수 있다.

막대한 예산이 소요되는 ' KP24'를 국민 혈세인 예산 없이 만들고 운영할 수 있다. 바로 광고다. KP24는 그 어떤 플랫폼보다 정확한 타깃 광고를 할 수 있다. 대부분 공인 인증 절차를 거친 서비스를 하기 때문이다.

정부의 공공 플랫폼에서 어떻게 광고를 하느냐는 생각은 디지털 플랫폼에서는 버려도 좋다. KP24에서 광고를 한다고 민원인이 불편할 일도 없다.

국내외 공영방송들은 주요 광고주인 대 기업에 대하여 영향을 받을 것을 우려하여 광고를 받지 않고 세금 형식의 수신료를 징수한다. 그러나 KP24의 광고주 대부분 5,531천 개의 자영업자 등 6,894개의 중소기업이 위주로 운영하게 된다.

따라서 공영 TV처럼 혈세인 '수신료'를 받을 필요가 없고 오히려 민원처리 비용을 무상으로 할 수 있다. 나아가 비싼 광고비를 들이지 않고도 효과적으로 광고주인 중소기업의 제품 등 홍보할 수 있게 해 줄 수 있다.

페이스북 등도 코카콜라 같은 대기업도 사용하지만 월 활성화 이용자 28억 명 중 약 3 천만 개의 비즈니스 가입자가 주요 광고주로 추정된다.

전 세계 검색시장의 93%를 차지하는 구글(알파벳)의 시가총액은 1조 623억 달러, 약 25억 명이 사용하는 페이스북 9,367억 달러, 아마존 1조 617억 달러이다. 3개 회사의 시가총액은 3조 607억 달러(한화 3,672조 원)로 한국 예산의 6배에 해당한다.

10세를 초과한 47백만 명의 활성화 가입자가 매일 이용하는 대한민국 디지털 플랫폼 정부(KP24)의 가치는 얼마나 될까?

KP24의 공공성 등 이용자의 충성도를 고려하여 3개 회사인 사용자 수 대비 2% 의 3배의 가중치를 단순하게 따져도 220조 원 이상되며, 연간 수익도 13조 원이상이 된다. 적정한 공익 재단을 통하여 수익금으로 긴요한 정책에 지속적으로 사용할 수 있고 데이터 사용자인 국민에게 활용 빈도와 데이터 제공량에 따라 수익을 배분해줄 수도 있다.

세계 최초로 홍익인간 정신을 디지털로 발현하는 의미 있는 일이기도 하다.

▲ 데이터와 디지털의 딜레마

출처 istockphoto
출처 istockphoto
현재 한국의 마이 데이터와 빅데이터 산업은 금융 분야를 중심으로 본격적으로 시작되었다. 그 과정에서 개인정보보호를 위하여 데이터 3 법 개정과 개인정보보호위원회를 두어 안전장치를 만들었다.

이제 세계적인 추세는 개인정보보호를 넘어 데이터의 이동, 결합, 촉진은 물론이고 글로벌 데이터 패권을 위하야 국가 간 결합을 시도하는 단계로 넘어가고 있다.

디지털 기술은 편리하지만 사용 시 반드시 흔적과 데이터를 남긴다. 따라서 사용자 간의 수평적 익명성 등 프라이버시가 보장되지만, 데이터를 수집하는 은행, 공공기관 등 플랫폼 회사와 사용자 간의 수직적 익명성은 보장되지 않는다.

따라서 데이터를 가지고 있는 주체인 은행, 공공기관 등 정부가 악용하면 막을 방법이 별로 없다.

중앙은행이 발행하는 법정 디지털 화폐(Central Bank Digital Currency, CBDC)도 불법 거래 및 자금세탁 방지, 발권비용 절약, 세원 포착, 이동과 사용의 편리성이 있으나 중국 등 사회주의 국가나 금융인프라가 뒤처진 후진국을 제외한 나라 이외에 자유민주주의 국가인 미국, 영국, 일본을 포함한 한국은 제도 도입에 신중한 태도다.

정부가 CBDC를 악용하면 완벽한 디지털 빅브라더, 감시 자본주의(surveillance capitalism, 쇼샤나 주보프가 명명)가 될 수 있는 우려 때문이다.

또한 디지털은 장보를 집중하고 활용하기 좋지만 한꺼번에 해킹당하거나 도용될 위험도 크다. 따라서 데이터 댐은 국가안보 차원에서 철저하게 관리해야 한다.

▲ 나가며, 데이터 산유국이 되자.

drilling for data / 출처 Dreamtimes
drilling for data / 출처 Dreamtimes
그러나 4차 산업혁명 시대, 디지털 경제시대, 데이터 경제시대에 디지털 화폐, 마이 데이터 및 빅데이터 등 디지털 수단 등을 부작용이 두려워 피할 수 도 없다. 더구나 데이터 등 디지털 시대에 한국은 미국 등과 1,2위 다툼을 할 수 있는 인적, 물적 환경을 가지고 있다.

따라서 데이터 산업은 시장에서 수요에 따라 정부가 수동적, 소극적, 후발적, 산발적으로 움직임여서는 안된다. 정부가 융합적, 적극적인 자세로 필요한 기술 개발 지원, 입법, 관련 제도 등을 신속하게 지원하여 한국이 글로벌 데이터 시장을 선도하도록 환경을 만들어 주어야 한다.

또 데이터 산업의 구조 생태계는 한 분야에 지우 친 전문 분야가 아니다. 그야말로 어디에 있는 데이터를 어디에 어떻게 이용하는지 융합하는 분야로서 국내외 정치, 경제, 사회, 외교 등 각 분야를 총괄하는 정부의 역할이 아주 중요하다.

그러기 위해서는 데이터 관련 부처인 과학기술정보통신부, 통계청, 개인정보위원회, 한국데이터산업진흥원은 물론이고 각종 데이터를 수집하고 활용하는 금융위원회 등 각 부처와 국가정보원 등 국가안보 차원에서 데이터를 관리하는 통합적인 기구가 필요하다.

부디 한국의 각 행정부에 있는 한국의 엘리트 공무원들이 관련 업계와 잘 협업하여 새 정부 출발과 함께, 경제 자산인 데이터 원유가 콸콸 나오는 산유국을 만들어 주기를 기대한다. 그 시작이 'KP24, 대한민국 디지털 플랫폼 정부'다.

<한경닷컴 The Lifeist> 박대석

"외부 필진의 기고 내용은 본지의 편집 방향과 다를 수 있습니다."
독자 문의 : thepen@hankyung.com