통계청, 5년 내 'K-통계시스템' 구축…시범통계·샌드박스 도입
통계청이 정부와 공공기관이 보유한 데이터를 한데 모아 활용할 수 있는 공공 빅데이터 체계 구축에 나선다.

기관별 데이터는 암호화된 상태로 결합·활용할 수 있도록 최신 암호 기술을 적용해 개인정보 유출 우려를 막는다.

통계청은 1일 이런 내용을 담은 'K-통계시스템 구축 추진 계획'을 발표했다.

K-통계시스템은 중앙 부처, 지방정부, 공공기관이 보유한 데이터를 실시간으로 업로드할 수 있는 클라우드 기반 공공 빅데이터 시스템이다.

기관별 데이터를 통계청이 관리하는 데이터 허브 클라우드 공간에 올리고 필요할 때 데이터를 결합하거나 연산할 수 있게 하는 방식이다.

이때 데이터는 암호화된 상태로 클라우드 공간에 각각 분리해 저장하고, 암호 상태 그대로 연산하기 때문에 데이터 간 결합에 따른 개인정보 유출 우려를 불식할 수 있다고 통계청은 강조했다.

류근관 통계청장은 "통계등록부를 연결고리로 삼아 정부 부처와 공공기관에 퍼져있는 데이터를 안전하게 결합·연계하고 활용할 수 있는 체계를 만들 것"이라고 설명했다.

이어 "각 기관 데이터는 기관별로 고유한 박스, 금고 내에 가장 안전하게 보관되므로 다른 기관의 데이터가 섞이지 않고, 박스와 박스가 충돌해 깨질 일도 없다"고 덧붙였다.

이렇게 쌓인 빅데이터는 공공정책의 효율성을 높이고 디지털 플랫폼 기업과 신규 창업 기업 간 디지털 디바이드(정보화 격차)를 줄이는 데 활용할 수 있다.

예컨대 재난지원금 지급에 들어간 재정지출 자료와 지출에 따른 재분배 효과 자료를 연계·결합함으로써 정책 효과를 더욱 상세히 분석할 수 있다.

통계청은 각 기관도 정보 유출 우려 없이 데이터 간 연계 분석을 자유롭게 진행할 수 있기 때문에 자발적으로 K-통계시스템에 참여할 수 있을 것으로 전망했다.

나아가 공공 데이터를 활용하고자 하는 민간 기관도 자체 데이터를 유출 우려 없이 결합해 활용할 수 있기에 전체 데이터 규모는 더 늘어날 수 있다는 게 통계청의 기대다.

K-통계시스템은 이르면 오는 2024년에는 구축이 가능할 것으로 보인다.

류 청장은 "향후 3년 동안 새로운 동형암호 기법을 적극적으로 도입하고 관련 상용화 방안을 추진할 계획"이라며 "욕심부리면 3년, 늦어도 5년 내에는 대한민국이 가장 완벽한 암호체계로 공공 빅데이터를 운영하는 최초의 나라가 될 것"이라 말했다.

통계청은 이와 함께 시범통계 제도를 도입해 통계 서비스 활용을 확대한다.

시범통계는 통계청이 공식적으로 승인 인증을 해주기 전에 통계 이용자들이 관련 한계를 충분히 인식하고 시범적으로 활용할 수 있도록 하는 준 통계체계다.

시범통계 도입에 맞춰 국가통계를 승인통계, 지정통계, 공공통계, 시범통계로 세분화하고 차등 관리할 방안도 마련한다.

통계청은 또 특정 기관이나 이용자를 대상으로 통계 데이터 이용 범위를 제한적으로 넓혀주는 '통계자료 샌드박스' 제도를 최대한 빠른 시기에 시행할 계획이다.

종전까지는 통계 제공 가능 여부에 대한 판단이 모호한 경우 자료를 제공하지 않았지만, 앞으로는 충분한 자료 보안이 이뤄진다는 것을 전제로 일정 기간에 걸친 자료 열람과 활용을 허용하겠다는 취지다.

/연합뉴스