정부가 추진하는 디지털 뉴딜의 대표 사업인 ‘데이터 댐’ 프로젝트가 본격적으로 가동된다.

과학기술정보통신부는 2일 데이터 댐 프로젝트의 7대 핵심사업을 수행할 주요 기업과 기관을 선정했다고 발표했다.

데이터 댐은 지난 6월 문재인 대통령이 “데이터 경제의 기반이 되는 데이터 활용을 최대한 활성화하기 위한 사업”이라고 소개했다. 미국 대공황 당시 경기 부양을 이끌었던 ‘후버댐’ 건설 사업에 비유한 이름이다. 공공과 민간의 네트워크를 통해 구축되는 데이터를 모아 표준화하고 가공해 더 똑똑한 인공지능(AI)을 개발하는 기반으로 활용하는 것이 핵심이다.

과기정통부는 이번 사업에서 14만여 개 공공 데이터를 민간이 활용할 수 있도록 했다. 이를 위해 △AI 학습용 데이터 구축 △AI 바우처 △AI 데이터 가공바우처 △AI 융합 프로젝트 △클라우드 플래그십 프로젝트 △클라우드 이용바우처 △빅데이터 플랫폼 및 센터 구축 등 7개 사업에 약 5000억원의 추가경정예산을 투입한다.

주요 AI 개발 전문기업, 크라우드소싱 기업과 함께 서울대·KAIST 등 37개 대학산학협력단과 서울대병원, 국립암센터 등 21개 주요 병원 등이 참여했다. 한국어 말뭉치, 농작물 병해충 이미지, 암 질환 영상 등 텍스트 7억 건, 음성 6만 시간, 이미지 6000만 건, 영상 1만5000시간 등 대규모 데이터를 구축하게 된다.

과기정통부는 이번 사업을 바탕으로 데이터 표준화를 추진할 계획이다. 또 민간 클라우드를 포함한 디지털 서비스의 공공부문 조달이 쉬워지도록 계약제도를 개선하기로 했다. 오는 11월에는 AI 분야 법·제도 개선 로드맵과 AI 윤리 기준도 정립하기로 했다. AI로 인한 경제·사회 전반의 패러다임 변화에 대응하기 위한 제도적 기반을 마련하기 위해서다.

최기영 과기정통부 장관은 “정부의 노력뿐만 아니라 민간의 투자와 참여가 무엇보다 중요하다”고 말했다.

조수영 기자 delinews@hankyung.com