본문 바로가기

    ADVERTISEMENT

    '데이터 장벽'에 막힌 한국…AI 기술력 갖춰도 산업화 좌초 위기

    • 공유
    • 댓글
    • 클린뷰
    • 프린트
    한국인공지능·소프트웨어산업협회 보고서

    개인정보 활용 제한·저작권 규제 탓
    인공지능 전환에 데이터 활용 미흡

    AI 역량 6위인데 운영환경은 35위
    기술력 앞서도 상용화 뒤처질 우려
    미국 오클라호마주에 위치한 구글의 데이터센터 내부 모습. 구글 제공
    미국 오클라호마주에 위치한 구글의 데이터센터 내부 모습. 구글 제공
    ‘인공지능(AI) 역량 6위, 운영환경 35위.’

    한국인공지능·소프트웨어산업협회(KOSA)가 최근 발간한 ‘AI 산업 전환을 위한 데이터 전략 보고서’에 나온 수치다. AI 기술 경쟁력은 뛰어나지만 국내 기업들은 여전히 개인정보 활용 제한과 저작권 규제 탓에 학습 데이터를 인공지능 전환(AX)에 제대로 활용하지 못하고 있다는 분석이다. 주요국이 데이터 인프라를 국가 경쟁력의 근간으로 삼은 것과 달리 한국은 제도적 뒷받침이 부족하다는 게 보고서의 핵심이다. 이대로 가면 기술력만 앞서고 산업화와 상용화에서는 경쟁국에 뒤처질 것이란 우려가 나온다.

    ◇ 데이터 장벽에 막힌 국내 기업

    KOSA 보고서에 따르면 대한민국은 글로벌 AI 경쟁력 평가에서 인프라 6위, 개발 능력 3위, 정부 전략 4위를 기록하며 전체 순위 6위에 올랐다. 그러나 세부 지표를 보면 데이터 활용 법령 등을 포함한 운영환경은 35위, 인재·연구는 13위, 상용화는 12위로 낮은 수준이다. 상위 10개국 가운데 한국보다 운영환경 점수가 낮은 국가는 싱가포르와 이스라엘뿐이다.

    '데이터 장벽'에 막힌 한국…AI 기술력 갖춰도 산업화 좌초 위기
    보고서는 운영환경 점수가 낮은 원인으로 개인정보 비식별화의 불완전성, 저작권 검증 부담, 기관 간 데이터 공유 한계와 표준화 미비, 데이터 처리 비용 부담 등을 꼽았다. 특히 데이터 활용 가이드라인이 구체적 사례가 아니라 원칙 중심으로 구성돼 실제 적용 단계에서 해석이 엇갈린다. 이로 인해 기업들이 불확실성을 피하려 보수적으로 움직인다는 분석이다. 가명 정보와 익명 정보 간 경계가 불분명해 같은 데이터라도 개인정보보호위원회, 보건복지부, 금융위원회 등 유관기관마다 지침이 달라지는 사례도 잦다.

    이 때문에 AI 산업 현장 곳곳에서 사업 차질이 발생하고 있다. 한 스타트업은 생성형AI 콘텐츠 플랫폼을 제작하며 공공기관이 보유한 이미지와 음성 데이터를 활용하려고 했다. 하지만 기관마다 흩어져 있어 접근과 취득에 수개월이 걸렸고, 수집 및 저장에만 수억원이 들었다. 또 다른 의료 AI 스타트업은 방대한 의료 영상 데이터는 외부 반출이 불가능해 병원과의 협업이 무산됐다. 데이터 익명 처리 과정에서 전문가 투입에 따른 추가 비용까지 겹치며 사업이 흔들린 사례도 부지기수다.

    이 같은 상황은 초기 스타트업에 큰 장벽으로 다가온다. 학습 데이터 수요는 기하급수적으로 늘고 있지만 스타트업들은 대기업에 비해 각종 데이터에 접근하기가 수월하지 않다.

    ◇ 각국, ‘법’ 무기로 AI 경쟁력 키운다

    주요국은 한국보다 먼저 데이터 전략을 국가 경쟁력의 중심에 두고 법·제도를 정비했다. 미국은 2009년 버락 오바마 행정부의 ‘Data. gov’를 시작으로 2019년 ‘오픈 정부 데이터법’까지 제정하며 공공 데이터를 공개·활용할 수 있는 법적 권리와 절차를 제도화했다. 현재 100개 이상 기관이 35만 건이 넘는 데이터 세트를 누구나 무료로 활용할 수 있도록 제공 중이다. 지난해엔 ‘외국 적대국으로부터의 미국인 데이터 보호법(PADFA)’과 생성형 AI 저작권 공개 법안을 도입해 데이터 보안과 저작권 보호를 강화했다. 지난 5월 미국 저작권청은 AI 생성물이 시장 경쟁 상황에서 원저작물의 가치를 떨어뜨릴 경우 공정 이용으로 보기 어렵다는 해석을 담은 ‘시장 희석 이론’을 제안했다. 다만 발표 직후 트럼프 대통령이 저작권 청장을 해임하면서 미국이 기업친화적 AI 데이터 활용 지침을 강화할 수 있다는 관측이 나오는 상황이다.

    유럽연합(EU)은 2019년 회원국 간 안전한 데이터 공유와 활용을 추진하는 동시에 글로벌 빅테크 의존을 줄이기 위해 독자 인프라인 ‘가이아-X 프로젝트’를 출범시켰다. 2023년에는 ‘데이터법’을 제정했다. 데이터법은 커넥티드 제품 사용자에게 데이터 활용 권리를 보장하고, 기업 간 불공정 계약을 제한한다. 자동차·의료·제조 분야에서는 기업끼리 데이터 공간을 조성해 산업 데이터를 공유할 수 있도록 제도화했다. 영국은 적극적으로 데이터 산업을 활성화하는 국가로 꼽힌다. 2010년대 초부터 ‘정보경제전략’ ‘오픈데이터 로드맵’ ‘디지털경제법’을 잇달아 제정하며 데이터 산업을 적극 육성해 왔다. 특히 규제 샌드박스를 통해 의료·교통 분야에서 데이터 기반 혁신을 지원하고 있으며, 최근엔 저작권자가 명시적으로 먼저 거부하지 않는 한 AI 학습에 콘텐츠를 자유롭게 활용할 수 있도록 하는 ‘옵트아웃’ 제도까지 검토 중으로 알려졌다. 중국은 2012년 빅데이터를 국가 전략 산업으로 육성하겠다고 선언하며 14차 5개년 계획에 3조 위안을 투입했다. 2023년에는 해외 기업의 투자 유인을 높이기 위해 국경 간 데이터 전송 규제안에 예외 사항을 도입했다.

    ◇ 韓, 선명한 데이터 활용 기준 필요해

    한국은 2020년 세계 최초로 ‘제조 데이터 공유 규범’을 제정했다. 또한 데이터 3법을 네 차례 개정하며 개인정보보호 중심의 법체계에서 데이터 경제 활성화와 국제 표준과도 부합하는 방향으로 전환해왔다. 하지만 KOSA 보고서는 국내 산업 현장의 실무적 요구를 반영하기 위해서는 사례 중심의 한국형 데이터 이용 기준을 마련해야 한다고 제언했다.

    특정 산업이나 업무 분야에 특화된 ‘버티컬 AI’는 의료·금융·제조 등에서 빠르게 확산 중이다. 다만 고품질 데이터 없이는 운영이 어렵다는 특성 때문에 제도적 기반이 뒷받침되지 않으면 경쟁력이 약화될 수 있다는 경고도 전했다.

    최영총 기자 youngchoi@hankyung.com

    ADVERTISEMENT

    1. 1

      망가진 베네수엘라 경제…'UN 지원 스테이블코인'으로 재건 시도

      ‘핀테크의 정점’인 코인(암호화폐)에 대한 투자자들의 관심이 높아지고 있다. 도널드 트럼프 미국 대통령 일가의 코인 두 개가 국내 최대 코인거래소 업비트와 빗썸에 지난 1일 상장됐다. 월드리버티...

    2. 2

      김필규 "원화 스테이블코인 시행하려면 만기 1년 이하 단기 국채 도입해야"

      원화 스테이블코인을 도입하기 위해선 만기 1년 이하 단기 국고채를 도입해야 한다는 주장이 나왔다. 한국은 국채 시장이 발달한 국가 중 단기 국고채를 도입하지 않은 유일한 곳이다.김필규 자본시장연구원 선임연구위원은 지...

    3. 3

      [기고] 'AI 강국' 꿈꾸는 한국, 네트워크 인프라 혁신 서둘러야

      최근 출범한 이재명 정부가 ‘인공지능(AI) 강국’을 핵심 국정 과제로 내세웠다. AI를 행정과 산업 전반의 혁신 동력으로 삼겠다는 구상이다. 의료, 제조, 금융, 국방, 공공서비스 등 거의 모...

    ADVERTISEMENT

    ADVERTISEMENT