본문 바로가기

    ADVERTISEMENT

    "토종AI 인데 미국 데이터로 배워"

    • 공유
    • 댓글
    • 클린뷰
    • 프린트

    <앵커> 이렇게 국내 생성형 AI 산업이 발을 떼고는 있지만, 글로벌 기업들과 비교할 때 성장의 속도는 여전히 더딘 모습입니다.

    데이터 부족 문제를 비롯해 한계점들이 많기 때문인데, 정부가 첫 AI 경쟁력 강화 전략을 오늘 공개했습니다.

    산업부 이근형 기자와 자세히 알아봅니다.

    이 기자, 앞서 살펴본 AI 음악생성 기술, 가격경쟁력을 앞세우면서 상당한 성장이 기대가 됩니다.

    그런데 실제 이런 생성형 AI 기업들, 속을 들여다보면 고충이 상당히 많다고 하는데,

    대표적으로 카카오의 AI연구조직, 브레인이 한국 데이터가 아니라 미국 데이터를 기반으로 AI를 학습시키고 있다고요?

    <기자> 미국의 커먼크롤이라는 오픈소스 데이터 연합체가 있습니다.

    구글을 비롯한 여러 빅테크 기업들이 AI 개발에 이 커먼크롤을 활용하고 있거든요.

    카카오브레인 역시 커먼크롤을 이용해서 AI 기본데이터를 학습 시키고 있는데,

    물론 추가로 일부 국내 공개 데이터를 넣고, 국내 사정에 맞게 파인튜닝(Fine-tuning)하는 작업을 거치기는 합니다.

    하지만 국내 데이터를 기본으로 할 수 없다는 점은 아무래도 아쉬운 부분입니다.

    <앵커> 우리나라도 데이터 양이 적지는 않을텐데, 어째서 미국 데이터를 쓰는 겁니까?

    <기자> 커먼크롤은 2007년부터 15년 넘게 오픈소스 데이터를 모아 왔지만, 우리는 그 정도 규모로 데이터를 보유한 업체가 없기 때문입니다.

    지금부터라도 데이터를 모아야 하는데, 문제는 법적 분쟁을 피하려면 공개된 데이터만 써야 한다는 겁니다.

    공개된 데이터 자체가 적은데다, 공개된 건지 아닌지 구분도 쉽지 않아서 어려움이 커보입니다.

    <앵커> 당연히 학습시키는 데이터가 많을수록 AI의 성능도 좋아질텐데,

    국내에선 모을 수 있는 데이터가 적다라고 한다면 경쟁력 측면에서 문제가 되겠습니다.

    아마 대부분 국내 개발사들이 사정이 비슷할 것 같은데, 네이버도 그렇습니까?

    <기자> 네이버는 오랫동안 포털 사업을 영위해 왔기 때문에 카카오 만큼은 아닙니다.

    방대한 자체 데이터를 갖고 있고 그래서 한국어 역량도 챗GPT보다 6500배 뛰어나다고 강조하기도 했죠.

    네이버의 하이퍼클로바는 50년 분량의 뉴스 콘텐츠를 익히고,

    카페, 블로그, 지식인 같은 곳에서 데이터를 학습하기도 했는데,

    하지만 이게 오히려 네이버의 잠재적 리스크가 되고 있습니다.

    품질은 높은 반면, 데이터 원작자들과의 분쟁이 빗발칠 수 있기 때문입니다.

    <앵커> 정부가 오늘 초거대AI 경쟁력 강화 방안을 공개했습니다.

    우리 AI 개발사들이 어려움을 겪고 있는 데이터 확보 문제에 대한 해법이 담겼다고요?

    <기자> 그렇습니다.

    AI 학습용 데이터 구축 문제를 정부가 주도해서 해결하겠다는 게 핵심으로 보입니다.

    올해 투입하는 예산 3,900억 가운데 1,200억원 이상이 이렇게 학습용 데이터 구축에 들어가고,

    앞으로 매년 데이터 확보에 예산이 투여될 예정입니다.

    현재 네이버, 카카오나, LG, KT 같은 기업들이 초거대AI를 개발하고 있지만,

    AI의 하드웨어 성능을 의미하는 파라미터 부분은 벌써부터 글로벌 빅테크에 밀린다는 평가가 나옵니다.

    결국 범용성보다는 한국에 특화되거나, 전문화된 AI를 만들어내는 게 경쟁력이 될 수밖에 없는데,

    이러자면 국내 독자 데이터를 확보하는 것, 무엇보다 중요한 과제가 아닐 수 없습니다.

    또 정부의 이번 안에서는 앞서 리포트에서 보셨던, AI음원 만드는 주스 같은 기업들을 많이 육성하겠다는 내용도 담겼습니다.

    이런 기업들을 우리가 서비스형 소프트웨어(SaaS) 기업이라고 하는데, 2026년까지 1만개를 키우겠다는 게 정부 전략입니다.

    다만 이번에 투입한다는 4천억이라는 예산이 과연 충분하냐는 의문입니다.

    비영어권을 노리겠다. 전문분야 AI 세계 1위를 노린다.

    라고 하는데, 일본, 중국 같은 막강한 경쟁상대를 이겨내기 위해서는 좀 더 과감한 투자가 필요해 보입니다.



    <앵커> 어쨋거나 정부가 새롭게 예산도 투자하고, 데이터도 구축한다니 환영할만한 일인데,

    앞서 네이버 사례 같은 분쟁을 막기 위해서 저작권 문제라든지, 교통정리도 좀 필요하지 않을까요?

    <기자> 맞습니다. 이 문제와 관련해서 오늘 정부는 제도를 정비하겠다 정도로 짧게 설명했는데요.

    이미 2016년부터 문체부와 지재권위원회 주도로 논의가 계속 이어오고는 있습니다.

    다만 산업계와 권리자 단체들 사이에 이견이 워낙 심하다 보니까 속도를 내지는 못하는 상황입니다.

    현재까지 유력하게 거론되는 건 국회 도종환 의원이 대표 발의한 법안(저작권법 전부개정안) 정도가 있는데요.

    'AI 학습을 시킬 때는 이런이런 경우를 제외하면 저작물을 사용해도 된다' 같이 경계선을 명확히 긋는 내용이 담겨 있습니다.

    그밖에 또 어떤 기준이 필요하냐. 전문가 통해서 직접 들어봤습니다.

    [허인 / 한국지식재산권연구원 법제연구실장 : 원저작자의 저작물을 활용하지 않고 좋은 콘텐츠가 나올 수 있다고는 생각하지 않습니다. 중요한건 원 제작자한테 어떻게 이익분배를 하느냐 이게 중요할 것 같아요. AI 창작물의 권리등록, 인증제도 이런걸 구축을 잘해서, 저작자에게 이익분배가 되는 기술적 방안에 대해서도 검토할 필요가 있다고 생각하고요.]



    <앵커> AI산업 경쟁력을 키우면서, 동시에 저작자의 권리도 지킬 수 있는 중간점을 잘 찾아야 겠습니다.

    산업부 이근형 기자였습니다.
    "토종AI 인데 미국 데이터로 배워"

    ADVERTISEMENT

    1. 1

      [포토] 하나은행, 군 장병과 새해 첫 출발

      나라사랑카드 3기 사업자로 선정된 하나은행이 1일 경기 파주에 있는 육군 1사단 도라전망대에서 군 장병들과 새해 일출을 함께 보는 행사를 열었다. 이호성 하나은행장(가운데)이 임직원 및 군 관계자들과 ‘하나’를 뜻하는 손가락 포즈를 취하고 있다.  하나은행 제공

    2. 2

      박정원 "인공지능 전환 가속"…정지선 "본원적 경쟁력 강화"

      박정원 두산그룹 회장(왼쪽)은 올해 경영 화두로 ‘인공지능 전환(AX)’을 제시했다. 정지선 현대백화점그룹 회장(오른쪽)은 ‘지속 성장’의 토대를 마련하는 데 올해 경영 역량을 쏟아붓겠다고 강조했다.박 회장은 1일 발표한 신년사에서 “인공지능(AI) 경쟁력을 갖춘 기업과 그렇지 못한 기업은 머지않아 완전히 다른 선상에 있게 될 것”이라며 “빠른 AX 추진을 통해 기존 제품의 지능화와 새로운 비즈니스 모델 창출, 포트폴리오 확장을 도모하자”고 당부했다.그는 올해 경영 환경에 대해 “통상 갈등, 무역 장벽, 지정학적 분쟁 등 불확실성이 여전하지만 시대를 관통하는 확실한 성공 방정식은 ‘준비된 자에게 기회가 온다’는 사실”이라고 강조했다. 글로벌 시장에서 기술력을 인정받은 전자소재와 가스터빈 분야에서는 추가 고객 확보에 힘쓰고, AI 시대를 맞아 신규 에너지원으로 주목받고 있는 대형 원자력발전과 소형모듈원전(SMR), 수소연료전지 분야에선 새로운 기회를 찾자고 했다.박 회장은 앞으로 ‘피지컬 AI’ 시대가 본격화할 것이라고 전망하면서 “두산은 발전 기자재, 건설기계, 로봇에서 세계적 수준의 제조 역량과 하드웨어 데이터를 보유한 만큼 피지컬 AI 시대를 선도할 수 있다”고 진단했다. 그러면서 “두산이 쌓은 130년 전통에 스타트업과 같은 도전정신을 더해 새로운 시대의 성공 스토리를 만들자”고 주문했다.정 회장은 이날 신년 메시지에서 ‘본원적 경쟁력’ 확보를 강조했다. 본원적 경쟁력은 현대백화점그룹이 반세기 넘게 지켜온 ‘고객을 향한 정직한 마음’ ‘실패를 두려워하지 않는 열정&rsqu

    3. 3

      HD건설기계 공식 출범…"2030년 매출 15조원 달성"

      국내 최대 건설기계 업체인 HD건설기계가 1일 출범했다. HD현대건설기계와 HD현대인프라코어의 합병을 통해 탄생한 HD건설기계는 2030년 매출 14조8000억원을 달성한다는 목표를 세웠다.정기선 HD현대 회장은 1일 울산 HD건설기계 캠퍼스에서 열린 HD건설기계 출범식에서 “최고를 향한 HD건설기계의 열정이 신모델과 신흥 시장 개척으로 옮겨지기를 응원한다”며 “생산과 품질, 영업에 이르는 전 영역을 재정비해 조선에 이은 ‘글로벌 넘버원’으로 키울 것”이라고 말했다.HD현대그룹은 건설기계 부문을 강화하기 위해 지난해 HD현대건설기계와 HD현대인프라코어 합병을 결의했고, 최근 합병 절차를 마무리했다. HD건설기계는 울산, 인천, 전북 군산 등 국내 거점은 물론 인도 중국 브라질 노르웨이 등 여러 해외 생산망도 보유하고 있다. 연매출은 8조원에 달한다. HD건설기계는 건설장비와 엔진, 애프터마켓 등 주요 사업의 경쟁력을 끌어올려 2030년까지 매출을 14조8000억원 규모로 끌어올린다는 목표를 세웠다.HD건설기계는 기존 HD현대건설기계의 ‘현대(HYUNDAI)’와 HD현대인프라코어의 ‘디벨론(DEVELON)’ 등 두 브랜드를 통합하지 않고 각각 키워나가기로 했다. 각 브랜드의 개성을 유지하되 중복 라인업을 정리하는 등 글로벌 생산체계를 효율적으로 재편하기로 했다. 구매와 물류 등 공통 비용도 절감한다. 차세대 신모델 출시에도 속도를 낸다. HD건설기계는 올 상반기 북미 시장에서 신모델을 내놓을 계획이다.성상훈 기자

    ADVERTISEMENT

    ADVERTISEMENT