네이버가 국내 최초로 일명 ‘초(超)대규모 인공지능(AI)’인 ‘하이퍼클로바’를 25일 공개했다. 세계에서 가장 많은 한국어 데이터를 학습한 AI다.

네이버는 이날 ‘네이버 AI 나우’ 콘퍼런스에서 신규 AI인 하이퍼클로바와 향후 활용 방안을 소개했다. AI 모델의 크기와 성능을 보여주는 매개 변수(파라미터)가 하이퍼클로바는 2040억 개다. 일론 머스크가 설립한 AI연구소 오픈AI의 ‘GPT-3(1750억 개)’를 넘어서는 수준이다. 하이퍼클로바는 GPT-3보다 한국어 데이터를 6500배 이상 학습했다는 것이 네이버 측 설명이다. 학습 데이터 중 한국어 비중이 97%에 달해 세계에서 가장 큰 한국어 거대 언어모델을 구축했다. 역대 최고의 자연어 처리 기반 AI로 평가받는 오픈AI의 GPT-3 API(프로그램 언어 형식)를 분석해보면 97%가 영어다. 한국어는 0.01%에 불과하다. 애초에 글로벌 인터넷상 한국어 데이터가 0.6%밖에 되지 않기 때문이다.

앞서 네이버는 AI 성능 향상과 대용량 데이터 처리를 위해 지난해 10월 국내 기업 최초로 700페타플롭(1페타플롭은 초당 1000조 회 연산 처리가 가능한 수준) 성능의 슈퍼컴퓨터를 도입했다. 작년 1년 동안 글로벌 AI 학회에서 국내 기업 중 가장 많은 43개의 정규 논문을 발표하기도 했다. 정석근 네이버 클로바 CIC(사내 독립기업·company in company) 대표는 “글로벌 정보기술(IT) 대기업들이 대형 AI 모델이 가져올 파괴적 혁신에 대한 기대로 투자를 확대하고 있다”며 “한국의 AI 기술이 글로벌 플랫폼에 종속되지 않기 위해서는 이미 공개된 기술을 따라잡는 수준에 그칠 수 없다고 판단했다”고 설명했다.

네이버는 포털 네이버의 검색에 하이퍼클로바를 이미 적용했다. 사용자가 검색어를 잘못 입력하면 올바른 단어로 전환해주거나 적절한 검색어를 추천해주는 기능을 지난 6일 추가했다. 네이버는 소상공인이 이용하는 쇼핑몰인 스마트스토어 등에도 AI 활용을 확대할 예정이다.

김주완 기자 kjwan@hankyung.com