네이버 하이퍼클로바X, 한국어 성능 평가서 GPT-4 능가

입력2024.02.27 16:51 수정2024.02.27 16:51

네이버가 개발한 거대언어모델(LLM) '하이퍼클로바X'가 한국에 특화한 문제 해결 능력에서 오픈AI와 구글의 LLM 보다 우수한 성능을 보인 것으로 나타났다.

네이버클라우드는 '하이퍼클로바X'가 한국판 인공지능(AI) 성능 평가 체계 'KMMLU'서 오픈AI·구글의 생성형 AI 보다 높은 점수를 받았다고 27일 밝혔다.

KMMLU는 국내 대표 오픈소스 언어모델 연구팀인 '해례'가 이끄는 AI 성능 평가 지표 구축 프로젝트다. 인문학, 사회학, 과학·기술 등 45개 분야에서 전문가 수준의 지식을 묻는 3만 5030개의 질문으로 구성돼 있다. 평가 문항은 수학적 추론 능력과 같이 전세계 공통으로 적용 가능한 지식을 묻는 비중이 약 80%, 한반도 지리·국내법 등 한국 특화 문제 해결 능력을 평가하기 위한 비중이 20%로, AI의 보편적 능력과 로컬 지식을 고르게 측정해 한국 사용자에게 유용한 AI를 종합적으로 판단할 수 있다. 또한 KMMLU는 한국어 원본의 시험 문제들로 구성돼 국내외 AI의 한국어 이해 역량도 정확하게 평가할 수 있다.

KMMLU에 따르면 하이퍼클로바X는 오픈AI의 'GPT-3.5 터보'나 구글의 '제미나이-프로' 보다 높은 점수를 기록했다. 한국 특화 지식 기준으로는 오픈AI의 'GPT-4' 보다도 높은 점수를 기록해 교육·법률 등 로컬 정보의 중요성이 큰 산업 분야에서는 하이퍼클로바X의 강점이 드러났다.

네이버클라우드는 KMMLU를 통해 입증된 성능 경쟁력을 바탕으로 하이퍼클로바X를 보안과 성능을 모두 갖춘 '소버린 AI' 솔루션으로 발전시켜나가겠다는 계획이다. 소버린 AI는 국가의 데이터 주권과 규제 준수를 보장하기 위해 개발된 AI 기술을 의미한다.

성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 "자국어 중심 AI에 대한 전세계적 수요가 관찰되는 만큼 한국에서 확인한 소버린 AI의 경쟁력을 바탕으로 향후 글로벌 시장 진출에도 속도를 낼 것"이라고 밝혔다.

박해린기자 hlpark@wowtv.co.kr

관련 뉴스

1

"3억대 서울 아파트 기회인데…" 40대 직장인 멘붕 온 까닭 [돈 버는 법 아끼는 법]

Q. 자산 약 2억원을 보유한 46세 직장인이다. 현재 거주 중인 경기 하남 미사 공공임대주택의 조기 분양과 서울 고덕 강일 토지임대부주택 입주를 두고 고민이다. 미사는 입지가 좋고 즉시 매도가 가능하지만 대출 이자...
2

페라리 타던 손흥민, 1억짜리 車 운전 포착…미국 '들썩'

"마케팅의 반은 타이거 우즈가 하고, 반은 손흥민이 하네요." 지난 24일 미국 프로축구 메이저리그사커(MLS) LAFC에서 뛰고 있는 손흥민이 미국 현지에서 제네시스 GV80 쿠페를 직접 운전하는 모습이 화제가 되...
3

伊 리빙 브랜드 ‘스테판플라스트’, 국내 코스트코에 헬피카트 출시

이탈리아 프리미엄 리빙 브랜드 스테판플라스트는 가든 전용 멀티 카트 ‘헬피카트(Helpy Cart)’를 국내 코스트코 매장에 공식 출시했다고 28일 밝혔다.스테판플라스트는 50여 년간&...