기존 단순 추출 요약을 넘어 새로운 요약문 생성 등 정확도 높은 도약 모델 구축 예정

AI Hub에 요약 모델 및 학습용 데이터 오픈하여 누구나 활용 가능
인공지능 챗봇 및 빅데이터SW 전문기업 와이즈넛(대표 강용성)은 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 지원하는 2021년 인공지능 학습용 데이터 구축 사업에서 ‘요약 텍스트 데이터’ 과제의 주관기관으로 선정되었다고 9일 밝혔다.

와이즈넛은 유클리드소프트, 딥네츄럴, 포티투마루와 함께 컨소시엄을 구축해 텍스트 요약을 위한 인공지능 학습데이터 구축 사업을 진행한다. 총 사업비는 42억 5000만원 규모다.

이번 과제는 뉴스, 보도자료, 회의록과 방송 다큐멘터리, 드라마, 예능 방송 등 주요 내용을 간결하게 정리·요약하여, 양질의 학습데이터 확보 및 요약 모델 구축을 목표로 하고 있다.

와이즈넛은 지난 20여년간 자연어 이해 및 처리 기술을 자체 개발하며 보유해 온 한국어 기반 BART, T5 등 Transformer기반의 최신 사전학습 언어모델을 토대로 요약 모델을 개발할 예정이다.

최종적으로 구축된 학습데이터와 요약 모델은 모두 AI Hub를 통해 공개되며, 관련 분야 전문가 및 일반인 누구나 활용 가능하다.

한경닷컴 뉴스룸 open@hankyung.com

ⓒ 한경닷컴, 무단전재 및 재배포 금지