네이버클라우드는 음성을 텍스트로 변환하는 기업용 '클로바 스피치(CLOVA Speech)'에 실시간 방송 속 화자의 음성을 추출해 바로 자막을 생성하는 '실시간 스트리밍' 기능을 출시했다고 2일 밝혔다.

AI 기반 STT(음성·텍스트 변환) 서비스인 클로바 스피치는 현재 네이버 뉴스의 자동 자막 생성 기능, 네이버 쇼핑라이브, 고객센터 통화 데이터 관리 등에 적용되고 있다.

신규 기능은 라이브 방송과 같은 실시간 스트리밍 영상에서 화자가 말하는 내용을 즉시 텍스트로 추출해주는 기술이다.

한국어, 중국어, 일본어 3개 국어를 지원하며 음성의 어절 단위로 텍스트가 형성된다.

실시간 스트리밍 기술을 활용하면 속기사의 별도 타이핑 작업 없이 실시간으로 생방송 자막을 송출할 수 있다.

고객센터에서도 통화 내용을 즉각 텍스트화해 모니터링함으로써 고객 대응이 빨라질 수 있다.

네이버클라우드는 실시간 스트리밍 출시에 맞춰 '음성인식&화자인식' 비용을 종전보다 40% 낮추고 단일 요금제 대신 음성인식, 화자인식, 이벤트 탐지 기능별로 요금을 세분화했다.

영어 발음의 정확도를 판단해주는 기능도 선택 옵션으로 추가됐다.

네이버클라우드, 실시간 스트리밍 출시…AI가 생방송 자막 생성
/연합뉴스