휴멜로, 감정 표현까지 척척 'AI 성우'
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
핫! 앱&테크
TTS 서비스 '프로소디' 출시
SM과 손잡고 오디오시장 조준
TTS 서비스 '프로소디' 출시
SM과 손잡고 오디오시장 조준

아침에 일어나면 아이돌 그룹 엑소(EXO)의 멤버 디오가 모닝콜을 건다. 생일에는 “지원아 생일 축하해”라는 인사말도 건넨다. 디오의 목소리를 쏙 빼닮은 음성이지만 사실 스타트업 휴멜로가 TTS(text to speech) 기술로 만들어 유튜브 채널에 공개한 기계음이다. 휴멜로의 인공지능(AI) 기술을 활용하면 이 같은 음성을 얼마든지 생성해낼 수 있다.
TTS 기술은 정보기술(IT) 각 분야로 쓰임새를 넓히고 있다. 오디오북, 지하철 안내방송, AI 음성 비서 등 활용처가 다양해졌다. 네이버는 ‘클로바더빙’을 서비스하고 있고, 카카오엔터프라이즈는 재난방송에서 스크립트를 읽어주는 AI 아나운서를 연내 선보인다.
휴멜로는 지난 4월 TTS 프로그램 ‘프로소디’(사진)를 내놓으며 서비스 경쟁에 뛰어들었다. 감정과 운율까지 자유자재로 조절할 수 있다는 게 다른 프로그램과 구별되는 장점이다. 기쁨, 차분함, 화남, 슬픔, 실망 등 여러 감정을 표현할 수 있다. 말하는 속도와 음높이를 원하는 대로 조절하는 것도 가능하다. 성우 녹음에 드는 비용의 20% 정도로 음성을 만들 수 있다고 설명했다.
특정 사람의 음성을 흉내 내려면 우선 그 사람의 목소리를 입력해야 한다. 휴멜로는 여기에 드는 시간을 줄이기 위해 기술 고도화에 힘을 쏟고 있다. 이자룡 휴멜로 대표는 “기존 TTS 서비스에서는 40분 이상 목소리를 넣어야 그 사람의 음색을 따라할 수 있었다”며 “몇 문장의 목소리를 입력하는 것만으로 음성을 재현하는 서비스를 조만간 선보일 것”이라고 말했다.
휴멜로는 SM엔터테인먼트 등 여러 연예기획사와 TTS 기술을 활용한 협력 방안을 논의하고 있다. 이 대표는 “국내 연예인이 영어 음성을 통해 해외 팬덤과 소통할 수 있도록 돕는 서비스 등을 구상하고 있다”고 말했다.
최한종 기자 onebell@hankyung.com