통화녹음 내용을 문자로 바꿔주는 앱 '비토' 아시나요
영업직 등 업무상 전화통화가 잦은 직군의 종사자들 중에는 통화 녹음 기능을 일상적으로 켜두는 사람이 많다. 중요한 논의 내용을 기록으로 남겨두고 필요할 때 확인하기 위해서다. 하지만 쌓여 있는 통화 녹음 가운데 원하는 내용을 다시 찾기란 쉽지 않다. 길게는 수십 분의 대화를 일일이 다시 들으며 확인해야 한다.

스타트업 리턴제로가 지난달 내놓은 앱 ‘비토’를 쓰면 이 같은 번거로움을 줄일 수 있다. 비토는 통화 녹음 내용을 문자로 변환해주는 서비스(사진)다. 대화창 인터페이스를 통해 상대방과 어떤 얘기를 나눴는지 한눈에 확인할 수 있다. 검색 기능으로 오래전의 통화 내용도 쉽게 찾을 수 있다. 대화창의 말풍선을 클릭하면 해당 부분의 통화 녹음을 들려주는 기능도 넣었다.

비토에는 리턴제로의 인공지능(AI) 기반 음성인식 기술이 적용됐다. 리턴제로는 비토 앱을 출시하기 전 2000시간 이상의 음성 데이터를 확보해 기계학습에 활용했다. 기존에 기계학습의 주된 재료로 쓰였던 오디오북, 앵커 멘트 등 정형화된 데이터 대신 일상 대화 기반의 음성을 확보해 통화 녹음 인식의 정확도를 높였다.

각 대화의 주체가 누구인지 음성만으로 인식하는 화자분리 기술도 리턴제로가 내세우는 강점이다. 통화 녹음 내용을 메신저의 대화창 형태로 보여주는 비토의 인터페이스를 구현하기 위해 꼭 필요한 기술 중 하나다.

비토는 출시 한 달 만에 1만5000회 이상의 다운로드 수를 기록했다. 리턴제로는 음성인식 기술력을 인정받아 지난달 말 베이스인베스트먼트, 카카오벤처스 등으로부터 25억원 규모의 투자(시리즈A)를 유치했다.

리턴제로의 음성인식 기술은 아직 완벽하지는 않다. 비토를 사용하는 과정에서 정확하게 문자로 옮겨진 대화도 있었지만, 전혀 다른 단어로 변환된 내용도 보였다. 리턴제로는 비토 앱을 서비스하면서 확보한 데이터로 정확도를 높인다는 방침이다.

최한종 기자 onebell@hankyung.com