이참솔 리턴제로 대표가 10일 서울 강남구의 사무실에서 인공지능(AI) 음성인식 서비스 비토에 대해 설명하고 있다.  김영우  기자
이참솔 리턴제로 대표가 10일 서울 강남구의 사무실에서 인공지능(AI) 음성인식 서비스 비토에 대해 설명하고 있다. 김영우 기자
‘통화 내용을 문자로 확인할 수 있으면 얼마나 좋을까.’ 영업 등 통화 업무가 많은 직장인이라면 한 번쯤 떠올려 봤을 생각이다. 비대면 업무 증가 등으로 녹음한 통화를 다시 청취하며 글로 옮기거나 통화 중에 메모하는 번거로움이 늘고 있어서다. 음성인식 서비스 스타트업 리턴제로의 비토는 이런 수고를 덜어준다. 비토는 통화가 끝나면 거의 실시간으로 카카오톡처럼 통화 내용을 문자로 보여주는 앱이다.

이참솔 리턴제로 대표는 10일 “비토의 음성인식 누적 처리 시간은 210만 시간 이상”이라며 “깨끗하지 않은 음성 데이터의 인식 정확도는 자체 평가로 100점 만점에 80점 정도는 된다”고 설명했다. 여기서 깨끗하지 않은 음성 데이터는 보통의 통화 음질을 뜻한다. 아나운서나 오디오북의 음성처럼 일명 ‘클린 데이터’의 음성 인식 수준은 100점에 가깝다고 한다.

리턴제로는 이 대표, 정주영 최고기술책임자(CTO), 이현종 개발팀장 등 KAIST 동기 3명이 두 번째로 창업한 회사다. 앞서 이들은 2011년 다른 동료와 모바일 소셜커머스 서비스인 로티플을 설립했다. 로티플은 설립된 지 1년도 되지 않아 카카오에 매각됐다. 리턴제로의 창업 멤버들은 카카오에 합류해 카카오 초창기의 각종 서비스를 만들었다.

다시 창업에 나선 이 대표는 음성인식을 창업 아이템으로 정했다. 현실에서 가장 유용한 인공지능(AI) 서비스라는 생각에서다. 이 대표는 “리턴제로는 최신 연구 결과를 현실 세계에 빠르게 적용하는 데 집중하는 실용주의 노선의 AI 개발팀”이라고 설명했다.

리턴제로의 강점은 높은 음성인식 기술이라고 회사 측은 설명했다. 이 대표는 “업계에서 인정하는 제대로 된 음성인식 검증 및 적용 시간은 국내 최고 수준”이라고 설명했다. 그는 “음성인식이 AI에서 오래된 분야지만 관련 데이터 부족 등으로 소비자가 만족할 만한 서비스를 그동안 찾기 어려웠다”고 덧붙였다. 이어 “비토는 자연 발화(보통의 대화), 화자 분리 등에서 국내에서 가장 뛰어나다”고 강조했다. 비토는 메신저 형태의 말풍선 화면에서 통화 내용 확인뿐 아니라 필요한 부분 재생, 검색, 편집, 메모 기능도 제공한다.

리턴제로는 최근 추가 투자를 받았다. KTB네트워크, 에이티넘인베스트먼트, 하나벤처스 등이 160억원을 투자했다. 리턴제로의 누적 투자금액은 198억원이다. 리턴제로는 투자금을 기술 연구개발(R&D), 인재 영입, 서비스 확대, 글로벌 진출 등에 사용할 계획이다. 이 대표는 “최근 기업용 서비스에 대한 문의가 많아 관련 서비스도 내놓을 계획”이라고 말했다.

리턴제로의 목표는 AI의 한국어 음성인식을 세계 최고 수준으로 높이는 것이다. 한국어 음성인식은 영어와 중국어보다 기술 수준이 낮다. 그는 “인간의 각종 업무를 음성인식 기반 서비스에 그대로 맡길 수 있을 정도로 기술을 고도화할 것”이라며 “비토는 그 과정의 일부”라고 설명했다.

김주완 기자 kjwan@hankyung.com