사용자의 음성을 인식해 정보를 제공하는 ‘카카오 대화형 비서’.  /현대자동차  제공
사용자의 음성을 인식해 정보를 제공하는 ‘카카오 대화형 비서’. /현대자동차 제공
1952년 사람이 숫자를 음성으로 말하면 이를 컴퓨터가 인식하는 매우 초보적인 음성인식이 성공했다. 1960년에는 숫자가 아니라 단어 음성인식의 가능성이 열렸는데, 여기에는 ‘칼 건나 마이클 판트’ 교수의 역할이 컸다. 성대 주름 모양에 따라 억양과 강세가 다르다는 점에 착안해 이를 과학적으로 분석했다. 소리의 크기(에너지), 높이(주파수), 길이(지속 시간) 차이를 좁혀 인간 음성과 똑같은 운율을 만드는 연구였다. 하지만 인간의 음성을 사물이 인식한다는 것은 현실성이 떨어진다는 비판에 직면해 연구가 중단됐다.

목소리로 자동차와 소통하는 세상
그러다 음성인식을 다시 연구 대상으로 지목한 곳은 다름 아닌 미국 국방과학연구소다. 전쟁 무기의 음성 명령 작동 가능성을 타진해보자는 차원이었다. 1971년 시작된 음성인식 부활 프로젝트는 컴퓨터가 최소 1000개의 단어를 인식하는 수준으로 정했는데 카네기멜론대가 개발한 음성인식 시스템 ‘하피’는 단어 1011개를 인식했다. 이어 1980년 중반 이후 컴퓨터의 처리 능력이 해마다 두 배씩 빨라지고 처리 용량도 늘어나면서 음성 처리 능력의 한계가 사라지자 음성인식 연구는 탄력을 받으며 1990년대 말 ARS와 같은 음성인식 기능이 이해하는 단어가 1만 개까지 늘었다.

그리고 예외 없이 음성인식은 자동차로 넘어왔다. 특히 자동차는 음성 명령이 오히려 안전에 도움이 된다는 점에서 적극 반겼다. 포드는 이미 2007년 음성인식 기능인 ‘싱크’를 자동차에 적용해 라디오와 전화, 내비게이션 등의 기능을 사용할 수 있도록 했고, 이 외 크라이슬러 유커넥트, 제너럴모터스(GM) 마이링크를 포함해 아우디와 BMW, 메르세데스 등도 음성인식 기능 영역을 넓혀가고 있다. 음성으로 내비게이션, 음악 재생, 운전 중 휴대폰 문자 읽어주기 등은 기본이며, 인공지능을 결합해 시동을 켜고 끄거나 경적을 울리는 것까지 도달해 있다. 덕분에 음성인식 기업인 미국의 뉘앙스는 아우디, BMW, 재규어랜드로버, 벤츠, 오펠, 포드, 토요타, 푸조 등에 이르기까지 글로벌 자동차 시장의 음성인식 강자로 군림하고 있다.

물론 음성인식 분야는 한국도 글로벌에서 어깨를 견주는 수준이다. 현대모비스가 150만 개의 단어 인식이 가능한 내비게이션을 선보였고 최근에는 현대차가 쏘나타에 음성을 인식해 비서 기능까지 할 수 있는 ‘카카오i’를 선보였다. 뉴스 브리핑, 날씨, 영화 및 TV 등을 운전자가 음성으로 물어보면 관련 정보를 음성으로 대답해주는 기능이다.

음성인식 기능은 운전의 집중도를 높이는 차원인 만큼 앞으로 발전 가능성이 상당하다. 단순한 명령 외에 감정적 대화가 가능한 수준으로 진화할 때까지 말이다. 나아가 사람의 마음까지 읽어 스스로 기능을 작동시키는 수준에 도달하는 것은 시간문제다. 하지만 2014년 리서치기업인 닐슨과 SBD가 미국 내 소비자 1만4000명에게 첨단 기능 중 불편한 항목을 물었더니 응답자의 43%가 음성인식 기능이라고 답했다. 현실과 동떨어지거나 인식률 저하에 따른 불편함만 더한다는 의미다. 따라서 최근 8세대 쏘나타에 적용된 음성인식은 완벽성이 관건이다. 아직 검증되지 않았지만 기대보다 정확성이 떨어진다면 비판은 감수해야 한다. 그럼에도 음성인식의 진화는 오늘도 계속되지만 말이다.

권용주 오토타임즈 편집장 soo4195@autotimes.co.kr