음성인식은 AI 자동차를 구현하는 핵심 기술이다. 사용자가 운전 중에도 비교적 자유롭게 사물인터넷(IoT)과 연결할 수 있는 효과적 방법이기 때문이다.
차량용 음성인식 기술은 아마존의 알렉사 등과 연동해 주소 검색, 음악 청취, 온라인 쇼핑리스트 관리 등 다양한 기능을 선보이는 수준에 이르렀다. 현대·기아자동차도 남양연구소에 ‘차량 IT 지능화리서치랩’을 설치해 음성인식 기술을 연구 중이다. 인공지능을 활용한 대화형 음성인식 비서 서비스, 인포테인먼트 시스템과 각종 편의장치도 개발 중이다. 최근 출시한 제네시스 G70은 국내 최초로 서버형 음성인식 기능을 적용했다. 카카오와의 협업으로 개발한 인공지능 플랫폼 ‘카카오 I(아이)’를 활용한 서비스다.
현대모비스도 멀티미디어 부품에 음성 검색과 제어 기능을 적용 중이다. 소음 제거, 구간 인식 능력 확대 등 음성인식률을 높이는 데 핵심적인 전(前)처리 기술 개발에 주력하고 있다.
음성인식의 원리는 말소리를 주파수 패턴으로 분석, 보정해 기호화하는 것이다. 성대 등 신체 기관에서 나오는 소리는 고유의 기본 주파수를 지닌다. 이런 소리는 코와 입을 통과해 입술 끝을 거치며 공명 주파수로 출력된다. 인체와 공기의 마찰음이 말소리로 바뀌는 과정이다.
공명 주파수는 100, 200, 300㎐ 등 다양한 단순파의 합으로 이뤄진다. 여러 단순파의 진폭과 주파수 데이터에 시간에 따른 변화 추이를 더하면 3차원 그래프를 만들 수 있는데, 이를 스펙트로그램이라 한다.
각각의 모음과 자음은 특정한 형태의 스펙트로그램을 나타낸다. 마이크가 수신한 음성 신호를 증폭해 디지털 데이터로 전환하면 중앙처리장치(CPU)가 스펙트로그램의 패턴을 분석해 문자로 해석해낸다. 현대·기아차는 한국어와 영어, 캐나다식 프랑스어, 멕시코식 스페인어 그리고 유럽 15개국 언어의 음성인식 기술을 갖췄다.
음성인식은 온도 습도 등 음파에 영향을 미치는 날씨 상태도 감안해야 한다. 자동차용 음성인식 기술은 차량의 주행 잡음도 걸러내야 한다. 현대모비스 관계자는 “자동차의 노이즈는 노면 상태, 조수석 노이즈, 울림뿐 아니라 지붕을 때리는 빗소리와 천둥, 우박, 바람 등 수백 가지가 있다”며 “음성인식은 해석의 정밀도를 높이는 싸움”이라고 설명했다.
완성차업계가 주목하는 분야는 ‘자연어 처리 기술’이다.
예를 들어 운전자가 “배가 고프네”라는 말을 했을 때 자연어 처리 기술은 사용자의 평소 행동 패턴 등을 분석, 의도를 파악해 가까운 맛집을 검색해주는 방식이다.
현대모비스 기술연구소