[전문가 포럼] "꼼짝 마라, 여기 목소리 증거가 있다"
9·11 테러 발생 후에 테러 주동자인 오사마 빈 라덴이 미국을 위협하는 녹음테이프가 공개되고는 했다. 그 목소리가 빈 라덴의 목소리인지가 큰 관심사였다. 그때마다 미국 관계당국은 실제 빈 라덴 목소리와 일치한다고 발표했다. 심지어는 목소리가 지쳐 보이고 실내에서 녹음한 흔적인 울림(echo)은 과거 야외에서 정열적으로 외쳤던 것과 대조된다고 지적하기도 했다. 인터넷에 공개된 음질이 좋지도 않은 녹음테이프의 음성을 듣고 그것이 빈 라덴 목소리인지, 실내에서 녹음한 것인지 실외에서 녹음한 것인지, 목소리가 지쳐 보이는지 정열적으로 보이는지 어떻게 구분할 수 있었을까.

음성분석은 사람마다 발성 및 발음 특징이 서로 다른 점을 이용해 녹음테이프, 디지털 파일, 동영상 등 각종 녹음자료에 녹음된 음성 및 음향신호를 음성학, 언어학, 전자공학 기법 등을 동원해 과학적으로 분석하는 것을 말한다.

빈 라덴의 목소리로 의심되는 녹음테이프가 등장하면 그 전에 확보한 빈 라덴의 목소리와 비교해 동일인인지 검증하는 것이다. 이 동일인 검증은 두 자료에 같은 단어가 있는 경우에는 그 성문(聲紋·spectrogram) 대조를 통해 확실하게 구분할 수 있다. 같은 단어가 없어도 언어습관, 음향 등을 통해 거의 확실하게 구분할 수 있다. 콜롬비아 마약왕 후안 카를로스 라미레스 아바디아 사건에서는 관계당국의 추적을 따돌리기 위해 여러 차례 성형수술을 하고 여러 개의 가명을 사용했지만, 음성분석을 통해 그의 목소리가 콜롬비아 당국이 과거에 녹음한 음성과 일치한다는 사실을 밝혀내 검거한 사례도 있다.

녹음파일이 증거로 제출되면 편집 여부를 다투는 경우가 많다. 디지털 자료는 발달한 기술로 인해 위조변조가 용이하기 때문이다. 이런 경우 녹음파일을 재생해 보면 그 중간에 부자연스러운 끊김이 수차례 나타나는데, 음성신호 파형, 성문, 주변 잡음 등을 분석해 녹음기를 조작한 흔적을 밝혀낼 수 있다. 최근 대출 과정에서 상담받는 목소리가 자신의 것인지를 다툰 경우가 있었다. 이 경우에도 대출상담 녹음파일과 본인의 음성을 비교해 이를 명확히 하기도 했다.

대검찰청은 ‘한국인 표준음성 데이터베이스(DB)’ 구축을 추진하고 있다. 한국인의 음성을 성, 연령, 지역 등 인구통계학적 균형을 갖춰 대규모로 수집하는 것으로, 국내에서 처음 시도하고 있다. 폭발물 설치 협박, 보이스피싱 범죄 등 음성이 유일한 단서인 경우 수집된 DB를 이용해 용의자의 신원을 신속히 파악할 수 있다. 또 국어학, 방언학 등의 기초 연구와 음성인식, 화자인식 기술 개발에 이 DB를 활용한다면 관련 학문의 발전에 큰 도움이 될 것이다.

최근 해외에서는 말하는 사람이 어떤 언어로 말하는지(언어 식별), 어느 지역 방언을 말하는지(방언 식별), 영어를 말하는 외국인의 모국어가 어떤 언어인지 식별하는 기술(모국어 식별) 등도 개발 중이다. 이런 기술을 개발하기 위해서는 ‘한국인 표준음성 DB’와 같은 대용량 음성 DB 구축이 필수적이다. 이 기술이 상용화되면 앞으로 시급을 다투는 긴급 사건에서 용의자의 신원을 빠르고 정확하게 추정할 수 있을 것이다.

영화에서나 본 지문, 홍채, 목소리 등 바이오 정보를 이용한 보안인증 방식이 금융권을 중심으로 빠르게 도입, 적용되고 있다. 이 가운데 목소리로 본인임을 확인하는 화자인증 기술은 미국 등에서 널리 사용 중이며, 조만간 국내 금융권에서도 적용할 것이다. 화자인식 기술은 스마트홈 환경에서도 활용할 수 있다. 음성을 등록한 가족만이 집안의 다양한 기기를 제어할 수 있도록 하기 위해서다.

이런 음성분석은 성능이 우수한 장비를 갖추는 것도 필요하지만 분석관의 다양한 분석 경험이 매우 중요하다. 대검찰청 음성분석실에는 분석 경력이 15년 넘은 베테랑 김경화 분석관이 활동하고 있다. 주요 사건 음성파일 분석을 거의 도맡다시피 하고 있다. 대한민국 과학수사의 힘은 결국 이런 전문인력의 실력과 헌신에서 나온다고 하겠다.

김영대 < 대검찰청 과학수사부장 >