미국 구글은 자동번역의 대명사다. 출범할 때부터 번역 서비스를 제공해왔다. 구글은 2010년, 5년 이내에 모든 사이트 방문자들이 자신의 모국어로 검색이 가능하고, 심지어 외국인과 통화도 가능할 것이라고 호언장담했다. 하지만 아직 한국에서 구글 번역 서비스를 이용하는 사람은 극히 제한적이다. 제대로 된 번역을 제공하지 못해서다. 2004년 MIT(매사추세츠공대)가 발간하는 기술저널 ‘테크놀러지 리뷰’ 역시 범용번역기가 5년 이내에 상용화될 것이라고 내다봤지만 공수표로 돌아갔다.

반면 일본 경제기획청은 1994년 자동화번역시스템의 실용화 시기를 2020년 이후로 예측했다. 외국어를 공부하지 않아도 되는 날은 결코 오지 않을 것이라고 말하는 학자들도 있다. 그만큼 자동번역은 쉬운 듯하면서도 컴퓨터과학에서 가장 어려운 기술로 꼽힌다.

자동번역의 개념은 수학자들에 의해 탄생했다. 1947년 미국 수학자 워렌 위버가 특정 언어를 컴퓨터 알고리즘으로 처리하면 다른 나라의 언어로 바꿀 수 있을 것이라고 생각한 게 단초가 됐다. 그의 아이디어는 곧바로 실행에 옮겨져 1948년 천공카드를 이용한 자동번역이 시도됐다. 1954년 미국 조지타운대와 IBM이 공동으로 러시아어를 영어로 번역하는 기기를 내놨다. 이 기기는 문법 규칙 6개, 어휘 250개로 간단한 시스템이었다.

하지만 그 이후 발전속도는 더뎠다. 단어를 대체하고 문법에 맞게 재구성하는 기법으로는 한계가 있었다. 제대로 의미를 분석하고 내용을 소화하기위해선 다른 방법이 필요했다. 그래서 학자들이 생각한 것이 통계기반 기법이다. 통계 기법은 다른 두 언어로 쓰인 수많은 문장을 바탕으로 통계를 내 번역하는 기법이다. 통계정보에 따라 앞뒤 단어의 연결관계나 어순을 확률로 계산하면 실제에 가장 가까운 번역문을 만들 수 있게 된다. 지금 구글이 서비스하는 자동번역도 이런 범주다. 하지만 이것마저도 많은 오류가 생기고 있다. 특히 한·영 번역은 정확도가 매우 떨어진다.

지식경제부가 한국어와 영어 간 기본적인 의사소통이 가능한 스마트폰용 자동통역 애플리케이션 ‘지니톡’을 실용화했다 고 발표했다. 정확도가 80%를 웃돌아 구글의 자동통역 기술보다 앞섰다고 한다. 한국어 27만단어, 영어 6만6000단어를 인식해 기본적인 의사소통에 무리가 없다는 주장이다. 그렇다고 일상적 대화를 알아서 통역해주는 정도까지는 아닌 것 같다. 인간의 미묘한 감정을 담은 글까지 자동으로 통·번역할 수 있는 기계는 꿈일지도 모른다.

오춘호 논설위원 ohchoon@hankyung.com