[천자칼럼] 자동번역

입력2015.01.15 20:41 수정2015.01.16 14:41 지면A35

고두현 논설위원 kdh@hankyung.com

얼마 전에도 자동번역기 때문에 빵 터졌다. ‘겨울왕국’ 유튜브 자막에 뜬 문장은 “당신이 눈사람을 구축하고자 하십니까?”였다. 애들 대화 “Do you wanna build snowman(같이 눈사람 만들래)?”를 기계가 옮긴 결과다. 이 정도는 애교다. 육회가 ‘six times’로 둔갑하고, 생선 이름 방어는 ‘defense fish’, 곰탕은 ‘bear thang’으로 뒤바뀐다.

자동번역의 역사가 70년이나 됐는데도 이 모양이다. 미국 수학자 위버가 가능성을 제시한 것이 1947년이고, 조지타운대와 IBM이 러시아어의 영어 번역 기술을 개발한 게 1954년이다. 1980년대부터는 컴퓨터로 문장의 의미를 파악하는 ‘자연언어처리 기술’ 덕분에 비약적인 발전을 거듭했다.

문장의 의미를 알아내는 첫 단계는 형태소 분석이다. 문장을 기본 단위로 나누고 다시 조합하면서 단어를 찾는다. ‘엄마가’에서 명사 ‘엄마’와 조사 ‘가’를 구분하는 식이다. 안타까운 것은 우리말의 형태소 분석이 어렵다는 점이다. 존댓말 같은 어미 변화가 많고 조사의 종류도 많은 데다 띄어쓰기까지 헷갈린다. 동음이의어는 더 애매하다. 주어나 목적어를 생략하고 순서를 바꾸는 바람에 문맥으로 파악해야 하는 경우가 많다.

자동번역의 정확도는 두 언어가 얼마나 비슷한지에 따라 달라진다. 라틴 계통 언어끼리는 비교적 쉽다. 중국어도 영어와 어순이 같아 유리하다. 일본어 또한 한자 때문에 중국어와 넘나들기 수월하다. 우리말 번역은 이런 점에서도 가장 불리하다. 어순이 같은 일본어와도 아직 완전하지 않다. 한참 거리가 먼 알파벳 언어권과는 더 쉽지 않다.

이 밖에도 우리말 개념어가 부족한 탓이라는 지적이 있다. 본디 한자였던 어휘를 순한글로 쓰면서 기계가 의미를 파악하지 못하는 사례도 허다하다. 사용자 기반의 참여자가 늘어나야 하는데 이를 꺼리는 문제까지 겹쳤다. 대부분의 번역 솔루션은 사용자가 늘어날수록 성능이 좋아지도록 설계돼 있다.

구글이 곧 음성 대화를 문자로 실시간 번역해주는 앱을 내놓겠다고 한다. 원하는 언어로 즉석에서 번역해준다니 놀라운 기술이다. 지금까지는 문장 번역이 주였지만 음성 번역까지 가능하게 된 것이다. 마이크로소프트(MS)도 지난달 화상 채팅 통역을 선보였다. 가히 IT의 신기원이다. 뉴욕타임스는 “IT가 바벨탑을 다시 쌓기 위해 사력을 다하고 있다”고 했다. 그런데 한국어는 어떤가. 언제쯤 국제 미아 신세에서 벗어날 수 있을까.

고두현 논설위원 kdh@hankyung.com

관련 뉴스

1

[한경에세이] 그땐 맞고 지금은 틀리다면

정부는 중국 온라인 쇼핑 공습 대책으로 해외 직구 시 ‘KC인증 의무화’ 방안을 지난 16일 내놨다. 그러나 해외 직구 이용자와 정치권으로부터 반발이 거세자 이틀 만인 18일 발을 뺐다. 국민의 건강과 안전에 위해가 되는 해외 제품 반입을 막겠다는 선한 취지는 좋았다. 그렇더라도 해외 직구 이용자와 전문가의 의견을 충분히 들어 부작용에 대해 더 꼼꼼히 따져봤어야 했다.나흘 뒤 정부는 교통사고를 줄인다는 취지로 ‘65세 이상 고령자 조건부 운전면허’ 도입을 발표했다. 교통약자인 어르신과 고령 생계형 운전자로부터 비판이 거세자 하루 만인 21일 한 발 물러섰다. 교통사고를 줄이는 건 정부의 당연한 책무지만 과도한 이동권 제한, 고령 택시기사가 대다수인 현실, 고령 생계형 운전자들을 위협하는 부작용에 대해 고민하고 대책을 내놨어야 했다.시간에 쫓기듯 내놓은 설익은 정책 사례를 꺼낸 이유는 아무리 좋은 목적을 가진 선한 정책이라도 미처 생각하지 못한 부작용이 항상 있다는 걸 말하고 싶어서다. 이해관계자가 많고 파급효과가 큰 정책일수록 부정적인 여파가 더 크게 마련이다. 중요한 정책일수록 시간을 두고 전문가 및 이해관계자와 소통하면서 예기치 않은 부작용에 대해 충분히 검토한 뒤 정책을 내놔야 하는 이유다. 해외 직구 KC인증 의무화 대책을 마련하면서 이용자와 전문가로부터 충분한 의견을 들었는지 궁금하다. 65세 이상 고령자 조건부 운전면허 대책을 마련하면서 65세 이상 고령자와 고령 택시기사, 고령 생계형 차량 운전자로부터 충분한 의견을 들었는지, 건강 수준 향상과 재정 부담을 고려해 고령 기준을 올리고자 하는 다른 정책과의 조화를 충분히
2

[시론] 국민연금 소득대체율, 개혁 논제 아니다

지난주 이재명 더불어민주당 대표가 국민연금 개혁안과 관련, 국민의힘 안(보험료율 13%, 소득대체율 44%로 인상)대로 개혁하자고 윤석열 대통령에게 전격 제안했다. 앞서 국회 연금특위 산하 공론화위원회는 보험료율을 13%로 올리고 소득대체율을 50%까지 상향하는 방안(1안)과 보험료율 12%, 소득대체율을 40%로 삼는 방안(2안)을 내놨다. 이후 국민의힘(보험료율 13%·소득대체율 44%)과 민주당(보험료율 13%·소득대체율 45%)이 서로 다른 안을 제시하며 대립하던 중 여당 안을 이 대표가 수용한 것이다.하지만 여야 모두 소득대체율을 현행(40%)보다 높이는 선택을 하면서 재정 불안을 부채질하고 있다. 심각한 재정 불안정을 해소하기 위한 ‘연금 개혁’ 본래의 목적은 찾기 힘들어졌다. 재정 안정을 목적으로 한 국회 개혁위원회에서의 ‘개혁’을 사실상 무산시키는 소득대체율 상향에 논의를 집중하는 것은 국회 논의가 하나 마나 하다는 걸 의미한다. 그동안의 모든 연금 개혁이 의회 합의가 아니라 집권당의 의지로 이뤄졌다는 것을 잊어서는 안 된다.국민연금 구조개혁이 소득대체율보다 우선돼야 하는 이유는 국민연금 도입 시점과 현재 상황이 너무 다르다는 데 있다. 첫째, 국민연금의 환경이 도입 시점과 비교해 크게 달라졌다. 국민 평균수명이 1988년 70세에서 2023년 83세로 상승했다. 평균 연금 수급 기간도 연금개시연령 65세 기준 5년에서 18년으로 늘어났다. 과거에는 중·고졸 학력으로 사회에 나서는 이가 적지 않았지만, 요즘엔 청년 대다수가 대학에 간다. 평균 30세가 넘을 정도로 취업 연령도 늦춰졌다. 국민연금이 도입된 시점의 가정에 비해 근로기간은 훨씬 짧아졌지만,
3

[천자칼럼] 보물선 인양

남아메리카와 북아메리카 사이의 카리브해는 과거 악명 높은 해적의 무대였지만 보물선의 바다이기도 하다. 그만큼 많은 난파선이 바닷속에 잠들어 있기 때문이다. 스페인 문화부는 2019년 자국에 소유권이 있다며 681척의 난파선 목록을 작성했다. 이 난파선들은 모두 1492년에서 1898년 사이에 아메리카 대륙 근처에서 침몰한 것들이다. 대부분 스페인 제국이 식민지인 중남미에서 수탈한 금과 은을 가득 실은 보물선이다. 스페인이 여전히 카리브해에서 눈을 떼지 못 하는 이유다.한국에도 보물선의 바다는 있다. 서해의 난파선에선 금·은 대신 청자·백자가 쏟아져 나왔다. 값어치로 따지면 귀금속 못지않은 보물들이다. 금과 관련된 보물선 얘기도 없지는 않았지만 대개 “금괴를 싣고 가다 침몰한 일본 배의 위치를 안다. 자금을 투자하면 일부를 주겠다”는 식의 사기극으로 끝났다. 2000년엔 보물선 소동이 증시를 흔들기도 했다. 러일전쟁 당시 울릉도 근해에 침몰한 러시아 순양함 돈스코이호 얘기다. 돈스코이에 150조원어치 금괴가 실려 있다는 주장은 아무런 근거가 없음에도 동아건설 주가는 침몰 위치 확인 소식만으로 17거래일 연속 상한가를 기록했다. 돈스코이는 2018년 가짜 암호화폐를 내세운 사기 사건에 다시 등장했다. 있을지 없을지 모를 바닷속 보물에 마음을 빼앗긴 사람들이 재산을 날리고 눈물을 흘렸다.콜롬비아가 300여 년간 카리브해에 잠들어 있던 ‘전설의 보물선’ 산호세호 인양에 나섰다. 1708년 콜롬비아 앞바다에서 영국 함선의 공격에 침몰한 산호세에는 금과 은, 에메랄드 등 200억달러(약 27조2700억원)어치 보물이 있는 것으로 추정된다. 미국의 인양 회사가