정영훈 엑스엘에이트 대표 "구어체 학습한 AI번역기로 K드라마 장벽 낮췄죠"
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
삼성·구글 거쳐 스타트업 창업
넷플릭스 등 OTT 초벌 번역
대화 맥락·말투까지 고려 강점
화상회의 실시간 통역 앱 공개
넷플릭스 등 OTT 초벌 번역
대화 맥락·말투까지 고려 강점
화상회의 실시간 통역 앱 공개
“그래서 말인데 동은아, 고데기 열 체크 좀 해줄래?”
넷플릭스 시리즈 ‘더 글로리’ 속 이 대사는 영어 문장으로 어떻게 번역될까. 표준어가 아닌 ‘고데기’라는 표현은 ‘컬링 아이언(curling iron)’으로 의역됐다. 이 번역은 인공지능(AI)이 만든 작품이다. 기계 번역 스타트업 엑스엘에이트(XL8)가 내놓은 미디어 콘텐츠 특화 번역 자동화 도구 ‘미디어캣’을 통해 구현된 문장이다.
AI가 드라마의 대사를 학습하면서 전체 이야기의 맥락과 등장인물의 말투, 표정까지 배우며 가능해진 일이다. 단순히 글자나 음성만으로 번역하는 데서 한발 더 나아간 셈이다. 정영훈 엑스엘에이트 대표(사진)는 12일 한경 긱스와 만나 “언어의 장벽을 완전히 넘어서는 시대를 열 것”이라고 말했다.
미국 실리콘밸리에 본사를 둔 엑스엘에이트는 구어체에 특화된 번역 기술을 갖고 있다. 넷플릭스나 디즈니+ 등 온라인동영상서비스(OTT) 콘텐츠에 들어가는 자막의 ‘초벌 번역’ 작업을 담당한다. 이를 아이유노 같은 대형 현지화 서비스 업체(LSP)에 공급한다. 정 대표는 “LSP도 우리 기술이 없으면 3만6000시간(모든 콘텐츠 상영 시간 기준)에 달하는 넷플릭스 콘텐츠의 자막을 달기엔 벅찰 것”이라고 했다.
이 회사가 갖춘 경쟁력은 문맥 파악 기술에 있다. 단순히 문장만 보는 게 아니라 앞뒤 상황의 맥락을 고려해 번역하는 기술이다. 생략과 중의적인 표현이 빈번하게 일어나는 구어체를 번역하는 데 중요한 기술이다. 정 대표는 “지난해 하반기 이 기술을 처음 적용했더니 75% 수준이던 번역의 정확도가 90% 이상으로 올라갔다”고 설명했다.
대사들 외에 목소리, 몸의 움직임, 성별과 나이 등 비언어적 요소를 함께 파악하는 ‘멀티 모달리티’ 기술도 회사의 자랑거리다. 예를 들어 화자가 20대 여성이라면 그에 맞는 발화 습관을 AI가 학습해 조금 더 자연스럽게 번역하는 식이다.
삼성전자와 구글 엔지니어 출신인 정 대표는 회사의 발전 지향점으로 통역의 혁신을 꼽았다. 지난해 스포츠 중계나 유튜브 라이브 방송 등에서 사용할 수 있는 통역 솔루션 ‘이벤트캣’을 내놨다. AI가 방송 음성을 인식해 자막을 입혀주는 방식이다. 최근엔 이 기술을 화상 회의 ‘줌’에 적용한 통역 앱을 선보였다.
다양한 국적의 사람들이 모인 회의에서 서로 자신의 언어로 화상 회의를 할 수 있다. 정 대표는 “바이어나 투자자 미팅뿐만 아니라 국적이 다른 친구들끼리의 랜선 모임에도 필수적으로 쓰이는 앱이 될 것”이라고 말했다.
김종우 기자 jongwoo@hankyung.com
넷플릭스 시리즈 ‘더 글로리’ 속 이 대사는 영어 문장으로 어떻게 번역될까. 표준어가 아닌 ‘고데기’라는 표현은 ‘컬링 아이언(curling iron)’으로 의역됐다. 이 번역은 인공지능(AI)이 만든 작품이다. 기계 번역 스타트업 엑스엘에이트(XL8)가 내놓은 미디어 콘텐츠 특화 번역 자동화 도구 ‘미디어캣’을 통해 구현된 문장이다.
AI가 드라마의 대사를 학습하면서 전체 이야기의 맥락과 등장인물의 말투, 표정까지 배우며 가능해진 일이다. 단순히 글자나 음성만으로 번역하는 데서 한발 더 나아간 셈이다. 정영훈 엑스엘에이트 대표(사진)는 12일 한경 긱스와 만나 “언어의 장벽을 완전히 넘어서는 시대를 열 것”이라고 말했다.
미국 실리콘밸리에 본사를 둔 엑스엘에이트는 구어체에 특화된 번역 기술을 갖고 있다. 넷플릭스나 디즈니+ 등 온라인동영상서비스(OTT) 콘텐츠에 들어가는 자막의 ‘초벌 번역’ 작업을 담당한다. 이를 아이유노 같은 대형 현지화 서비스 업체(LSP)에 공급한다. 정 대표는 “LSP도 우리 기술이 없으면 3만6000시간(모든 콘텐츠 상영 시간 기준)에 달하는 넷플릭스 콘텐츠의 자막을 달기엔 벅찰 것”이라고 했다.
이 회사가 갖춘 경쟁력은 문맥 파악 기술에 있다. 단순히 문장만 보는 게 아니라 앞뒤 상황의 맥락을 고려해 번역하는 기술이다. 생략과 중의적인 표현이 빈번하게 일어나는 구어체를 번역하는 데 중요한 기술이다. 정 대표는 “지난해 하반기 이 기술을 처음 적용했더니 75% 수준이던 번역의 정확도가 90% 이상으로 올라갔다”고 설명했다.
대사들 외에 목소리, 몸의 움직임, 성별과 나이 등 비언어적 요소를 함께 파악하는 ‘멀티 모달리티’ 기술도 회사의 자랑거리다. 예를 들어 화자가 20대 여성이라면 그에 맞는 발화 습관을 AI가 학습해 조금 더 자연스럽게 번역하는 식이다.
삼성전자와 구글 엔지니어 출신인 정 대표는 회사의 발전 지향점으로 통역의 혁신을 꼽았다. 지난해 스포츠 중계나 유튜브 라이브 방송 등에서 사용할 수 있는 통역 솔루션 ‘이벤트캣’을 내놨다. AI가 방송 음성을 인식해 자막을 입혀주는 방식이다. 최근엔 이 기술을 화상 회의 ‘줌’에 적용한 통역 앱을 선보였다.
다양한 국적의 사람들이 모인 회의에서 서로 자신의 언어로 화상 회의를 할 수 있다. 정 대표는 “바이어나 투자자 미팅뿐만 아니라 국적이 다른 친구들끼리의 랜선 모임에도 필수적으로 쓰이는 앱이 될 것”이라고 말했다.
김종우 기자 jongwoo@hankyung.com