해외서 식당 메뉴판 비추면 한글이…국민 번역서비스 '파파고'
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
히트 & 히트
6년 연속 번역 서비스 1위 유지
글로벌 월간 이용자 1500만 넘어
문서·음성·이미지 등 다양한 번역
英·日·중국어 등 15개 언어 지원
QE모델 개발…문서 품질 높여
WMT 문서 품질평가 부문 1위
PDF 문서도 지원 … 학생에 유용
외국산보다 한국어 데이터 우수
6년 연속 번역 서비스 1위 유지
글로벌 월간 이용자 1500만 넘어
문서·음성·이미지 등 다양한 번역
英·日·중국어 등 15개 언어 지원
QE모델 개발…문서 품질 높여
WMT 문서 품질평가 부문 1위
PDF 문서도 지원 … 학생에 유용
외국산보다 한국어 데이터 우수
파파고는 네이버가 2016년 첫선을 보인 인공신경망 기계 번역 서비스다. 서비스 명인 파파고(Papago)는 에스페란토 언어로 앵무새를 뜻한다. 앵무새처럼 사람이 한 말을 따라 하고 이를 번역해주겠다는 의미를 담았다.
글로벌 월간 활성화 이용자 수(MAU)가 1500만을 넘었고 한국에선 6년 연속 1위 번역 서비스 자리를 유지하고 있다. 파파고의 AI 번역 기술은 파파고 서비스 외 네이버 앱, 웹브라우저 웨일, 메신저 라인 등 네이버의 다양한 서비스에 활용되고 있다.
가장 많은 업그레이드가 이뤄진 부분은 이미지 번역이다. 2020년 10월 추가된 이미지 바로번역은 이미지 속 텍스트를 바로 바꿔주는 기능이다. 파파고 앱에서 번역을 원하는 이미지를 촬영하면 이미지 속 상황에 알맞은 번역문을 이미지 위에서 바로 확인할 수 있다.
복잡한 배경, 조명 반사, 그림자 왜곡이 심한 메뉴판 등도 정확하게 번역해준다. 텍스트의 위치, 색깔이나 크기에 따른 텍스트의 중요도 등 이미지의 정보를 그대로 유지한 번역 결과를 확인할 수 있다.
작년 6월에는 AR 바로 번역을 내놨다. 기존 이미지 번역에서 한층 업그레이드해 카메라에 비치는 영상을 인식해 실시간으로 번역하는 게 특징이다. 매번 촬영 버튼을 누르지 않고도 빠르게 번역이 가능하고 화면을 움직여도 번역된 화면을 그대로 볼 수 있다.
작년 11월부터 학습카메라에서 PDF 문서 번역을 지원한 데 이어 지난 4월부터는 이미지 번역에서도 PDF 문서를 번역할 수 있게 됐다. 파파고 앱 이미지 번역 화면에서 PDF 파일을 불러온 뒤 페이지를 선택하면 번역이 진행된다. 논문을 많이 읽는 대학생 등에게 유용하게 활용되고 있다는 설명이다.
파파고 이미지 번역에는 인페이팅, 텍스트 렌더링 등 네이버가 개발한 원천 기술이 적용됐다. HTS(Hierarchical Text Structuring)는 이미지 내 인식된 문자의 디자인과 문장 구조를 분석해 번역에 적합한 문장을 찾는 딥러닝 모델이다. 인페인팅(Inpainting)은 번역 결과를 자연스럽게 합성하기 위해 원본 텍스트가 제거된 배경 이미지를 만드는 기술이다. 인페인팅으로 텍스트가 제거된 배경 이미지에 다시 번역된 텍스트를 합성하는 텍스트 렌더링 기술도 차별화 포인트다.
파파고는 QE 모델을 고도화하기 위해 인공 학습 데이터를 활용해 부족한 학습 데이터를 보강하고, 학습 데이터가 부족한 환경에 특화된 QE 학습 방법론을 만들었다. 기계번역 분야의 세계적 학회인 WMT의 품질 평가에 참여해 ‘문서 단위 품질 평가’ 부문에서 1위를 차지하기도 했다.
번역 서비스는 빅테크 기업의 경쟁이 치열한 분야다. 구글과 딥엘 등이 한국어 서비스를 제공 중이다. 네이버는 외국 기업 대비 풍부한 한국어 데이터를 강점으로 내세우고 있다. 번역 결과를 존댓말·반말로 전환하는 기능처럼 한국어 특화 서비스도 차별점이다. 네이버 관계자는 “파파고는 새로운 서비스를 꾸준히 내놓고 있다”며 “이용자들이 다양한 목적으로 파파고를 활용할 수 있도록 서비스를 고도화할 계획”이라고 설명했다.
이승우 기자 leeswoo@hankyung.com
글로벌 월간 활성화 이용자 수(MAU)가 1500만을 넘었고 한국에선 6년 연속 1위 번역 서비스 자리를 유지하고 있다. 파파고의 AI 번역 기술은 파파고 서비스 외 네이버 앱, 웹브라우저 웨일, 메신저 라인 등 네이버의 다양한 서비스에 활용되고 있다.
○카메라에 비친 영상 바로 번역
파파고는 웹사이트와 앱을 통해 이용할 수 있다. 웹에서는 기본적인 번역 기능과 웹사이트 번역, 문서 번역 등의 기능을 이용할 수 있다. 반면 앱에서는 텍스트 번역, 음성 번역, 이미지·문서 번역, 증강현실(AR) 기반의 실시간 번역, 웹사이트 번역, 파파고 에듀(학습 카메라, 단어장), 오프라인 번역 등이 제공된다. 처음 출시될 때만 해도 기본적인 번역 기능만 쓸 수 있었지만, 기능이 꾸준히 추가됐다. 지원하는 언어도 한국어, 영어, 일본어, 중국어 등 4개에서 현재는 15개까지 늘었다.가장 많은 업그레이드가 이뤄진 부분은 이미지 번역이다. 2020년 10월 추가된 이미지 바로번역은 이미지 속 텍스트를 바로 바꿔주는 기능이다. 파파고 앱에서 번역을 원하는 이미지를 촬영하면 이미지 속 상황에 알맞은 번역문을 이미지 위에서 바로 확인할 수 있다.
복잡한 배경, 조명 반사, 그림자 왜곡이 심한 메뉴판 등도 정확하게 번역해준다. 텍스트의 위치, 색깔이나 크기에 따른 텍스트의 중요도 등 이미지의 정보를 그대로 유지한 번역 결과를 확인할 수 있다.
작년 6월에는 AR 바로 번역을 내놨다. 기존 이미지 번역에서 한층 업그레이드해 카메라에 비치는 영상을 인식해 실시간으로 번역하는 게 특징이다. 매번 촬영 버튼을 누르지 않고도 빠르게 번역이 가능하고 화면을 움직여도 번역된 화면을 그대로 볼 수 있다.
작년 11월부터 학습카메라에서 PDF 문서 번역을 지원한 데 이어 지난 4월부터는 이미지 번역에서도 PDF 문서를 번역할 수 있게 됐다. 파파고 앱 이미지 번역 화면에서 PDF 파일을 불러온 뒤 페이지를 선택하면 번역이 진행된다. 논문을 많이 읽는 대학생 등에게 유용하게 활용되고 있다는 설명이다.
파파고 이미지 번역에는 인페이팅, 텍스트 렌더링 등 네이버가 개발한 원천 기술이 적용됐다. HTS(Hierarchical Text Structuring)는 이미지 내 인식된 문자의 디자인과 문장 구조를 분석해 번역에 적합한 문장을 찾는 딥러닝 모델이다. 인페인팅(Inpainting)은 번역 결과를 자연스럽게 합성하기 위해 원본 텍스트가 제거된 배경 이미지를 만드는 기술이다. 인페인팅으로 텍스트가 제거된 배경 이미지에 다시 번역된 텍스트를 합성하는 텍스트 렌더링 기술도 차별화 포인트다.
○“새 기능 추가해 외산 서비스와 차별화”
파파고는 번역의 품질을 높이기 위해 품질 평가(Quality Estimation, QE) 모델을 개발했다. 번역 품질을 개선하는 과정에서 가장 중요한 것은 기존 모델과 새로운 모델의 품질을 빠르고 정확하게 비교·평가하는 것이다. 파파고가 자체 개발한 QE 모델은 품질 평가 과정을 자동화해 번역 데이터를 빠르고 효율적으로 평가할 수 있다는 설명이다. 단순히 번역의 좋고 나쁨을 평가하는 데 그치지 않고 성별, 시제, 명사, 숫자, 환각(헐루시네이션) 등 구체적인 오류 유형까지 다방면으로 평가한다.파파고는 QE 모델을 고도화하기 위해 인공 학습 데이터를 활용해 부족한 학습 데이터를 보강하고, 학습 데이터가 부족한 환경에 특화된 QE 학습 방법론을 만들었다. 기계번역 분야의 세계적 학회인 WMT의 품질 평가에 참여해 ‘문서 단위 품질 평가’ 부문에서 1위를 차지하기도 했다.
번역 서비스는 빅테크 기업의 경쟁이 치열한 분야다. 구글과 딥엘 등이 한국어 서비스를 제공 중이다. 네이버는 외국 기업 대비 풍부한 한국어 데이터를 강점으로 내세우고 있다. 번역 결과를 존댓말·반말로 전환하는 기능처럼 한국어 특화 서비스도 차별점이다. 네이버 관계자는 “파파고는 새로운 서비스를 꾸준히 내놓고 있다”며 “이용자들이 다양한 목적으로 파파고를 활용할 수 있도록 서비스를 고도화할 계획”이라고 설명했다.
이승우 기자 leeswoo@hankyung.com