[데이터텔링] "눈치껏 잘"… 한국 '외국근로자' 현실 대화 1200개

데이터텔링 X 데이터정책제안
'자주 쓰는 외국어DB' 아시나요?
산업인력공단에 3가지 제안합니다

1. 분야별 : 일 > 기숙사 > 월급 > 보험 순
2. 고압적이거나 혹은 열악하거나
3. 육안에도 보이는 번역 오류들
4. DB '취지' 좋지만, '소통' 아쉬워
한국산업인력공단은 지난 2009년 '자주 쓰는 외국어 DB(데이터베이스)'를 구축했습니다.

한국어 1200문장을 아래 17개 언어로 번역했죠. 주로 한국에 돈 벌러오는 아시아권 근로자(혹은 외국인 노동자, 줄여 '외노자'라고도)들의 모국어입니다.
영어(English), 중국어(Chinese), 베트남어(Vietnamese), 태국어(Thai), 따갈로그어(Tagalog), 인도네시아어(Bahasa Indonesia), 몽골어(Mongolian), 스리랑카어(Sri Lanka), 러시아어(Russian), 우즈벡어( Uzbekistan), 키르키즈어(Kyrgyzstan), 방글라데시어(Bangla), 파키스탄어( Urdu), 캄보디아어(Cambodian), 동티모르어(Timor-Leste)

국내 사업주나 관리자가 공장 등에서 일하는 외국인 근로자와 이런저런 대화를 할 때 자주 쓰는 한국어 1200문장입니다. 한국 사업자의 편의를 위해 만들어졌죠. 바꿔 말하면 '외국인 근로자가 한국 고용주에게 자주 듣는 1200문장'입니다. #1. '자주 쓰는 외국어 DB' 탄생 배경

그럼 자주 쓰는 문장은 어떻게 선정했고, 번역 DB는 어떻게 쌓았을까요.
산업인력관리공단 '자주 쓰는 외국어 DB' 웹페이지 모습
한국산업인력공단은 외국인 근로자를 고용한 사업체에 통역 서비스를 지원합니다. 이 서비스를 이용한 사업체가 가장 많이 번역을 요청한 문장들을 모았습니다. 이렇게 선정한 한국어 1200문장은 용도에 따라 다시 △일상생활 △근로관련 △작업지시 △ 고용관련신고 △기숙사 및 식당 등 5가지로 분류했습니다.이 5가지 분류는 다시 31가지 소분류로 나뉘어 정리됐습니다. 예를 들면 작업지시 하위엔 △근무시작/끝, △근무태도, △작업공구, △안전규칙, △작업규칙 등 기타 5가지 카테고리가 존재합니다. 근무태도 DB 한 예로 '근무중에는 잡담을 하지 마세요 → (태국어) อย่าพูดคุยกันในเวลาทำงาน야-푿-쿠이-깐-나이-외-라-탐-으안'로 표현돼 있습니다. 한국인 관리자가 태국인 근로자에게 '근무 중 잡담을 하지 말라'고 말하고 싶으면 한국표기로 된 '야-푿-쿠이-깐-나이-외-라-탐'을 읽어주라는 겁니다.

그래서일까요. 이 DB는 공교롭게도 한국 사업주와 외국인 근로자가 주로 어떤 문제로 주로 갈등을 겪는지가 잘 드러납니다. 때론 부적절해 보이는 언사도 있고, 외국인 근로자가 열악한 환경에서 일하고 있음을 보여주는 문장도 있죠.

뉴스래빗은 '자주 쓰는 외국어 DB(데이터베이스)' 한국어 2000문장과 이를 17개 각 언어로 번역한 3만4000문장 전수를 수집, 분석하고 그 문제점과 함께 대안을 제시합니다 !.!#2. 외국인근로자에 자주 말하는 분야:
일 > 기숙사 > 월급 > 보험 순

분석한 형태소를 빈도 순으로 보니 외국인 근로자의 업무·생활환경을 유추할 수 있습니다.
뉴스래빗이 전수 형태소 분석한 결과 가장 등장 빈도가 높은 단어는 '일(50회)'입니다. 대부분이 업무 중 필요한 문장이니 새로운 결과는 아닙니다.
뒤를 잇는 단어들도 꽤 흥미롭습니다. 고용주와 외국인 근로자 사이 어떤 지점에서 답답함이 발생하는지 엿볼 수 있죠.

'일'에 이어 두 번째로 빈도가 높은 형태소는 '기숙사(40회)'입니다. 외국인 근로자의 근무·생활환경에 기숙사 생활이 상당한 비중을 차지한다는 증명입니다. '기숙사 및 식당' 내 6개 소분류 중 '기숙사 규칙'에 속한 문장에서 21회 등장해 압도적입니다. '기숙사 안내'와 '기숙사 환경' 소분류에서도 각 8회씩 등장했습니다.
'기숙사' 형태소 포함 문장 모음"내일은 공휴일이니 기숙사에서 쉬도록 해요"
"주말에 기숙사에서 잠만 자지 마세요"
"기숙사 관리 비용은 근로자와 회사가 공동 부담하니 아껴 쓰세요"
"기숙사 외부인 면회는 O시까지입니다"
"월급에 식비, 기숙사비가 포함되어 있습니다"

'월급(35회)'이 뒤를 이었습니다. '급여/수당 관련' 소분류에서 28회로 빈도가 가장 높았죠. 월급을 본국으로 송금하는 내용이 주를 이룹니다. 월급을 허투루 쓰지 말 것을 조언하는 문장들도 눈에 띕니다. "도박장 출입하면 월급 하루에 다 날립니다", "월급날 술 마시고 유흥업소에 가지 마세요", "월급으로 지나치게 비싼 물건을 사지 마세요" 등입니다.
'월급' 형태소 포함 문장 모음

"월급 본국 송금을 사장님이 대신 해주시길 원하세요?"
"타인의 월급과 본인의 월급을 비교하지 마십시오"
"이달 월급이 체불되었습니다"
"매년 월급을 새롭게 갱신합니다"
"월급에서 OO%의 돈이 빠집니다"
"이전 회사에서는 월급을 얼마정도 받았습니까?"

'보험(35회)'도 '월급'만큼 비중이 큽니다. 보험 관련 문장들은 꽤나 구체적입니다. 국민건강보험(의료보험), 상해보험, 보증보험, 고용허가제보험 등 구체적 종류를 명시한 문장이 많습니다. '보험' 단어를 직접 포함하진 않지만 특정 보험사 이름과 연락처를 알려주는 문장도 있을 정도입니다. 외국인 근로자가 한국에서 일하려면 귀국비용보험과 상해보험에 의무적으로 가입해야 합니다. 상해보험은 사고로 다쳤을 때 치료비 등을 청구하는 보험입나다. 귀국비용보험은 다소 생소할 겁니다. 외국인 근로자들이 체류 기한을 마치고 본국으로 돌아갈 때를 대비해 드는 보험입니다. 설령 외국인 근로자가 취업비자(E-9) 만료 때 모은 돈이 없다고 해도, 귀국비용보험을 통해 비행기값 등 고향으로 돌아갈 비용을 마련할 수 있는 거죠. 이 같은 외국인근로자보험은 2004년 고용노동부가 첫 사업자로 삼성화재를 지정한 바 있습니다. 그래서 삼성화재 연락처가 아예 DB에 박혀있죠
'보험' 형태소 포함 문장 모음

"의료보험에 가입하였으니 병원에 가더라도 치료비가 적게 나옵니다"
"건강보험료는 사업주와 근로자 각각 1/2씩 부담해야 합니다"
"귀국비용보험은 한국에서 곤란한 일을 당했을 시 본국으로 돌아갈 수 있도록 비행기 표를 살 수 있는 안전장치입니다."
"여러분은 귀국비용보험과 상해보험에 가입해야 합니다"
"출국만기보험은 퇴직금과 비슷합니다"
"삼성화재 연락처는 02-2119-2400 입니다"

#3. "이건 압수", "눈치껏 잘.."
고압적이거나 혹은 열악하거나

한국산업인력공단은 "1200문장은 E9(비전문취업) 비자를 받은 외국인 기준으로 조사·선정했다"고 설명했습니다.

문장을 하나하나 살펴보니 외국인 근로자의 근무·생활환경이 드러납니다. E9 비자로 한국에 들어온 외국인 근로자는 무슨 일을 할까요. 아래 문장들을 보시죠.
"청소 시에는 분진이 발생되므로 항상 마스크를 착용하세요"
"프레스 기계에 손을 넣을 때 주의하세요"
"화학약품이 묻지 않도록 주의하세요"
"기게에 손이 다치지 않도록 주의하세요"
"청각 보호를 위해 작업장에서 귀마개를 착용한다"
"동상에 걸리지 않도록 조심하세요"
"사료를 줄 시간이에요"
"아프거나 죽은 돼지, 소, 닭이 없는지 확인해주세요"

외국인 근로자의 안전을 우려하는 문장들입니다. 한편으로는 프레스 기계, 화학약품, 분진 등 안전을 걱정할 만큼 위험한 환경에서 일하는 외국인 근로자가 적지 않다는 반증이기도 하죠. 이 뿐 아닙니다.
"회사 사정이 좋지 않아 임금을 줄 수 없어요"
"무급휴가입니다"
"돈이 부족할 테니까, 그동안 맡아두었던 돈을 일부 돌려주겠어요"
"밤에도 일을 합니다"
"이것은 압수입니다"
"눈치껏 잘 하십시오"

임금 체불, 무급휴가, 야근이 자주 일어난다는 우려가 충분히 가능한 대목입니다. 심지어 외국인 근로자가 번 돈을 맡는다거나, 무언가를 압수당하기까지 합니다. 한국 사람끼리 일하는 상황에선 나오지 않는 말들입니다. 외국인 근로자에게만 이런지는 이 문장들만으론 알 수 없습니다. 다만 '자주 쓴다'고 인정한 문장들에서 이런 내용이 보이니 우려가 안 들 순 없습니다.

▽ 뉴스래빗 에디터 4명이 꼽은
'고압적이거나 혹은 열악하거나' DB 사례
▽▽ 대분류/소분류 키워드를 조절해 보세요 !.!
#4. 육안에도 보이는 번역 오류들
그래도 산업인력공단 "자주 쓴다"?

다시 한 번 말씀드리지만, 이 DB 속 1200문장은 '자주 쓰는' 외국어입니다. 공단은 "근로 현장에서 DB를 자주 활용하냐"는 질문에 "그렇다"고 답했습니다. 그런데 말입니다. DB를 살펴보다 이상한 점을 발견했습니다.
한국산업인력공단 '자주 쓰는 외국어 DB'. 한국어 문장과 중국어 번역이 맞지 않는다.
한국어 문장과 번역한 외국어 문장의 짝이 맞지 않는 경우가 많았습니다. 중국어는 일정 부분에서 순서가 한 문장씩 밀려 있습니다. 2009년 구축했으니 이후 10여 년 가까이 틀린 채로 있었던 셈입니다. 한국산업인력공단이 번역한 17개국 총 3만4000문장 중 뉴스래빗이 발견한 중국어 외 얼마나 많은 문장이 틀려있을지 알 수 없는 일입니다.

현장에서 쓸 수 없는 수준입니다. 외국어를 전혀 모르는 고용주가 사용할 경우 큰 오해를 불러일으킬 수도 있습니다. 산업인력공단 담당자는 뉴스래빗의 "현장에서 정말 자주 쓴다면 이 정도 틀린 걸 발견 못 할 수 있었겠냐"는 질문에 명확한 해명을 하지 못했습니다.

#5. '취지' 좋지만, '소통' 아쉬워
뉴스래빗이 공단에 3가지 제안합니다

'자주 쓰는 외국어 DB'는 외국인 근로자와 고용주 모두에게 유용할 수 있는 자료입니다. 이런 자료를 조사하고, 번역하고, DB화한 한국산업인력공단의 노력은 돋보입니다. 그때그때 일회성 서비스로 끝날 뻔 했던 통역 지원 경험을 쌓아 지속 가능한 서비스로 발전시켰기 때문이죠. 공공기관이 구축한 데이터에서 보기 드문 사례입니다.

1. 다수 번역 오류 :) 다만 육안으로도 발견할 수 있는 미비점들은 아쉽습니다. 뉴스래빗이 발견한 번역 불일치는 공단이 한 번만 확인했더라도 알 수 있었을 문제입니다. 설령 공단이 못 했더라도, 현장에서 널리 쓰였다면 10년 째 틀린 채로 방치되진 않았을 것입니다. 이 같은 번역 오류를 뉴스래빗이 산업인력관리공단 담당자에게 알렸지만, 이 데이터저널리즘이 공개되는 오늘까지 지난 10여일 간 DB 수정은 이뤄지지 않고 있습니다. 그새 이 DB를 이용해 틀린 언어로 소통한 한국인과 외국인 근로자는 얼마나 될까요.

2. 고압적 문장 개선 :) 부적절한 문장들도 개선이 필요합니다. 한국산업인력공단은 이 DB를 "고용주를 위해 구축했다"고 명시했습니다. 하지만 이 DB는 고용주와 외국인 근로자 양측 모두에게 영향을 끼칠 수밖에 없습니다. 이 DB가 소통과 대화가 아닌 한국 고용주의 지시로 탈바꿈하면, 외국인 근로자에겐 근무 명령을 돌변하기 때문이죠.

뉴스래빗이 지적했듯 현재 DB 속 문장들은 다소 고압적이거나 일방적입니다. '아 다르고 어 다르다'는 뜻, 다 아시죠? 좀 더 사려깊게 근로자를 대해야 합니다. 외국인 근로자는 한국에 온 손님이기도 합니다. 산업인력관리공단에 따르면 2017년 9월까지 한국에 합법적으로 입국한 외국인 근로자는 4만 32명이나 됩니다. 고압적이거나 배려가 부족한 고국어를 자주 들으면 한국에 대한 부정적인 감정만 키울 수 있습니다. '가는 말이 고와야 오는 말도 고운 법'입니다.

3. 외국인도 함께 쓰도록 :) 현재 DB는 한국인 사업주와 관리자 용도입니다. 외국어 발음과 가장 유사한 한글로만 병기한게 그 근거죠. 외국인 근로자가 같은 문장을 한글로 말하고 싶을 땐 쓰기 힘듭니다.

조금 더 노력하면 외국인도 쓸 수 있습니다. 외국인을 위해 영문 알파벳으로 한글 발음을 병기해주는 거죠. 예를 들어 '감사합니다→ Gamsahapnida' 처럼 말이죠.

한국 기업, 특히 중소기업 고용주가 생산성 향상을 위해 외국인 근로자와 매일매일 현장에서 고군분투하고 있다는 점을 뉴스래빗도 잘 압니다. 산업인력관리공단이 '자주 쓰는 외국어 DB' 같은 고객 지향 데이터를 쌓은 것도 열악한 작업장에 조금이나마 도움이 될 공공서비스라는 판단이었을 겁니다.

'자주 쓰는 외국어 DB'는 잠재력이 큰 공공데이터 DB입니다. 다만 현재 수준으로 일선 사업장에 배포하면 소통과 이해보단 오해와 다툼을 낳을 수도 있다는 점이 아쉽습니다. 한국산업인력공단과, 현장 고용주들이 '자주 쓰는 외국어 DB'를 사려깊고 원활한 의사소통 도구로 성장시키길 기대해봅니다. 뉴스래빗도 응원하겠습니다. !.!
# 데이터텔링 ? 데이터저널리즘(Data Journalism)이란 무엇일까요. 뉴스래빗이 선보이는 데이터텔링은 그 답을 찾는 과정입니다. 오픈소스를 활용한 독자 참여형 콘텐츠와 아이콘 버튼을 통해 관련 자료를 손쉽게 확인할 수 있습니다. 공감을 이끌어 낼 수 있는 스토리와 직관적인 그래픽이 특징입니다.# 데이터 정책제안 ? 질 좋은 데이터저널리즘 콘텐츠는 양질의 데이터를 확보할 때 비로소 완성됩니다. 뉴스래빗이 공공데이터 수집 및 정제, 분석 등 과정에서 겪은 문제점이나 애로사항을 바탕으로 데이터 관련 정책을 정부 및 지자체, 공기업 등 공공부문에 제안합니다.

책임= 김민성, 연구= 강종구 한경닷컴 기자 jonggu@hankyung.com
뉴스래빗 페이스북 facebook.com/newslabit
기사제보 및 보도자료 newslab@hankyung.com


핫이슈