국립국어원, 말뭉치 분석 결과 공개…"문법 오류는 조사가 최다"
한국어 배우는 외국인이 가장 많이 쓰는 단어는 '사람'
외국인이 한국어를 학습하면서 가장 많이 사용하는 단어는 '사람'이라는 연구 결과가 나왔다.

국립국어원은 외국인이 한국어를 배우는 과정에서 생산한 말이나 글을 데이터화한 '한국어 학습자 말뭉치'를 분석한 결과, 한국어 학습자가 많은 중국어·일본어·베트남어·영어·러시아어 권역 일반명사 고빈도어 순위에서 '사람'이 1위에 올랐다고 10일 밝혔다.

이어 '친구', '생각', '때', '일', '공부', '집' 순으로 사용 빈도가 높았다.

언어권별로 빈도에 차이를 보이는 단어도 있었다.

중국어권은 '사회', 일본어권은 '이야기', 베트남어권은 '여행', 영어권은 '시간', 러시아어권은 '가족'과 '남편'이 다른 언어권과 비교해 두드러지게 많이 나타나는 단어로 조사됐다.

아울러 외국인이 한국어를 학습하면서 오류를 많이 범하는 문법 요소는 조사였다.

국어원은 오류 빈도 상위 100건 중 조사 오류가 45%로 가장 많았다고 전했다.

국어원 관계자는 "말뭉치는 빅데이터라고 할 수 있다"며 "지금까지 말뭉치 구축 대상은 대부분 초·중급 한국어 학습자여서 '사람'이라는 단어가 가장 많이 사용된 것 같다"고 말했다.

국어원은 2015년부터 지난해까지 1차 한국어 학습자 말뭉치 구축을 위해 139개국, 92개 언어권의 표본을 수집해 약 440만 어절을 확보했다.

어절은 띄어쓰기가 돼 있는 말의 덩어리를 뜻한다.

올해부터 5년간 진행하는 2차 말뭉치 사업에서는 일본어권·영어권·베트남어권·타이어권 학습자, 학문 연구를 위해 한국어를 쓰는 고급 학습자 등으로 대상을 확대해 560만 어절을 추가로 구축할 예정이다.

/연합뉴스