세계일보

검색

한국어 배우는 외국인이 가장 많이 쓰는 단어는

관련이슈 디지털기획

입력 : 2021-06-10 12:30:00 수정 : 2021-06-10 11:17:28

인쇄 메일 글씨 크기 선택 가장 작은 크기 글자 한 단계 작은 크기 글자 기본 크기 글자 한 단계 큰 크기 글자 가장 큰 크기 글자

국립국어원은 외국인이 한국어를 배우는 과정에서 생산한 말이나 글을 데이터화한 ‘한국어 학습자 말뭉치’를 분석한 결과를 10일 발표했다.

 

분석결과 한국어 학습자가 많은 중국어·일본어·베트남어·영어·러시아어 권역 일반명사 고빈도어 순위에서 ‘사람’이 1위에 올랐다. 이어 ‘친구’, ‘생각’, ‘때’, ‘일’, ‘공부’, ‘집’ 순으로 사용 빈도가 높았다.

 

언어권별로 빈도에 차이를 보이는 단어도 있었다. 중국어권은 ‘사회’, 일본어권은 ‘이야기’, 베트남어권은 ‘여행’, 영어권은 ‘시간’, 러시아어권은 ‘가족’과 ‘남편’이 다른 언어권과 비교해 두드러지게 많이 나타나는 단어로 조사됐다.

 

외국인이 한국어를 학습하면서 오류를 많이 범하는 문법 요소는 조사였다. 국어원은 오류 빈도 상위 100건 중 조사 오류가 45%로 가장 많았다고 전했다.

 

국어원 관계자는 “말뭉치는 빅데이터라고 할 수 있다”며 “지금까지 말뭉치 구축대상은 대부분 초·중급 한국어 학습자여서 ‘사람’이라는 단어가 가장 많이 사용된 것 같다”고 설명했다. 국어원은 2015년부터 지난해까지 1차 한국어 학습자 말뭉치 구축을 위해 139개국, 92개 언어권의 표본을 수집해 약 440만 어절을 확보했다. 어절은 띄어쓰기가 돼 있는 말의 덩어리를 뜻한다.

 

올해부터 5년간 진행하는 2차 말뭉치 사업에서는 일본어권·영어권·베트남어권·타이어권 학습자, 학문 연구를 위해 한국어를 쓰는 고급 학습자 등으로 대상을 확대해 560만 어절을 추가로 구축할 예정이다.

 

조성민 기자 josungmin@segye.com

[ⓒ 세계일보 & Segye.com, 무단전재 및 재배포 금지]