세계일보

검색

[학술·문화재 단신] 외국인들 한국단어 중 ‘사람’ 최다 사용 외

입력 : 2021-06-15 02:30:00 수정 : 2021-06-14 20:26:08

인쇄 메일 글씨 크기 선택 가장 작은 크기 글자 한 단계 작은 크기 글자 기본 크기 글자 한 단계 큰 크기 글자 가장 큰 크기 글자

외국인들 한국단어 중 ‘사람’ 최다 사용

 

외국인이 한국어를 학습하면서 가장 많이 사용하는 단어는 ‘사람’이라는 연구 결과가 나왔다. 국립국어원은 외국인이 한국어를 배우는 과정에서 생산한 말이나 글을 데이터화한 ‘한국어 학습자 말뭉치’를 분석한 결과, 한국어 학습자가 많은 중국어·일본어·베트남어·영어·러시아어 권역 일반명사 고빈도어 순위에서 ‘사람’이 1위에 올랐다고 밝혔다. 이어 ‘친구’, ‘생각’, ‘때’, ‘일’, ‘공부’, ‘집’ 순으로 사용 빈도가 높았다.

언어권별로 빈도에 차이를 보이는 단어도 있었다. 중국어권은 ‘사회’, 일본어권은 ‘이야기’, 베트남어권은 ‘여행’, 영어권은 ‘시간’, 러시아어권은 ‘가족’과 ‘남편’이 다른 언어권과 비교해 두드러지게 많이 나타나는 단어로 조사됐다.

아울러 외국인이 한국어를 학습하면서 오류를 많이 범하는 문법 요소는 조사였다. 국어원은 오류 빈도 상위 100건 중 조사 오류가 45%로 가장 많았다고 전했다.

국립중앙도서관 ‘텍스트 마이닝’ 분석

국립중앙도서관은 오는 28일부터 다음달 1일까지 ‘텍스트마이닝(Text Mining·텍스트 데이터에 숨겨져 있는 관계를 발견해 새롭고 유용한 정보를 추출하는 기술)을 활용한 데이터 분석’ 프로그램(사진)을 운영한다고 14일 밝혔다. 참여 신청은 이날부터 가능하다. 이 프로그램은 텍스트 데이터와 같은 다양한 유형의 데이터에 대한 분석 수요의 증가에 따라 텍스트 데이터 분석 및 시각화 기초 역량을 강화하기 위한 것이다.

텍스트 데이터의 수집과 처리부터 분석과 시각화까지 다루는 프로그램은 4차례에 걸쳐 ‘텍스트 마이닝의 개념과 환경 준비하기’, ‘텍스트 데이터의 수집과 전처리(pre-processing) 방법’, ‘텍스트 데이터 분석’, ‘텍스트 데이터의 시각화 방법’을 강의한다.

도서관 관계자는 “이번 프로그램을 통해 새로운 지식을 창출하는 연구 시사점을 얻을 뿐만 아니라 데이터 분석으로 통찰과 혜안을 얻는 기회가 되기를 기대한다”고 말했다.

무료이며, 도서관 홈페이지(nl.go.kr)에서 신청할 수 있다. 수강 대상 60명은 서면 검토를 통해 선발한다.


[ⓒ 세계일보 & Segye.com, 무단전재 및 재배포 금지]

오피니언

포토

엄현경 '여전한 미모'
  • 엄현경 '여전한 미모'
  • 천우희 '미소 천사'
  • 트와이스 지효 '상큼 하트'
  • 한가인 '사랑스러운 인사'