
한국어 구어 빈도사전을 출간한 서상규(사진) 연세대 국문과 교수는 한국말에 대해서 좀 관심을 가지게 되면 누구나 가질 수 있는 자연스러운 이런 의문을 품고 있으면서도, 우리는 정작 이를 명쾌하고 밝혀내지 못한 채 살아 오고 있었다”며 이같이 말했다.
서 교수는 한국어 구어를 상황별로 분류해 표제어 3만3702개의 빈도를 조사한 ‘한국어 구어 빈도사전’ 2권을 펴냈다.
1권인 ‘잦기(빈도)순’ 사전은 어떤 한국어 구어가 자주 쓰이는지 어휘를 빈도순으로 배열했다. 2권인 ‘가나다순’ 사전은 어휘들을 가나다순으로 배열해 특정 어휘의 빈도가 궁금할 때 찾아볼 수 있도록 했다. 조사 대상 구어는 1992년부터 2005년까지 녹음된 실제 구어 자료에서 뽑아낸 것으로, 상담, 토론, 회의 등 공적·사적 범주에서 주제별로 추출했다.
우리 어휘의 사용 빈도 조사는 60년 전으로 거슬러 올라간다. 1956년 국어운동가였던 최현배 선생의 ‘우리말 말수 사용의 잦기(빈도)조사’는 수작업으로 일일이 숫자를 세어 가며 우리말의 빈도를 본격적으로 밝힌 대표적인 연구로 손꼽힌다. 하지만 그 시대는 전산화된 방식의 언어 연구가 어려웠고 편의상 문어를 중심으로 한 분석에 머물렀다.
디지털 시대의 우리말 연구 방법론은 더욱 진화됐고 서 교수는 우리말 빈도 연구의 맥을 이어받아 묵묵히 연구를 진행해 오고 있다. ‘살아 있는 구어’를 분석 대상으로 삼아 한국인이 일상적으로 사용하는 우리말의 모습을 더욱 객관적으로 밝히는 것이 서 교수가 수년간 품어 온 과제였다.
사전에 따르면 우리가 일상에서 가장 많이 쓰는 구어는 동사 ‘하다’인 것으로 나타났다. ‘하다’는 전체 단어 중 1.7%로 총 2만9038번이 사용됐다. 다음은 조사 ‘에’와 ‘가’로 빈도 순위 상위10개 단어는 대부분 동사와 조사였다.
서 교수는 “이번에 출간한 빈도 사전의 특별한 점은 한국어 구어의 실제 모습이 있는 그대로 반영된 점”이라면서 “실제 구어 자료를 수집하는 단계에서부터 주석과 동음이의어 구분 등 모든 과정을 스스로 직접 보고 작업했다”고 말했다.
김건호 기자 scoop3126@segye.com
[ⓒ 세계일보 & Segye.com, 무단전재 및 재배포 금지]