가족들 데이터 분석해 만들어내
전용 모바일 앱 ‘마음 톡’ 개발도

KT는 지난 3월 기업광고 ‘마음을 담다’의 ‘내 이름은 김소희입니다’ 편을 통해 ‘목소리 찾기’ 프로젝트를 시작했다. 이 프로젝트는 KT의 인공지능(AI) 기술을 통해 청력을 잃었거나 사고나 질병 등으로 후천적으로 목소리를 잃은 농인의 목소리를 만들어주는 것이다. 태어나자마자 청력을 잃은 김씨는 이후 48년간 농인으로 살아왔다.
‘가장 갖고 싶은 것’으로 목소리를 꼽는 김씨를 위해 KT는 가족들의 목소리 데이터를 수집·분석해 김씨의 목소리를 새롭게 만들어냈다. 김씨 어머니 송재화씨는 “눈이 어두워서 딸이 밖에서 문자를 보내면 손녀딸이 읽어줘야 했는데, 이제는 직접 대화할 수 있어 너무 좋다”고 말했다.
KT는 ‘목소리 찾기’ 프로젝트를 통해 탄생한 목소리를 참가자들에게 전달했다고 26일 밝혔다. 지난 4월 20명을 선발해 시작한 프로젝트가 마무리된 것이다.
KT는 이번 프로젝트에서 본인 목소리에 대한 학습 데이터 없이 목소리를 구현했다. 기존 음성합성 기술은 한 문장이라도 본인 목소리가 필요했지만, KT는 딥러닝 기반으로 목소리를 만들어내는 개인화 음성합성기술(P-TTS)을 이용했다. 이를 위해 참가자 동성 가족의 음성 데이터에 각각의 음색과 어조, 말투 등이 반영됐다. 각 참가자의 동성 가족 구성원들은 참가자의 목소리 구현을 위해 1000개 문장을 녹음했다.
목소리 자체는 유전되지 않는 것으로 알려져 있다. 성대와 안면구조 등의 신체적 특징이 유전되며 그에 따른 목소리가 구현되기 때문이다. KT는 MRI(자기공명영상) 촬영으로 구강구조를 추출하고 성별과 나이 등 가족들의 특성을 AI 엔진으로 분석해 참가자만의 특색 있는 목소리를 만들었다. 이렇게 구현된 목소리를 언제나 전할 수 있도록 KT는 전용 모바일 앱 ‘마음 톡(Talk)’을 개발했다. 농인이 앱에 입력한 텍스트를 목소리로 바꾼다. KT 융합기술원 관계자는 “이번 프로젝트에 활용된 기술을 통해 기가지니의 음성 고도화와 오디오북 등에 다양하게 쓰일 수 있다”며 “장애인은 물론 노인, 다문화가정 등 여러 분야에 적용하기 위한 테스트가 진행 중”이라고 밝혔다.
김준영 기자 papenique@segye.com
[ⓒ 세계일보 & Segye.com, 무단전재 및 재배포 금지]