<iframe src="//www.googletagmanager.com/ns.html?id=GTM-KDPKKS" height="0" width="0" style="display:none;visibility:hidden">

[함인희의세상보기] 통계는 맹신도 불신도 금물

정확한 데이터 기반으로 측정 때 / 효과 큰 좋은 정책 만들 수 있어 / 부동산 대책도 실패 따지기 앞서 / 데이터의 부재가 원인은 아닐까

글씨작게 글씨크게
입력 : 2018-09-10 21:35:32      수정 : 2019-03-19 15:22:45

통계에 대한 국민적 관심이 그 어느 때보다 뜨겁다. 이유를 차치하고 일단은 반가운 일이지만 행여 불필요한 오해와 근거 없는 편견이 심화될까 걱정이 앞서기도 한다.

 

인구 센서스(해당 국가 인구 및 주택의 기본적 특성을 조사하기 위해 정기적으로 실시하는 전수조사)와 관련된 미국의 유머 하나. 익명의 누군가가 센서스용 설문지 앞뒤 면에 ×표를 한 뒤 마지막 칸에 “당신이 알 바 아니오(Non of Your Business)”라 적었다 한다. 하기야 국가가 왜 개인의 사생활에 시시콜콜한 관심을 가지는지 반감이 생길 만도 하다.

 

함인희 이화여대 교수 사회학

학부 시절 ‘사회 통계’ 과목 첫 시간에 한 교수께서 학생들에게 던졌던 질문이 생각난다. 당시 미국 인구 규모가 약 2억명이라 할 때 무작위 표집을 통해 표본조사를 할 경우 표본 수는 얼마 정도면 될까? 용감한 친구가 “10만명요” 외치자, “여학생들이라 그런가 스케일이 대단하군요” 하고 농담을 건네던 교수 왈 “정답은 무작위 표집을 전제로 표본 수 1500 정도면 충분하다”고 하셨다. 순간 통계의 마술에 발을 들여놓은 듯한 느낌이 들었던 기억이 새롭다.

 

통계의 세계 속엔 오묘함이나 신기함 못지않게 ‘귀에 걸면 귀걸이요 코에 걸면 코걸이’라는 오명과 관련해서도 알려진 이야기가 많다. 사회학계에서는 한때 “프티부르주아의 프롤레타리아화”가 진행되면서 한국사회의 계급구조가 자본가 대 노동자로 이분화되고 있다는 주장과 중간계급 및 중산층 비율이 괄목할 만한 수준으로 팽창함에 따라 사회 안정과 민주주의를 지지하고 지탱하는 층이 두꺼워졌다는 주장이 팽팽하게 대립한 적이 있다. 양측 모두 동일한 센서스 자료를 기반으로 분석했는데도 상반된 결과에 이르러 통계의 본질을 둘러싸고 시사하는 바가 컸음은 물론이다.

 

학술 연구를 목적으로 통계 분석을 시도해본 연구자들이 공유하는 비밀(?)도 있다. 통계 분석은 다양한 변수를 넣었다 뺐다 해보고 각 변수의 범주를 이리저리 변주하다 보면 결국은 원하는 결과를 얻게 마련이라는 것이다. 연령 범주를 10대 20대 30대 등으로 나누어 분석할 때와 출생 코호트별로 X Y Z 세대별 범주를 구성해 분석할 때 결과가 달리 나타날 가능성이 크다. 하물며 불평등을 측정하기 위한 변수는 종류도 다양하거니와 분류 기준도 천차만별이기에 연구자의 의도에 따라 얼마든지 유연성을 발휘할 수 있다.

 

통계의 착시와 관련해서도 회자되는 사례가 많다. 고전적인 예를 하나 들자면, 일찍이 ‘결손가족’ 자녀일수록 청소년 비행에 가담할 확률이 높다는 고정관념이 있었다. 다양한 조사가 이 둘 사이에 높은 상관관계가 있음을 보여주었다. 그러나 빈곤 변수를 통제하고 보니 결손가족과 청소년 비행 사이의 관계는 사라져 버렸다. 빈곤 상황이 한편으론 가족의 결손을 부추기고 빈곤 환경이 다른 한편으로 청소년 비행률을 높였던 것이지, 결손 가족이라 해서 청소년 비행으로 곧장 연결되는 것은 아니었던 셈이다. 물론 이상의 사례들은 통계의 중요성을 폄하하거나 통계의 의미를 손상시키기 위해 제시된 것은 아니다. 통계는 복잡한 현실을 포착하는 주요한 도구 중 하나라는 사실엔 변함이 없고, 축적된 통계를 통해 지금까지의 발자취를 확인하면서 미래의 트렌드를 예측하는 작업 또한 통계의 가치를 높여준다는 사실도 상식에 속한다. 최근 인구 고령화 추계를 기반으로 국민연금 고갈 시기가 당초 예상보다 3년 정도 앞당겨질 수 있음을 예측한 것은 통계의 의미를 되새기도록 한 실례라 하겠다.

 

정확한 데이터에 기반할 때 실현 가능성 및 효과가 높은 ‘좋은 정책’이 만들어질 수 있음도 부인할 수 없다. 저출산의 주범 중 하나가 결혼율 감소로 밝혀진 바엔, 저출산 정책의 방향을 기혼 부부의 일·가정 양립 지원으로부터 결혼친화적 사회환경 구축 쪽으로 패러다임 전환을 모색하는 것이 보다 바람직한 결과를 가져올 것임이 확실하다. 전 국민을 대상으로 시행착오를 거듭 중인 교육정책 앞에선 우리에게 과연 ‘교육은 백년지대계’라는 믿음에 걸맞은 교 육관련 데이터가 축적돼 있는지부터 묻고 싶어진다. 사교육비 경감을 최종 목표로 입시정책의 변화를 모색해온 상황에서 사교육비의 정확한 규모조차 제대로 파악하지 못하고 있는 우리 현실이야말로, 교육정책의 실패를 자초해온 원인은 아닌지 반성을 요한다. 부동산 정책의 실패도 정부의 과도한 개입과 시장의 실패를 탓하기에 앞서, 정확한 데이터의 부재가 한몫하고 있을 가능성에 무게를 두어야 할 것 같다.

 

대신 통계는 단순한 숫자의 나열이 아니라 각각의 수치에 질적인 의미가 담겨 있음을 반드시 기억할 일이다. 이번에 논란이 된 가계소득 격차 확대라는 결과를 보면서 그로 인해 고통을 감내해야만 하는 가족의 엄혹한 삶이 자리하고 있음을 읽어내는 동시에, 바로 이들 개별 가족의 고통을 완화하거나 소득 격차 확대가 더 이상 심화되지 않도록 하는 데 정책 개입을 서둘러야 할 것이다.

 

‘사회 통계’ 첫 시간에 담당교수께서 당부하신 바, “통계는 맹신도 금물이요. 불신도 금물”이라는 말씀, 더불어 “쓰레기를 넣으면 쓰레기가 나온다(garbage in gargage out)”는 말씀은 오늘 우리가 금과옥조로 삼아도 좋을 소중한 교훈일 것 같다.

 

함인희 이화여대 교수 사회학

Copyrights ⓒ 세계일보 무단 전재 및 재배포 금지
실시간 링크 AD
투데이 링크 AD
많이 본 뉴스
    실시간 이슈 AD
    이시각 관심 정보 AD