[천자칼럼] 통계조작의 나라
1973년 미국 버클리대 입시에서였다. A학과에는 여학생 263명 중 192명(73%), 남학생 80명 중 55명(69%)이 합격했다. B학과에는 여학생 87명 중 81명(93%), 남학생 270명 중 234명(87%)이 합격했다. 그런데 두 학과를 합한 전체로는 여학생이 350명 중 273명(78%), 남학생은 350명 중 289명(83%)이 합격했다. 어떤 집단의 전체 추세와 그 하위집단의 추세가 역전 현상을 보이는 ‘심슨의 역설’이다. 이런 사실을 모른다면 전체 통계만을 보고 대학 측이 여학생을 차별했다고 주장하기 십상이다.

통계는 어떤 현상이나 실태를 한눈에 파악할 수 있게 하는 편리한 도구다. 하지만 원천 데이터의 오류나 분석 방법의 차이에 따라 결과가 판이해진다. 통계적 오류나 착시는 물론 조작 유혹, 조작 논란이 빈번한 이유다. 가장 빠지기 쉬운 것이 평균의 함정이다. 가령 우리나라 직장인 평균 월급을 이야기할 때 그 숫자가 실제 직장인의 소득을 얼마나 충실히 대표하는지는 면밀히 따져봐야 한다. 정규직·비정규직·기간제 등 고용 형태와 사업장 규모 등에 따라 다르기 때문이다. 통계 전문가들은 평균의 함정에 빠지지 않으려면 반드시 중앙값, 표준편차, 분포 형태 등을 함께 보고, 평균 속에 누락된 데이터의 속성을 잘 파악해야 한다고 강조한다. 분석의 기준과 초점, 변수 간의 상관관계와 인과관계, 비교 대상의 적절성 등도 정확한 통계를 위해 살펴봐야 할 요소다.

각종 통계가 넘쳐나는 시대다. 분석상의 오류를 넘어 데이터와 자료의 왜곡, 편향적인 해석 등 통계 조작의 문제도 신경 써야 하는 세상이다. 중국은 후한의 반고가 쓴 <한서지리지>에 군현별 인구를 상세하게 기록했을 만큼 통계의 역사가 길지만 ‘못 믿을 통계’의 나라가 된 지 오래다. 31개 성(省)별 국내총생산(GDP)의 합은 언제나 국가 전체 GDP보다 10% 안팎 많다. 치적은 부풀리고 불리한 숫자와 과오는 숨기는 지방정부의 통계 조작 때문이다. 지난달엔 경기 부진이 심화하자 주요 경제지표 중 하나인 청년실업률 공개를 중단했다. 문재인 정권이 정책 실패를 감추려고 부동산가격은 물론 소득·분배·고용 등의 국가통계를 광범위하게 조작한 사실이 감사원 감사로 드러났다. 대한민국이 중국의 뒤를 따라갈 뻔했다.

서화동 논설위원 fireboy@hankyung.com