2010년 6·2 지방선거를 보름 앞둔 5월 중순께. 언론사와 여론조사회사들은 사전 예측치를 경쟁적으로 쏟아냈다. 조사마다 편차는 있었지만 서울시장에 출마한 오세훈 한나라당 후보의 지지율은 47.0~59.7%였다. 경쟁 상대인 한명숙 민주당 후보(31.8~36.8%)를 많게는 20%포인트 차로 압도했다. 인천시장에 나온 안상수 한나라당 후보도 40~45%의 지지율로 32~39%에 그친 송영길 민주당 후보에 쉽게 낙승할 것으로 예상했다.

하지만 결과는 여론조사와 딴판이었다. 오세훈 후보는 47.4%의 득표율로 46.8%를 얻은 한명숙 후보를 불과 0.6%포인트 차로 이겼다. 개표 중반까지 계속 밀리다 막판에 근소한 차로 역전승한 것이다. 오 후보는 다음날 새벽까지 계속 뒤지자 패배를 인정하는 해프닝까지 벌어졌다. 인천시장은 아예 여론조사와 정반대 결과가 나왔다. 안상수 후보가 아닌 송영길 후보가 당선된 것이다. 그것도 송 후보가 52.7%의 득표율로 44.4%에 그친 안 후보를 8%포인트 이상 큰 차이로 이겼다.


여론조사의 부정확성은 멀리갈 필요도 없다. 올해 4·11 총선 때도 반복됐다. 여론조사 회사 관계자들은 4월 초까지 원내 제1당으로 민주당을 꼽았으며 135~140석을 얻을 것으로 예상했다. 하지만 새누리당이 152석으로 과반을 차지해 1당이 됐고, 민주당은 127석에 그쳤다.

우리나라만의 문제는 아니다. 세계 최대 여론조사 회사인 갤럽은 지난 6일 끝난 미국 대통령선거 예측에서 톡톡히 망신을 당했다. 갤럽은 마지막 여론조사에서 미트 롬니 공화당 후보가 버락 오바마 대통령(민주당)을 49% 대 48%로 앞선다는 결과를 발표했다.

롬니의 득표율을 너무 높게 예측한 것이다. 하지만 오바마는 득표율에서도 롬니에 앞서며 332명의 선거인단을 확보, 206명에 그친 롬니를 누르고 재선에 성공했다.

갤럽은 망신만 당했지만, 망한 곳도 있었다. ‘리터러리 다이제스트(The Literary Digest)’라는 미국 잡지사는 1936년 미국 대통령선거에서 공화당의 알프레드 랜던이 민주당의 프랭클린 루스벨트를 누를 것이라고 예측하고 대서특필했다. 하지만 61% 대 37%로 뉴딜정책을 내건 루스벨트가 승리했고, 잡지는 2년 뒤 폐간됐다.

여론조사가 이처럼 자주 틀리는 것은 수많은 함정을 갖고 있기 때문이다. 우선 조사업체 성향에 따라 결과 편차가 나올 수밖에 없다. 만나서 직접 묻는지, 전화로 하는지, 휴대폰은 포함하는지, 사람이 직접 묻는지, ARS(자동응답시스템)가 하는지에 따라서도 결과가 다르게 나올 수 있다. 실제 미국에서도 휴대폰을 조사 대상에 포함한 기관들의 오차는 평균 3.5%포인트로, 집전화만을 조사한 기관의 평균 오차 4.7%포인트보다 낮았다. 미국인 중 3분의 1이 집전화 없이 휴대폰만 사용 중이며 이들 중 상당수가 민주당 지지층인 흑인이거나 중남미계인 히스패닉이라는 게 이유다.

조사를 오전과 점심 저녁 중 언제 실시하는지도 결과에 영향을 미친다. 문구도 중요하다. “누구를 지지하는지” “누가 당선될 가능성이 높은지” “누가 당선이 돼야 한다고 보는지” 사이엔 많은 차이가 함축돼 있다.

윤희웅 한국사회여론연구소 조사분석실장은 “문구 하나와 단어 하나 때문에 결과가 바뀌기도 한다”고 했다. 문재인 민주통합당 대선 후보와 안철수 무소속 대선 후보가 단일화에 쓰일 여론조사 문구를 두고 치열한 협상을 벌였던 이유이기도 하다.

표본을 완벽하게 만들지 못하는 것도 원인으로 꼽힌다. 현재 진행되고 있는 여론조사의 응답률은 10%가 채 안 된다. 10통 전화하면 한 통도 대답을 제대로 못 듣는다는 것이다. 그러면 다시 전화를 해야 하는데 다른 사람으로 대체된다. 이러면 표본이 흔들린다. 여론조사를 잘못해 폐간된 미국 잡지도 자동차와 전화를 가진 잡지 구독자를 대상으로 했다.

조사 결과가 오차범위 내일 경우 사실상 의미가 없음에도 불구하고 어느 한쪽 손을 들어줘 그쪽으로 표가 몰리는 ‘밴드왜건 효과’를 낳기도 한다. 0.01%의 차이가 민의를 반영하는지는 더욱 의문이다. 역선택에 따른 조사 결과 왜곡 현상도 나타난다.

표본조사 샘플을 조작할 가능성도 배제할 수 없다. 실제 여론조사 전문가들은 조사기관이 표본을 추출하는 과정에서 특정 후보 지지자들을 샘플에 몰래 포함시키는 게 기술적으로는 어렵지 않다고 말한다. 2002년 단일화 때 노무현 후보에게 패한 정몽준 후보 측에서도 이런 의혹을 제기했던 것으로 알려졌다.

특정 표본이 과대포장될 우려도 있다. 연령과 지역별 응답자 비율이 실제 인구통계 비율에 미치지 못할 경우 일반적으로 가중치를 주는 방식으로 비율을 맞추기도 한다. 이때 해당 연령대 또는 지역의 경우 응답한 사람들만의 의견이 과대 포장돼 결과를 왜곡할 수 있다.

이런 여론조사의 한계 때문에 여론조사는 추세 등을 확인하는 데 그쳐야 한다는 지적이 많다. 이정희 한국외대 정치외교학과 교수는 “여론조사는 참조만 할 뿐이지 이를 통해 중대한 일을 결정하면 명백한 오류를 낳게 된다”며 “특히 야권 단일화와 같은 대통령 후보를 뽑는 일을 여론조사로 한다는 건 매우 적절하지 못하며 경우에 따라 지는 쪽에서 결과를 승복하지 못해 또 다른 혼란을 초래하는 일이 벌어질 수 있다”고 지적했다.

김재후 기자/신동열 한경 경제교육연구소 연구위원 hu@hankyung.com