이번 선거가 그랬다. 개인적으로 여론조사를 빙자한 여론조작의 움직임 속에 민주주의가 위협 당하는 위기까지 겪었다고 본다.
공식 선거운동을 일주일 앞둔 지난 4월 10일 아침이었다. 대선 후보로 거론되던 문재인, 안철수, 홍준표, 유승민, 심상정 후보 등 5자 구도 여론조사에서 처음으로 안철수 후보가 문재인 후보를 제치는 결과가 나왔다.
의뢰기관은 KBS·연합뉴스 공동이었고, 여론조사 기관은 코리아리서치였다. 결론부터 말하면 코리아리서치는 선관위로부터 이 여론조사에 대한 ‘공직선거법 위반’ 사유 등으로 1500만원의 과태료 처분을 받았다.
쉽게 설명하면, ‘비적격 비율’이란 통상 유·무선 전화로 실시하는 여론조사 과정에서 결번인 번호의 비율을 의미한다. 사업자 전화나 팩스 번호처럼 애초 여론조사에 적합하지 않는 번호들도 포함된다.
예를 들어 여론조사 기관에서 랜덤으로 번호를 설정해 1000통의 전화를 걸었다고 가정해보자. 일단 무작위로 추첨한 번호의 특성상 애당초 결번(주인이 없는 번호)인 번호들이 있다. 여론조사 기관은 1차적으로 이런 번호들을 제외하고 나서 전화를 받는 시민들을 상대로 여론조사를 시작하게 된다.
전문가들에 따르면 통상 여론조사에서 ‘비적격 비율’은 평균 40~50%에 달한다. 1000통이 전화를 걸면 그중 400~500통은 결번 등의 이유로 처음부터 연결이 안 되는 셈이다. 그런데 유독 이 여론조사에서만 비적격 비율이 10%대로 매우 낮았다. 1000통의 랜덤 전화번호 중에 100통만 없는 번호였을 뿐 900통이 유효한 번호였던 것이다.
이는 억세게 운이 좋았거나 아니면 원래 존재하는 번호에 걸었을 가능성이 높다. 물론 자연적으로도 아예 불가능한 건 아닐 것이다. 그럼에도 다른 여론조사와 달리 전화를 거는 족족 10개 중 9개를 맞췄다는 건 쉽게 납득할 수 있는 상황은 아니다.
대선을 한 달 앞두고 소위 문·안 양자구도라는 프레임 싸움이 치열하던 시점에, 안철수 후보가 다자 구도에서 1위로 올라선 첫 여론조사의 비적격 비율이 이례적은 낮은 수치인 것을 그저 우연으로만 치부할 수 있을까. 대선도 끝난 마당에 특정 음모론을 제기하려는 게 아니다. 여론조사의 신뢰도를 일반 상식의 관점에서 평가해보자는 의미다.
다시 말하지만, 이번 대선에서 만큼 여론조사에 전 국민이 촉각을 곤두세운 적은 없었다. 전직 대통령의 탄핵이라는 국면에서 펼쳐진 탓인지 몰라도, 예외적으로 지역구도가 흔들리면서 처음으로 영·호남 모두에서 전략투표 움직임이 보였기 때문이다.
문 후보와 안 후보 사에에선 특히 안 후보의 지지율이 급상승하면서, 일시적이나마 보수의 대안을 찾는 대구·경북의 표심이 안 후보에게 더 몰리기도 했다. 이후 TV토론 등을 거치며 안 후보의 지지율이 하락하긴 했지만, 만일 두 후보가 박빙인 여론조사 수치가 지속적으로 나왔다면 결과는 장담할 수 없었을 것이다.
여론조사의 학문적 기반은 통계학이다. 세상에 흩어져 있는 수많은 현상을, 극소수 표본을 이용해 ‘수치’로 도출하는 통계학은 매력적이다. 여론조사에서 쓰는 통계학은 물리적으로 전체를 표본으로 잡을 수 없기에, 다시 말해 짧은 시간에 전 국민에게 전화를 돌릴 수 없기 때문에 소수의 집단을 표본으로 잡는다. 이 과정에서 뜬금없이 다수의 여론조사 기관이 수년간 쌓은 노하우를 벗어나 다른 추출 방식을 사용한다면 과연 신뢰할 수 있을까.
이번 대선을 취재하면서 그저 여론조사라면 덮어놓고 믿는 행태가 오히려 여론조작의 시작점이 될 수 있단 사실을 깨달았다. 그런 의미에서 마크 트웨인의 명언을 모든 유권자들에게 들려주고 싶다. ‘거짓말에는 세 종류가 있다. 거짓말(Lie), 새빨간 거짓말(Damned Lie) 그리고 통계(Statistics)다.’