본문 바로가기

저널리즘 따라잡기/기타

지방선거 여론조사방법의 문제점과 개선 방안

(이글은 한국언론진흥재단의 '신문과 방송'에서 가져온것 입니다)


지방선거 여론조사방법의 문제점과 개선 방안

시간ㆍ예산ㆍ표본 수 모두 부족,

언론사 공동조사가 대안


이강형/ 경북대 신문방송학과 교수



제6회 전국동시지방선거를 앞두고 중앙과 지역 언론사들은 올해 초부터 지방선거 후보군에 대한 여론조사를 실시해 결과를 발표해오고 있다. 선거 여론조사는 언론의 선거보도에 있어서 상당한 비중을 차지하고 있고, 유권자의 의사결정에도 중요한 영향을 미친다. 선거 시기에 언론사가 직접 수행하는 여론조사가 급속하게 늘기 시작한 것은 서구의 경우 1970년대 이후부터이다. 그 이유는 여론조사 기술이 비약적으로 발전하면서 언론이 객관성 규범에 따라 균형을 이루고 편파적이지 않은 과학적인 정보를 전달할 수 있다는 믿음을 가지고 있었기 때문이다. 우리나라의 경우 선거 여론조사는 1987년 제13대 대통령 선거에서 처음 시도됐다. 이후 지금까지 대통령 선거와 지방자치단체장 선거 및 국회의원 선거에서 후보 지지도 조사와 선거 예측조사가시행돼 왔다.


최근 10년 동안에는 대통령 선거를 비롯한 각종 선거에서 여론조사를 통해 정당의 후보를 공천하는 것이 관례가 될 만큼 선거과정에서 여론조사가 차지하는 비중이 커졌다. 특히, 2002년 제16대 대통령 선거에서의 새천년민주당 후보 단일화 과정, 2007년 제17대 대통령 선거에서의 한나라당 후보 경선 과정에서 여론조사의 위력을 실감할 수 있었다.



여전히 개선 필요한 ‘RDD & 휴대전화’ 표본추출

그러나 그동안의 여론조사를 살펴보면 비중이 커진 만큼 문제점 또한 다양한 측면에서 노출됐다. 후보지지율 조사의 경우, 비근한 예로 지난 2010년 제 5회 전국동시지방선거만을 보더라도 서울시장 선거에서 각종 여론조사는 오세훈 후보가 한명숙 후보에 대해 15~25% 포인트까지 앞선다는 결과를 내놓았지만 실제 결과는 0.6% 포인트 차이에 불과했다. 이러한 오류는 과학적인 조사를 위해 고려해야 할 다양한 기준들을 제대로 지키지 못했기 때문에 나타나는 결과라고 할 수 있다. 대통령 선거와 달리 이번 지방선거는 세종시를 포함한 17개 광역단체장, 226개 기초자치단체장 등 선거단위의 규모가 작은 반면 그 수는 많기 때문에 전국을 대상으로 하는 여론조사의 경우 투여되는 시간과 비용이 만만치 않은 것이 사실이다. 따라서 여론조사 과정에서 나타나는 여러 가지 문제들을 신중하게 고려해야 할 필요가 있다. 그동안의 지방선거 여론조사에서 노출된 문제점을 몇 가지 측면에서 살펴보면 다음과 같다.


먼저 표집틀의 문제이다. 지난 2010년 지방선거 당시 행해진 여론조사 대부분은 KT 전화번호부를 이용하여 표본을 추출했다. KT 전화번호부는 집 전화만 해당되고 인터넷 전화도 제외되어 있어 모집단 자체의 절반도 반영하지 못하는 것이 사실이다. 그리고 실제로 여론조사가 행해지는 요일이나 시간대에는 재택률이 매우 낮기 때문에 조사에서 체계적으로 배제되는 계층이 발생할 수 있다. 예를 들어, 2004년 통계청에서 실시한 생활시간 조사결과를 보면 평일 오전 10시부터 오후 4시 이전까지는 재택률이 30% 이하이고 오후 6시가 넘어서면 40% 수준으로 높아지고 있다. 


또한 2010년 지방선거 당시 메트릭스 조사회사가 서울・경기지역 유권자를 대상으로 실시한 실험조사 결과를 보면, 여성의 경우 평일에는 사무직 응답자의 비율이 13.2%이었지만 휴일에는 21.8%로 증가했고, 전업주부 응답자의 비율은 평일 57.5%에서 휴일에는 50.3%로 감소했다. 특히, 20대 전업주부의 경우 그 비율이 평일 조사에서는 22.9%인데 반해 휴일조사에서는 3.3%

로 응답자 특성에 차이가 나타났다. 결국 조사시간대에 따라 특정 직업군에 편향된 조사결과를 얻게 되는 것이다. 이는 남성의 경우에도 마찬가지일 것으로 예상된다. 이러한 문제점을 보완하기 위한 방안들이 조사회사별로 다양하게 시도되고 있지만 선거조사의 경우 단기간에 대규모로 조사가 이루어지는 경우가 많기 때문에 어려운 점이 많다(조성겸 외, 2007).


최근 조사회사들은 KT 전화번호부를 이용한 표본 추출의 단점을 보완하기 위해 RDD(RadomDigital Dialing, 지역별 국번만 주입하고 나머지 번호를 컴퓨터가 자동으로 생성해 무작위로 전화를 거는 방식)와 휴대전화를 이용한 표본추출 방식을 집 전화 추출과 병행하고 있다. 이는 집 전화로 추출할 수 없는 활동성이 강한 20, 30대 화이트칼라들을 추출하는데 매우 유용하다. 여론조사에 있어서 가장 핵심적인 사항이 모집단을 대표하는 표본을 추출하는 것이라는 점을 감안해 볼 때 RDD와 휴대전화를 이용한 표본추출은 매우 진일보한 방식이라고 할 수 있다. 그러나 실제로 휴대전화의 경우 집 전화와 달리 개인정보 보호 차원의 법적 제한 등으로 휴대폰 사용자 대상의 전면적인 조사를 할 수가 없고, 지역 식별자 또한 줄 수 없기 때문에 RDD 방식으로 표본을 추출할 수 없는 난점이 있다. 현재 대부분의 조사회사들이 기존에 구축된 휴대전화 데이터베이스를 이용하고 있는데, 이는 KT 전화번호부를 이용한 표본추출보다 훨씬 더 개선된 방식이지만 여전히 모집단을 대표하는 문제는 남아 있다. 이를 보완하기 위한 혼합 디자인을 개발할 필요가 있다.





응답률 1%대 ARS 조사

두 번째, ARS(Automated Response Survey) 조사방식의 문제이다. 전화면접 조사는 비용이 많이 들기 때문에 재정상황이 열악한 지역 언론사나 인터넷 언론들은 상대적으로 비용이 적게 드는 ARS 방식을 통해 선거 여론조사를 실시하고 있다. 그러나 ARS 조사는 면접원 없이 녹음된 질문에 응답자 스스로 답을 하기 때문에 응답 자료의 신뢰성을 검증할 방법이 없다. 예를 들어, 성별이나 연령대와 같은 최소한의 정보를 확인할 방법이 없고 응답내용의 성실성(장난 응답, 번호를 잘못 눌렀을 경우 등) 또한 담보되어 있지 않다.


보통 조사가 표본의 대표성을 담보하기 위해 전국인구센서스 결과에 근거하여 성, 연령, 지역 3개 변수의 인구 구성비를 산출하고 이 비율에 맞게 표본을 구성한다는 점을 감안해 볼 때, 성이나 연령대와 같은 최소한의 정보에 대한 신뢰성이 확보되지 않은 ARS 방식은 상당히 문제가 많다. 또한 면접원의 안내 설명이나 추가 질문과정 없이도 조사에 응할 정도의 응답자라면 이미 상당한 정치적 관심과 의도를 가진 사람일 가능성이 크기 때문에, 특정 계층의 응답이 과다 표집될 가능성 또한 배제할 수없다.


실제로 2010년 지방선거의 경우 ARS 방식과 전화면접으로 조사한 결과에는 상당한 차이가 있었고, 실제 투표결과와도 상당한 거리가 있었다. 따라서 ARS 방식을 통한 여론조사 결과를 발표할 경우 언론사는 아무런 검증장치 없이 있는 그대로 보도 할 것이 아니라 상당히 신중을 기할 필요가 있다. 세 번째, 조사응답률의 문제이다. 대부분의 전화여론조사는 단순무작위추출이나 무작위 층화추 출방법이 아닌 할당 추출방법을 적용하고 있다. 이는 전체 응답자 구성을 미리 파악하여 조사에 참여할 응답자 수를 사전에 지정하고, 목표로 한 해당 응답자 수를 조사자가 채우는 과정에서 시간과 경비등의 이유로 최종 응답자 선정과정을 조사자가 편의대로 정하여 대체하는 방법이다. 층화추출방법은 표본할당 후 실제 조사가구를 무작위로 선정한 대상을 조사자 임의대로 대체하지 않고 최대한 조사 응답을 받아냄으로써 특정 성향의 응답자들(예를 들면 정치적 관심이 많거나 다수의견에 소속되어 있다고 판단하여 자신 있게 자신의 의견을 표명하고자 하는 사람)이 과다 표집되고 그렇지 않은 사람이 과소 표집 될 가능성을 줄일 수 있는 반면 할당 표집은 그렇지못하다.


최초 선정된 가구(응답자)를 임의로 대체할 때에는 응답률의 문제가 제기된다. 전화조사의 경우 대부분이 응답률이 10% 내외 정도이고 ARS의 경우 응답률은 거의 1~2%밖에 안 나오는 경우가 많다. 응답률이 어느 정도 되어야 표본의 대표성이 확보되는지에 대해서는 조사 전문가들마다 의견을 약간씩 달리하지만, 낮은 응답률은 표본의 대표성을 훼손시킬 우려가 있기 때문에 가능한 한 응답률을 높이도록 노력해야 한다. 따라서 초기 접촉에서 비수신, 통화중, 응답자 부재 등의 이유로 실패했더라도 계속해서 접촉을 시도하는 것이 바람직하다.



너무 많은 선거구, 부족한 표본 수

네 번째, 하위 표본 수의 확보와 해석의 문제이다. 지방선거는 선거구 단위 수가 상당히 많은 것이 특징이다. 서울시만 하더라도 기초자치단체장 선거구가 무려 25개이고, 시・도의회의원 선거구 96개, 구・시・군의회의원 선거구가 159개에 달한다. 언론사들은 이 모든 선거구를 개별 표집틀로 두고 표본을 추출하기에는 시간과 경비가 너무 많이 들기 때문에 대부분 광역자치단체장과 기초자치단체장 선거에만 관심을 갖는다. 이러한 경우 대부분 서울시 유권자를 하나의 표집틀로 두고 구별 인구비례 할당 표집을 한 다음, 광역자치단체장 및 기초자치단체장 후보 지지율 조사결과를 발표한다.


여기서 기초자치단체장의 경우처럼 한 여론조사의 하위 표본을 따로 떼어서 분석할 경우 표본의 수가 작아지고 오차의 범위는 더 넓어질 수 있다. 따라서 이러한 하위 표본의 분석은 늘 신중을 기해야 하며 결과 분석에 있어 오차의 한계가 더 커진다는 것을 명심해야한다. 하나의 큰 표집틀을 기준으로 실시된 여론조사 결과를 선거구별로 나누어 이야기하거나 특정 층의 반응을 해석할 경우 사례 수가 얼마나 되는가를 꼭 파악할 필요가 있다. 하위 표본의 사례 수는 고려하지 않고 단순하게 %만을 제시할 경우 유권자들을 현혹시킬 가능성이 많다. 결국 지방선거에서와 같이 선거구가 많을 경우 각 선거구를 대표하기 위해 충분한 사례 수가 포함될 수 있도록 표집 설계를 하는 것이 가장 바람직하다고 할 수 있다.


마지막으로 여론조사 의제 선정의 문제이다. 선거기간 동안 언론사가 행하는 여론조사의 대부분은 어떤 후보가 얼마나 지지를 받고 있는가에 치중하고 있다. 즉, 선거 초반, 중반, 그리고 선거가 임박한 시점 등 일정한 간격을 두고 단순한 후보지지율의 변화를 조사한다든가, 지지율의 변화에 영향을줄 만한 어떤 사건이 터졌을 경우나 어떤 쟁점이 선거 판세에 중요한 영향을 미친다고 여겨질 경우에만 여론조사가 이루어진다. 어느 후보가 앞서고 있느냐에 치중하는 여론조사와 보도는 궁극적으로는 유권자들의 현명한 의사결정에 큰 도움이 되지 않는다. 오히려 선거상황에서 유권자들이 궁극적으로 관심을 갖고 있는 의제들이 무엇인지를 알아보고, 실제로 유권자들에게 꼭 필요한 쟁점의제들을 발굴하여 각 후보나 정당의 입장이 무엇인지를 비교하기 위한 여론조사가 더 의미가 있다. 


진정한 의미의 여론조사는 유권자들에게 사안이 가지는 의미가 무엇이고, 어떠한 정치적 견해나 이해관계와 얽혀 있는가를 충분히 숙의하고 토론할 기회를 마련해주는 계기로서 기능하는 것이라고 할 수 있다. 이를 위해서 각 언론사는 단기적인 관점에서 일회성으로 여론조사를 실시할 것이 아니라 장기적인 관점에서 시간을 두고 선거 캠페인이 시작되기 이전에 여론 조사의 시기와 의제 등을 사전에 기획하는 작업이필요하다.



언론사 공동조사 추진해야

종합해 보자면, 선거 여론조사의 정확도와 사회적 신뢰도가 높아지기 위해서는 표집틀, 조사방법, 조사응답률 등 표집과정에서 나타나는 제반 문제점들을 개선할 필요가 있다. 지방선거는 선거구가 하나인 대통령 선거와는 달리 선거구가 상당히 많기 때문에 선거구별 또는 지역별 여론을 제대로 파악하기 위해서는 상당한 시간과 경비가 들어간다. 따라서 개별 언론사가 자체적으로 여론조사를 실시하기 보다는 공동으로 경비를 출자해서 규모가 큰 체계적인 조사를 실시하는 것이 조사의 질과 공정성을 높일 수 있다. 특히 여론조사에 큰 돈을 투자하기 어려운 지역 언론사들에게는 공동조사의 필요성이 더욱 절실하다고 볼 수 있다.