상단여백
HOME 학술
통계를 보는 눈
  • 하수민 기자
  • 승인 2017.04.17 08:00
  • 호수 615
  • 댓글 0

 

“세상에는 세 가지의 거짓말이 있다. 첫 번째는 그럴듯한 거짓말, 두 번째는 새빨간 거짓말, 세 번째는 통계다” 이 말은 벤저민 디즈레일리 전 영국 총리가 한 말이다. 실제로 사람들은 정확한 수치를 활용해 주장을 내세우면 반박하지 못하고 쉽게 수긍한다. 이러한 숫자가 갖는 설득력을 잘 아는 사람들은 자신의 의견을 피력할 때 숫자를 활용한다. 하지만 이 수치들은 어떠한 근거도 없는 어림수인 경우가 많아 굉장히 위험하다.

그렇다면 어떤 방식으로 우리의 을 속일까.

 

평균값으로 속이기

‘평균값’은 자료의 중심성향을 나타내는 수다. 때문에 ‘평균값’이라는 단어의 의미는 매우 모호하다. 또 평균값에는 산술평균, 중앙값, 최빈값 등 여러 가지가 있다. 어떤 종류의 평균값인지, 즉 산술평균값인지 중앙값인지 최빈값인지 이 중 어느 것을 말하는지 알기 전에는 그 어떤 평균도 아무런 의미가 없다. 한 가지 예를 들어 살펴보자.

A지역 주민이 자신의 지인에게 소개할 때는 A지역 주민들의 평균소득이 대략 1억 정도 된다고 말한다. 하지만 납세자대책위원회의 한 위원으로 A지역의 세율 인하를 위해 청원서를 돌리고 있는 사람은 A지역 주민들의 평균소득이 2천만 원 밖에 되지 않는다고 말한다. 동일한 자료, 동일한 주민들, 동일한 소득을 토대로 계산한 평균소득인데 왜 두 값의 차이가 엄청날까? 이는 지인에게 소개할 때 말하는 평균은 산술평균이고, 납세자대책위원회의 위원이 말하는 평균은 중앙값이기 때문이다. 아래 주어진 자료에서 산술평균, 중앙값, 최빈값을 구하는 법을 살펴보자.

2,4,5,4,8,5,8,5,5,10

산술평균값: 자료값의 총합/자료의개수

2+4+5+4+8+5+8+5+5+10 /10=5.6

중앙값: 크기 순서대로 나열해 한가운데 있는 값

크기순으로 나열하면 2,4,4,5,5,5,5,8,8,10 이므로 중앙값은 5다.

최빈값: 가장 많이 등장하는 값

2가 한 번, 4가 두 번, 5가 네 번, 8이 두 번, 10이 한 번이므로 최빈값은 5다.

따라서 지인에게 말한 1억 원이라는 큰 값은 사실상 산술평균값으로, 마을에 거주하는 모든 세대의 소득의 합을 전체 세대수로 나눠 얻은 값이다. 그러나 세금 인하를 위해 사용한 2천만원이라는 작은 수는 중앙값으로 전체 세대의 절반은 2천만 원 이상의 소득을 올렸고 나머지 절반은 그 이하의 소득을 올렸다는 사실을 말한다. 이처럼, 사람들은 상황에 따라 자신에게 유리한 종류의 평균값을 사용해 우리의 눈을 속인다.

표본으로 속이기

어떻게 표본을 추출하는지에 따라서도 우리의 눈을 속일 수 있다. 예를 들어, 아시아 유학생들이 유럽 현지 학생들보다 성적이 높고 수학, 통계에서 뛰어난 실력을 과시한다고 한다.

하지만 이는 표본 추출의 오류이다. 표본이란 모집단을 대표하는 집단으로 연구에 실제 참여하는 집단을 말한다. 이 예시에서 표본은 유학생과 현지 학생인데 두 표본은 확연한 차이가 난다.

유학생들이 현지에 오기까지의 과정을 생각해보면, 치열한 경쟁을 뚫고 현지 언어능력 검증을 위해 엄청난 노력을 했을 것이다. 표본으로 추출한 유학생들은 엘리트층 학생이고 현지인들은 일반인 학생이다. 따라서 그 학생들과 현지의 평균 대학생을 비교하는 행위는 불공평하다. 정말 공평한 비교를 원한다면 비슷한 그룹끼리 비교해야 한다.

즉, 아시아 일반학생과 유럽의 일반학생을 비교한 후에 아시아 출신 학생들이 더 성실하고 영리하다고 말해야 납득이 된다.

또한 특정 대학 졸업생들의 취업률에 관련된 설문에서도 표본추출을 활용한 눈속임이 발생한다. 특정 대학 졸업생들에게 실제로 설문조사를 했더니 그 중 대다수가 학위를 취득한 지 얼마 되지 않아 보수가 좋은 직장을 구했다고 대답했다고 한다. 취업에서 실패를 경험한 사람이라면, 그런 얘기를 들을 때마다 온몸에 힘이 쫙 빠질 것이다. ‘다들 졸업하자마자 직장을 구하는데 왜 나만 이런 걸까’, ‘나한테 무슨 문제가 있는 걸까’하며 낙담할 것이다. 하지만 이는 취업을 못하는 사람이 문제가 아닌 표본추출의 문제다.

구직에 성공한 졸업생들은 기꺼이 설문에 응했을 반면, 구직활동을 하느라 시간도 없고 기분도 나쁜 졸업생들은 설문지를 받자마자 휴지통에 구겨 넣었을 것이다.

따라서 응답자의 대부분이 취직을 한 사람이므로 표본추출이 잘못됐다는 것이다. 이러한 사례는 동창회에서도 관찰된다. 졸업한 지 10년 혹은 20년 뒤에 열리는 동창회에 참석하는 이 중 취업에 실패한 사람, 이혼한 사람, 불치병을 앓고 있는 사람 등은 드물기 때문에 모두 잘살고 있다는 착각에 빠지게 한다.

하지만 제대로 된 통계를 원한다면 그 자리에 참석하지 않은 사람의 상황도 파악해야 한다. 또 설문조사 시 자신에게 유리한 부분만 언급하는 사람이 있다는 점도 충분히 고려해야 한다.

외에도 정확해 보이는 백분율을 사용해 부정확함의 악취를 감추기도 하고, 소수 등 쓸데없이 정확한 숫자로 그럴듯하게 보이도록 한다. 또 대상 기간 늘리기, 대상의 정의를 다르게 하기, 분야를 최대한 쪼개기, 순위 매기기, 정곡을 피해 가는 수치를 제시해 관심 돌리기 등 여러 가지 눈속임으로 그 뒤에 숨은 진실을 감춘다.

수치말고도 통계에 사용되는 그래프나 그림으로 눈속임이 가능하다. x축이나 y축을 과감하게 절단한 뒤 일부만 보여주거나, 눈금과 눈금 사이의 거리를 엿가락처럼 늘리거나, 파이 그래프의 일부를 2배, 4배 정도 늘리거나, 완만한 곡선을 마치 로켓포를 쏘아 올린 것처럼 과장하는 수법을 사용한다. 어떻게 하면 이러한 속임수에 속지 않고 통계를 잘 활용할 수 있을까?

왜곡된 통계를 찾아라

어떤 실험실에서 무엇인가를 검증하였다면, 자신이 주장하는 이론의 완벽성을 과시하기 위해서인지, 또는 명예를 위해서인지 알아볼 필요가 있다. 신문의 경우에는 그 목적이 바람직한 기사를 내기 위해서인지 아니면 다른 목적이 있는지 잘 살펴볼 필요가 있다. 또 일부러 애매하게 표현하거나 유리한 데이터만 골라 써 자신에게 유리한 쪽으로 몰고 가는지, 측정 단위를 슬쩍 뒤바꿔놓았는지 확인해야한다.

조사방법에 주의해라

표본의 추출방법이 부적당했던 것은 아닌지 또는 조사하는 과정에서 나온 몇 개 안 되는 표본을 그대로 사용한 것은 아닌지를 따질 필요가 있다. 또한 표본이 신뢰할 만한 결론을 얻을 만큼 충분히 큰지, 상관관계가 정말 의미 있는지도 살펴봐야 한다.

숨겨진 자료를 찾아라

표본의 크기가 얼마인지 항상 알려 주지는 않는다. 이런 숫자가 쓰여져있다면 그 통계나 조사 전체에 대해 의심해 볼 필요가 있다. 또 신뢰도에 관한 자료(확률 오차, 표준편차)가 빠져 있는 상관관계는 심각하게 여길 필요가 없다. 때때로 백분율만 발표하고 실제 숫자는 빠져 있는 경우도 있는데, 이것도 일종의 눈속임이다.

쟁점 바꿔치기에 주의해라

통계를 분석할 때, 그 기초가 된 데이터와 결론 사이에 어떤 바꿔치기가 있었는지 주의해야 한다. 발표된 통계자료가 데이터와 전혀 다른 것으로 둔갑해 발표되는 경우가 많기 때문이다.

어떤 병의 환자 수가 많이 보고됐다고 해서 실제 그 병이 더 많이 발병했다고 말할 수 없고, 여론조사에서 이긴다고 반드시 실제 선거에서도 당선된다고 할 수 없다. 또, 독자 여론조사 결과 독자들이 국제문제에 관한 기사에 흥미를 보이고 있다고 해서 실제로 그러한 기사를 다음 호에 실어도 독자들이 읽는다는 보장도 없다. 또한 전후관계를 인과관계로 바꿔치기하는 수법도 있어 주의해야한다.

상식적으로 생각해라

증명되지도 않은 가정을 토대로 장황하게 이야기가 전개될 때 ‘상식적으로 말이 되는 이야기인가?’와 같은 질문은 통계숫자를 과대평가하지 않고 제대로 파악할 수 있게 해주는 역할을 한다.

또한 현재까지의 추세가 사실일지라도 미래에 대한 경향은 어디까지나 추측이다. 그러니 추측 이외에 아무 것도 아니라는 것을 항상 염두에 둬야한다.

선거가 앞으로 다가오면서 매일 밤 뉴스를 통해 우리에게 전달되는 통계수치가 늘고 있다. 하지만 우리는 이 수치를 여과없이 받아들이면 안 된다. 통계전문가는 우리를 속일 수 있을 만큼 통계에 대해 잘 알기 때문에, 오히려 통계전문가가 내놓은 수치를 의심해 봐야한다. 위에서 알려준 방법을 활용해 이제는 그들의 눈속임에 속지말자.

<저작권자 © 창원대신문, 무단 전재 및 재배포 금지>

하수민 기자의 다른기사 보기
icon인기기사
기사 댓글 0
전체보기
첫번째 댓글을 남겨주세요.
여백
여백
여백
Back to Top