어느 고등학교 3학년 학생들의 영어성적이 있다고 하자.

이 성적에서 우리가 제일 먼저 관심을 갖는 것은 학생들의 영어성적이 어떤
점수를 중심으로 모여 있느냐는 것이다.

평균은 바로 데이터의 모여 있는 특성을 나타내는 대표값이다.

평균소득 평균기온 평균키 평균강우량 평균가격 등과 같이 대부분의 데이터
는 평균화돼 우리에게 주어진다.

그래서인지 사람들은 많은 숫자를 대할 때 우선 "평균이 얼마냐"라고 자연
스럽게 묻는다.

그러나 문제는 평균에는 여러 가지가 있고 경우에 따라서는 각 종류에 값이
다를 수가 있다.

따라서 누구나 자기에게 유리한 평균값을 선택함으로써 얼마든지 자기 주장
을 번지르르하게 포장할 수 있다.

여러 종류의 평균중에서 우리가 주로 사용하는 것은 산술평균, 중앙값,
최빈수등 세가지다.

이 가운데 산술평균은 가장 많이 쓰이는 개념이다.

그래서 그냥 평균이라고 불리기도 한다.

산술평균은 모든 자료의 값을 다 더해서 전체 수로 나눈 것이다.

중앙값은 문자 그대로 가운데에 위치한 수.

숫자들을 순서대로 배열했을 때 정 가운데의 값을 말한다.

최빈수는 가장 흔하게 나타나는 값이다.

영어 성적, 몸무게, 키 등과 같은 수치들은 좌우 대칭의 종 모양 분포(정상
분포 혹은 정규분포라고 함)를 한다.

이런 경우엔 산술평균, 중앙값, 최빈수가 모두 일치한다.

그러나 종모양의 분포를 하지 않는 경우에는 평균의 종류에 따라 값이
다르게 된다.

평균에 따라 값이 다르면 자기에게 유리한 평균값을 선택함으로써 얼마든지
자기 주장을 번지르르하게 할 수 있고 수맹인 사람들은 대부분 그 주장에
속게 된다.

노사문제를 겪고 있는 회사에서 사장이 주장하는 회사원들의 평균 임금은
2백50만원이지만 노조 측이 주장하는 평균 임금은 1백만원인 경우가 있다.

왜 이런 차이가 날까.

사장은 보수가 높은 경영층의 월급을 포함한 산술평균을 사용하고 노조측은
가장 많은 근로자들이 받는 봉급인 최빈수를 평균으로 사용하기 때문이다.

지난 94년 미국의 프로야구는 선수들의 파업으로 월드시리즈가 취소되는 등
8개월에 걸친 구단주와 선수노조간 싸움이 벌어졌다.

여론을 등에 업고자 하는 이 싸움에서 구단주들의 주장은 간단했다.

"평균 연봉이 1백20만달러나 되는 선수들이 파업을 한다"고 떠벌림으로써
엄청난 소득을 올리는 선수들이 돈 욕심을 부리는 것이라는 팬들의 비난을
자연스럽게 유도하려고 했다.

그 당시 약 7백명 정도가 되는 메이저 리그 선수들의 평균연봉 분포를 보면
산술평균은 1백20만달러지만 중앙값은 그보다 훨씬 낮은 40만달러였다.

더욱이 최빈수는 30만달러에 불과했다.

구단주들이 산술평균을 사용한 의도는 짐작이 가지만 이런 분포에서
산술평균인 1백20만달러는 중심을 나타내는 대표값으로서 합당하지 않다.

중앙값인 40만달러를 사용하는 것이 적절할 것이다.

반면 노조 입장에서는 최빈수인 30만달러가 가장 유리한 수치다.

결론적으로 노조는 산술평균을 이용한 구단주들의 작전에 말려들고 말았다.

만일 노조지도자들이 평균에 대해서 조금만 알았더라도 반격할 수 있는
방법을 쉽게 생각해 냈을 것이다.

김진호 < 국방대학원 교수 gemkim@hanmail.net >


( 한 국 경 제 신 문 1999년 3월 5일자 ).