[민세진 교수의 경제학 톡] (56) 상관관계와 인과관계
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
민세진 < 동국대 경제학 교수 sejinmin@dongguk.edu >
지난주 행복과 소득의 관계에 대한 연구 결과를 소개했다. 결론은 소득이 높을수록 행복 수준이 높은 경향이 있다는 것이었다. 하지만 이것이 소득이 높으면 행복하다는 것을 의미하지는 않는다. 언뜻 헷갈리는 이런 표현의 차이는 상관관계와 인과관계의 차이 때문에 생긴다.
수학에서 상관관계(correlation)란 한 변수가 증가하거나 감소함에 따라 다른 변수가 같은 방향이나 반대 방향으로 증감할 때 두 변수의 관계를 말한다. 두 변수가 같이 증가하거나 감소하면 양(+)의 상관관계, 두 변수가 반대 방향으로 움직이면 음(-)의 상관관계에 있다고 한다.
인과관계(causality)란 두 개의 사실이 원인과 결과의 관계에 있을 때를 말한다. 경제학을 포함한 많은 사회과학 분야에서 사회 현상의 인과관계를 규명하기 위해 노력하고, 규명된 관계를 바탕으로 더 나은 사회를 위한 제안을 한다. 요즘은 컴퓨터 발달에 힘입어 인과관계 규명에 데이터를 많이 활용하는데 문제는 데이터 분석에서 밝힐 수 있는 것은 상관관계뿐이라는 것이다.
물론 누군가 ‘소득이 높으면 행복하다’고 추측한다면 우선 소득과 행복 수준이 양의 상관관계에 있는지 검증해야 하는 것은 맞다. 인과관계에 있는 변수들에 상관관계가 없을 리가 없기 때문이다. 하지만 양의 상관관계를 확인했다고 해서 소득이 높으면 행복하다고 주장할 수 있는 것은 아니다.
상관관계만으로 인과관계를 유추하는 게 올바르지 않은 예를 살펴보자. 예컨대 인구 10만명당 경찰 수가 많을수록 범죄 건수가 많은 통계가 나온 적이 있다. 이러한 상관관계에서 ‘경찰이 많으면 범죄가 더 많이 발생한다’고 유추하거나, 더 나아가 ‘범죄를 줄이려면 경찰 수를 줄여야 한다’고 주장한다면 잘못일 것이다. 오히려 범죄율이 높아서 더 많은 경찰이 그 지역에 배치됐을 것이라고 추측하는 것이 타당하다.
상관관계가 인과관계와 무관한 경우도 종종 있다. 예를 들어 연간 맥주 소비량과 영아 사망률 추이를 보면 음의 상관관계가 나타난다. 하지만 ‘맥주를 많이 마시면 영아 사망률이 감소한다’거나, ‘영아 사망률이 감소하면 맥주 소비가 증가한다’고 유추하는 것 모두 타당하지 않다. 이 경우에는 두 가지 현상을 동시에 설명할 수 있는 제3의 원인, 가령 1인당 국민소득의 증가 같은 것을 탐구해야 한다.
인과관계 추론이 중요한 이유는 어떤 문제를 해결하기 위해서는 원인을 알아야 하는 경우가 많기 때문이다. 하지만 복잡한 사회에서 인과관계가 분명한 경우는 흔치 않다. 데이터를 통해 상관관계를 확인하는 것이 도움이 되지만 오히려 엉뚱한 인과관계를 유추할 위험도 없지 않다. 중요한 것은 데이터로 뒷받침되는 것처럼 보이는 인과관계에 대한 다른 사람들의 주장에 쉽게 휘둘리지 않는 것이다. 데이터가 넘쳐나는 시대, 조심하고 분별하는 판단력 역시 더욱 필요한 것 같다.
민세진 < 동국대 경제학 교수 sejinmin@dongguk.edu >
수학에서 상관관계(correlation)란 한 변수가 증가하거나 감소함에 따라 다른 변수가 같은 방향이나 반대 방향으로 증감할 때 두 변수의 관계를 말한다. 두 변수가 같이 증가하거나 감소하면 양(+)의 상관관계, 두 변수가 반대 방향으로 움직이면 음(-)의 상관관계에 있다고 한다.
인과관계(causality)란 두 개의 사실이 원인과 결과의 관계에 있을 때를 말한다. 경제학을 포함한 많은 사회과학 분야에서 사회 현상의 인과관계를 규명하기 위해 노력하고, 규명된 관계를 바탕으로 더 나은 사회를 위한 제안을 한다. 요즘은 컴퓨터 발달에 힘입어 인과관계 규명에 데이터를 많이 활용하는데 문제는 데이터 분석에서 밝힐 수 있는 것은 상관관계뿐이라는 것이다.
물론 누군가 ‘소득이 높으면 행복하다’고 추측한다면 우선 소득과 행복 수준이 양의 상관관계에 있는지 검증해야 하는 것은 맞다. 인과관계에 있는 변수들에 상관관계가 없을 리가 없기 때문이다. 하지만 양의 상관관계를 확인했다고 해서 소득이 높으면 행복하다고 주장할 수 있는 것은 아니다.
상관관계만으로 인과관계를 유추하는 게 올바르지 않은 예를 살펴보자. 예컨대 인구 10만명당 경찰 수가 많을수록 범죄 건수가 많은 통계가 나온 적이 있다. 이러한 상관관계에서 ‘경찰이 많으면 범죄가 더 많이 발생한다’고 유추하거나, 더 나아가 ‘범죄를 줄이려면 경찰 수를 줄여야 한다’고 주장한다면 잘못일 것이다. 오히려 범죄율이 높아서 더 많은 경찰이 그 지역에 배치됐을 것이라고 추측하는 것이 타당하다.
상관관계가 인과관계와 무관한 경우도 종종 있다. 예를 들어 연간 맥주 소비량과 영아 사망률 추이를 보면 음의 상관관계가 나타난다. 하지만 ‘맥주를 많이 마시면 영아 사망률이 감소한다’거나, ‘영아 사망률이 감소하면 맥주 소비가 증가한다’고 유추하는 것 모두 타당하지 않다. 이 경우에는 두 가지 현상을 동시에 설명할 수 있는 제3의 원인, 가령 1인당 국민소득의 증가 같은 것을 탐구해야 한다.
인과관계 추론이 중요한 이유는 어떤 문제를 해결하기 위해서는 원인을 알아야 하는 경우가 많기 때문이다. 하지만 복잡한 사회에서 인과관계가 분명한 경우는 흔치 않다. 데이터를 통해 상관관계를 확인하는 것이 도움이 되지만 오히려 엉뚱한 인과관계를 유추할 위험도 없지 않다. 중요한 것은 데이터로 뒷받침되는 것처럼 보이는 인과관계에 대한 다른 사람들의 주장에 쉽게 휘둘리지 않는 것이다. 데이터가 넘쳐나는 시대, 조심하고 분별하는 판단력 역시 더욱 필요한 것 같다.
민세진 < 동국대 경제학 교수 sejinmin@dongguk.edu >