INTRO
선진국 반열에 들어서고 있는 대한민국은 종종 행복지수가 매우 낮은국가 자살률이 높은국가 라는 이야기가 많이 들려오곤 합니다. 이러한 상황을 보면서 국가의 경제력과 행복이 정비롄는 아니라는 것이 느껴집니다. 그렇다면 어느부분에서 행복지수가 높아지는지 또 꾸준하게 행복지수가 높은 국가들은 어떠한 요인을 강점으로 가지고 있는지를 파악해보고자 합니다.
DATASET
kaggle에서 참조한 세계행복지수보고서에서 2015~2021의 연도별 데이터를 통합후 전처리를 진행하였습니다.
Analysis in Heartcount
행복점수는 대륙별로 분류 해봤을때 서유럽에서 최대점수와 평균값이 모두 가장 높게 나오는 모습을 보이고 있었습니다. 아프리카 지역에서 최소값이 가장 낮은 수치를 기록했으며 북미지역은 최대와 최소의 편차가 가장 큰모습을 보여주었습니다.
사회적인 지원측면이 많을수록 행복지수 점수가 올라간다라는 가설은 0.56정도의 설명력을 가지고 있었습니다.
자유도가 높을수록 행복지수도 오른다는 가설은 설명력이 0.89를 보이며 상관관계가 높은 것으로 나타났습니다.
가장 보편적으로 생각할 수 있는 경제적부분과 행복점수의 상관관게는 역시 상관계수 0.97로 연관이 큰것으로 보였습니다.
요인분석으로 보면 지역과 디스토피아(유토피아 반대의 수준)지수 두변수에 대하여 0.742의 설명력을 보여주었습니다. 또한 지역에서 경제력별로 나누게 되면 0.703정도의 설명력으로 높은모습을 보였습니다.
행복점수 하위와 상위를 비교분석으로 확인해보면 거의 대부분의 변수가 정확하게 상위와 하위에 따라 나누어지는 모습을 보이고있습니다. 다만 건강은 행복점수와는 크게 연관은 없는 모습이었습니다.
여기까지만 확인하면 변수에 따라 자연스럽게 행복지수가 나누어지는 것처럼 보여 결국 모든요인이 행복지수에 영향을 받는것처럼 보일수 있었습니다.
INSIGHT
그렇다면 당연한 인사이트외에 얻을 수 있는부분이 무엇일까 생각을 해봤고 행복지수 상위국가와 하위국가는 각각 어떠한 요인으로 지수가 영향을 받는지 궁금하여 확인을 해보았습니다.
확인을 해보았을때 상위 30개의 국가들은 자유도만이 0.72정도의 상관관계를 보여주었고 나머지는 크게 영향을 끼치지 못하였습니다. 그에반해 30~100의 중위권 국가들은 사회적지원에 대한 요인도 영향이 큰것으로 보였습니다.
마지막으로 100~158개의 하위권 국가들또한 자유도와 사회적지원에 대하여 영향이 큰모습을 보여주었습니다.
데이터의 결과물을 보면서 행복지수가 경제나 정부신뢰 같은 외부적요인보다는 자유도나 지원같은 심리적인 안정측면에서 오히려 행복지수가 올라간다는 것을 알 수가 있었습니다. 그렇기때문에 현재 데이터에 나와있는 변수들이 상위권국가의 행복지수에 대해서 완벽하게 설명은 못하지만 데이터가 보지 못하는 외부적인 환경등의 다양한 요인들이 행복지수에 영향을 미쳤을것이라고 생각합니다.
그렇기에 추후에 분석을할때에도 데이터에만 빠져들이 말고 외부적인 혹은 정성적인 변수들도 함께 확인해보면서 비교하는것도 좋은 데이터분석가의 길이라고 생각합니다.