home

Hansrosling Dataset

1. 숫자(Y)와 숫자(X) 간 관계

1-1. 기대수명과 상관관계가 가장 높은 숫자형 변수의 관계를 scatterplot(산점도)으로 시각화
1-2. 위에서 찾은 상관관계의 세기가 가장 큰 대륙(Continent)을 찾아 scatterplot으로 시각화
1-3. 국가별 평균 기대수명과 소득을 보여주는 bubble chart
대체로 양의 상관관계를 보이나 그렇지 않은 추세를 보이는 국가도 있음: Africa(Libya, Congo, Dem. Rep.)
Asia(Bahrain)
→ 시간의 흐름에 더 큰 영향을 받음

2. 숫자(Y)와 범주(X) 간 관계

2-1. 전 기간 동안 국가별 평균 인구 바차트 시각화 (인구숫자 내림차수로 sorting)
2-2. 2010~2014년 기간 동안 국가별 평균 일인당 소득 ranking 시각화
2-3. 대륙(X축)별 x 국가(하위그룹)별 Income의 총합을 stacked bar chart로 표현

3. 분포와 Percentile

3-1. 대륙별 기대수명의 분포를 박스플롯(boxplot)으로 시각화 (boxplot 해석해 보기)
3-2. 소득 percentile(5분위) 구간별 인구 percentile(5분위)에 따른 평균 기대수명 시각화

4. 시계열 추이

4-1. Oceania 대륙에 속한 국가들을 대상으로 평균 기대수명의 추이를 시각화
4-2. 소득 수준의 등락(변동)이 가장 컸던 국가를 선택(선택보기)하여 시각화
<기타 EDA> 목적없는 분석..
1.
영유아 사망률과 여성 일인당 자녀수의 상관관계 :: 양의 상관관계에 있음
→ 소득이 높을수록 자녀수와 영유아 사망률이 낮음
→ 그렇다면 소득이 가장 낮은 편인 ‘아프리카’에서 자녀수와 영유아 사망률이 더 강한 음의 상관관계를 보일까? 답: 아니다. 오히려 소득이 높을수록 강한 음의 상관관계를 보였다.
→ 추가 발견: 소득분위별 n명의 자녀 수부터 영유아 사망률이 급격히 증가함