home

230113 HR dataset

1.
데이터셋 개요
a.
HR dataset 총 컬럼 수 = 25개
2.
연습문제
a.
두 변수 간 상관관계 확인하기
i.
[직원만족도] & [매니저 소통]
ii.
팀별 [직원만족도] & [매니저 소통]
1.
마케팅팀 높고 밀집돼있는 군과 낮게 밀집돼있는 군 있음 (r = 0.9)
2.
사업팀, 신규서비스개발팀, 품질보증팀 흩어져있음
3.
기술팀 상관관계가 가장 낮음 (r = 0.09)
b.
범주 간 유의미한 차이 탐험하기
i.
[팀]별 [직원만족도] 차이 시각화 후 차이가 통계적으로 유의미한지 보기 (95% 신뢰구간)
1.
평균보다 낮은 팀: 기술팀, 생산팀, 품질보증팀
2.
평균 수준: 사업팀
ii.
[사업장 위치]별 [불량건수]
1.
iii.
[팀]별 [직원만족도] 차이가 [사업장 위치]에 따라 변화가 있는지 확인
iv.
3.
KPI 개선 전략을 뒷받침하는 시각화 자료 완성하기
a.
[직원만족도]를 개선하려면 [매니저의 소통능력] 개선이 필요하다는 주장을 한다고 가정 후, 해당 주장을 뒷받침할만한 시각화 차트를 완성해보세요.
i.
[직원만족도] - [매니저 소통능력]은 비례(r = 0.94, 강한 양의 상관관계), [직원만족도] - [팀구분]은 반비례
b.
(예시)
4.
그 외 EDA
a.
가설
i.
불량건수와 개인 능력 간 관계가 있을까?
ii.
매니저의 소통능력과 비전이 팀원 만족도와 관계가 있을까?
iii.
근속기간은 채용경로에 따라 큰 차이가 있을까? 공채가 가장 길까?
b.
[본인_인지능력]과 [불량건수]의 상관관계 (r = 0.03)
c.
[근속기간]과 [불량건수]의 상관관계 (r = -0.02)
d.
[성과점수]와 [불량건수]의 상관관계 (r = 0.1)
e.
[직원만족도]와 [매니저_소통]의 상관관계 (r = 0.85)
f.
[직원만족도]와 [매니저_비전]의 상관관계 (r = 0.8)
i.
직원만족도와 매니저의 소통/비전은 만족도와 높은 상관관계를 나타냄
g.
팀 별 [직원만족도]와 [근속기간] (r = -0.28)
i.
직원만족도와 근속기간이 비례하지는 않았음
a.
[근속기간]은 [채용경로]에 따라 큰 차이가 있을까? 흔히 공채의 근속기간이 길다고 하는데 해외도 비슷하게 길었음
5.
어느 회사일까..?
a.
자료에 나온 지역에 사업장을 모두 보유한 업체는 DL chemical