home

IBM HR Analytics employee attrition & performance

이 글은 데이터 히어로 캠프 3기 참여자이신 이한울님이 작성한 분석 사례입니다. 데이터 히어로에 대한 자세한 내용은 여기를 클릭해주세요.
주제 선정 배경: IBM의 데이터 과학자들이 생성한 가상의 HR Data-set이지만, 본 Data를 통해서 HR Analysis에 대해 직접적으로 체험할 수 있을 것이라 기대하여 제출합니다. 특히, ‘퇴사여부’와 다른 변수들을 제공하기에 HRA의 EDA 연습에 최적일 것이라 선택하게 되었습니다.

Intro

지난 2022년 7월 31일, 파이낸셜 뉴스에서는 국내 제조 대기업들이 공시한 지속가능경영보고서(2021~2022)를 분석하여, 국내 대기업 종사자들의 자발적 이직률이 2배 가까이 상승했다고 밝혔으며 특히 30세 미만의 이직률이 가장 높게 나타났다고 밝혔습니다.
대기업별 이직률 요약
1) SK 하이닉스
구분
전체
30세 미만
30~50세
50세 이상
2020
2.2%
3.4%
1.3%
1.8%
2021
3.8%
5.7%
2.7%
2.8%
Gap
+1.6%p
+2.3%p
+1.4%p
+1.0%p
2) 삼성전자
구분
전체
2020
2.1%
2021
2.4%
Gap
+0.3%p
3) LG 이노텍
전체
30세 미만
30~50세
50세 이상
2020
3.3%
-
-
-
2021
3.4%
8.4%
2.7%
1.0%
Gap
+0.1%p
이러한 지표를 통해 한국의 제조 기업들은 인재를 시간과 많은 비용을 투입하여 선발하고 육성하지만, 공들여서 채용한 인재들이 기업을 이탈하여 큰 손실을 보고 있다는 것을 확인할 수 있었습니다.
LG경영연구원의 2004년 자료인 <인재 유지, 이직 관리로부터 시작하라>에서는 이직 비용을 계산해볼 필요가 있다고 제안하고 있습니다. 현재는 계산 방법이 다르겠지만, 2000년대의 미국 기업들은 이직 비용을 “일반적으로 약 2배 … IT 전문 인력의 경우 연봉의 1.8배 … 중간 관리자의 경우 연봉의 2.8배 정도의 비용이 발생하는 것으로 추산하고 있다.”로 계산하고 있음을 확인할 수 있었습니다.
→ 출처: 인재 유지, 이직 관리로부터 시작하라 (링크: consul728-1.PDF (lgbr.co.kr))
또한, 위 기준을 활용하여 2021년 SK 하이닉스의 이직 비용을 연봉의 두 배로 계산한다면, 최소 2,331억원임을 확인할 수 있었습니다. 이는 SK 하이닉스 2021년 당기순이익 9조 6160억원의 약 2.4% 정도에 해당하는 금액입니다.
- 이직 비용 계산식 : 2021년 말 근로자 수(38,352) X 이직률(3.8%) X 예상 평균연봉 (8,000만원, 나이스 평가정보) X 2
→ 출처: 2022 SK 하이닉스 지속가능경영보고서 (링크: 지속가능경영 < SK hynix)
때문에, HR Analysis를 학습하고 현업에서 직원들을 유지(Retain)하고자 여러 방면으로 힘쓰는 인사쟁이들에게 직원들의 퇴직 요인을 파악하고 예측하는 것은 중요한 활동인 것 같습니다. 이러한 이유에서 IBM의 데이터 과학자들이 만든 가상 HR 데이터 셋을 활용하여 직원 퇴직에 어떤 요소가 가장 영향을 미치고 어떤 관계가 있는지 분석해보고자 합니다.

Dataset

WA_Fn-UseC_-HR-Employee-Attrition.xlsx
241.2KB
IBM Dataset.docx
14.4KB

Analysis in HEARTCOUNT

Ⅰ. 비교 분석
가장 먼저, 재직자와 퇴직자에 대한 특징을 비교 분석을 통해 확인해보고자 합니다.
퇴직 인원: 전체 1,470명 중 16.12%인 237명이 퇴직했습니다.
많은 요인들 중 그래프 상 주목할 만한 차이가 보이는 요인 위주로 정리해보겠습니다.
#1. 경력
1) 총 경력: 총 경력이 0~8.16년 사이의 인원들의 퇴직이 많았습니다.
2) 근속년수: 0~3.27년 사이의 인원들의 퇴직이 많았습니다.
2) 나이: 28.43~34.29세 인원들의 퇴직이 많았습니다.
#2. 업무 환경 관련
1) 환경/직무 만족도, 직무 몰입: 만족도와 몰입도은 퇴직 이유와 큰 관련이 없었습니다.
2) 초과 근무: 퇴직자 중 초과 근무를 하는 인원이 많았습니다.
3) 업무 수준: 1~2 수준의 업무를 수행하고 인원 중에서 퇴사자가 많았습니다.
#3. 경제적 보수
1) 월 급여 수준: 하위 0~20%의 인원 중에서 퇴사자가 많았습니다.
월급이 $1,009 ~ $3,721.86 사이인 경우 퇴사자가 많았습니다.
2) 스톡옵션 수준: 수준이 0 ~ 0.55 정도인 인원 중에서 퇴사자가 많았습니다.
위와 같이 비교 분석 결과, 퇴직 시 나이가 어리고 경력이 낮은 인원 중 업무의 수준이 낮아 경제적 보수가 상대적으로 적은 그룹에서 퇴사가 빈번하게 발생했습니다.
#4. 기타: 직무
직무로 구분한다면 위와 같이 Laboratory Technician, Sales Representative, Sales Executive, Human Resource 그룹에서 퇴사가 많이 발생하고 있었습니다.
Ⅱ. 마이크로 세그먼트 분석
퇴직여부 Yes에 영향을 미치는 요인을 정밀하게 분석하고자 설명력 높은 두 그룹을 확인했습니다. (80% 이상)
Group 1. 상대적으로 소득이 적음 - 87.8%
초과 근무를 하지 않고, 월 소득이 $2,475 미만이며, 일 급여 수준이 $931미만인 직원 그룹의 퇴직에 대한 설명력이 높았습니다.
이에 퇴직 예측 시 월 소득이 $2,475 미만이며, 일 급여 수준이 $931미만인 직원들에 대해 초점을맞출 필요가 있는 것 같습니다.
초과근무 여부를 제외하고 해당 인원들을 확인해본 결과, 해당 직무는 Sales Representative, Human Resources, Laboratory technician, Research scientist 이었습니다. 이에 해당 직무에서 근무하는 인원들을 중점적으로 모니터링해볼 필요가 있을 것 같습니다.
또한 해당 직무 중 퇴직한 직원의 직장과 집의 거리를 확인해보니 평균 거리는 10.18이었습니다. 이직하지 않은 인원의 평균 거리가 8.56이다보니, 직장과 집의 거리가 멀면 멀수록 퇴사할 가능성이 높아지는 것을 예측해볼 수 있습니다.
특히, 신뢰 구간이 8.03 ~ 12.33 사이이므로 직장과 집의 거리가 8.03 이상에서 통근하는 직원의 경우 모니터링이 필요할 것으로 보입니다.
퇴직자(2.73)와 재직자(3.48)의 평균 근속 년수가 차이는 미미했지만, 퇴직자 근속 년수의 신뢰구간은 2.03 ~ 3.43이므로 입사 후 2년차~3년 경과된 인원에 대한 모니터링이 필요할 것 같습니다.
Summary: 월 소득 $2,475 미만, 일 급여 수준 $931 미만 직원의 퇴사 가능성 예측 지표
직무: Sales Representative, Human Resources, Laboratory technician, Research scientist
근속 년수: 2.03~3.43 사이
통근 거리: 8.03 이상
직무 몰입도: 2.57 미만
Group 2. 상대적으로 소득이 높은 그룹 - 80.77%
초과 근무를 하지 않고, 월급이 $2,475 이상이며, 스톡옵션 수준이 0.5미만이고, 월급여수준이 $17,036 이상인 직원들 중 직무가 Healthcare representative, Laboratory Technician, Research Scientist 직원 그룹의 퇴직에 대한 설명력이 높았습니다.
초과근무 여부를 제외하고 해당 인원들을 확인해본 결과, 해당 직무는 Sales Representative, Human Resources, Laboratory technician, Research scientist 이었습니다. 이에 해당 직무에서 근무하는 인원들을 중점적으로 모니터링해볼 필요가 있을 것 같습니다.