1. 사용된 기능
•
수치형 변수일 때는 최적화 규칙을, 범주형 변수일 때는 두 집단 간 차이를 자동으로 발견하는 분류 규칙 기능
2. 분석 과정
•
분석하기의 분류 규칙 기능으로 이동합니다.
•
어떤 변수의 최적화/분류 규칙을 선택합니다. ‘퇴직 구분’을 선택한 후, [분석하기]를 클릭합니다.
•
옆 톱니바퀴에서는 비교할 두 집단(퇴직자, 재직자)에 포함하는 수치를 간단히 확인 가능합니다.
•
분석 결과가 바로 제시됩니다.
3. 분석 결과 해석
•
전반적으로 보니 잔업 시간, 직원 만족도, 매니저 소통 역량이 퇴직 여부와 가장 관련이 있는 것으로 보입니다.
퇴직자 수 감소를 위해 해당 영역들에 가장 먼저 신경을 쓰면 좋을 듯 합니다 :-)
•
하나씩 살펴 볼까요?
◦
상단 테이블
- 퇴직구분이 No인 경우에 파란색, Yes인 경우에 빨간색으로 표시가 되어 있습니다.
- 한 가지 해석해 볼까요?
잔업시간이 157.5시간 미만인 경우 (’퇴직구분: No’에 해당)
➀ 순도 : 1,071(퇴직구분: No) / 1,084(잔업시간이 157.5 미만) = 98.8%
→ 잔업시간이 157.5시간 미만인 인원 중 98.8%가 퇴직하지 않음.
➁ 타켓비율 : 1,071(잔업시간 157.5시간 미만) / 1,814(퇴직구분: No) = 59%
→ 퇴직하지 않은 1,814명 중 59%가 잔업시간 157.5시간 미만으로 근무함
- 퇴직구분이 No인 경우와 Yes인 경우를 나누어 볼 수도 있습니다.
◦
하단 시각화 영역
- 분석의 결과가 선버스트 차트와 의사결정나무 형식으로 제공됩니다. 원하는 영역을 클릭해, 구체적인 수치를 확인할 수 있습니다.
선버스트 차트
의사결정 나무
- 용어는 동일하며 각 항목의 해석은 아래와 같습니다.
① 크기 : 해당 조건을 만족하는 레코드 개수(1,094 레코드)
② 순도 : 해당 조건을 만족하는 세그먼트 크기 1,094개 중 1,090개(99.63%)가 판매 이익 상위 20%에 해당한다는 의미입니다. 순도가 높으면 높을수록 분석 결과에 대한 신뢰도도 높아집니다. 쉽게 말하면, 해당 분류 규칙이 얼마나 정확하게 예측하는지 알려주는 척도입니다.
③ 타겟 비율 : 판매 이익 상위 20%에 속하는 총 레코드 숫자(1,639개) 중 1,090개(66.5%)가 해당 세그먼트에 속한다는 의미입니다. (recall/재현율이라고도 함)
④ 평균 KPI 차이 : 해당 세그먼트에 속한 레코드의 평균 KPI와 분석대상 전체 평균 KPI의 차이(전체 이익 평균-25.1, 해당 조건의 레코드 평균 이익-189.3, 평균 KPI 차이 = +164.2)
4. 응용
•
우측 상단의 메뉴를 통해 분석 결과(예측 모델)를 SQL이나 CSV, Excel 형식으로 다운로드 받아 사용할 수 있습니다.