사용 가이드
home
초심자 가이드
home

입시부터 재학, 취업까지. 대학 데이터 분석

Intro

벚꽃 피는 순서대로 대학이 망한다는 이야기가 있지요?
장기간 지속되고 있는 출산율 저하로 인한 학령인구의 감소로 입학정원을 채우지 못하는 지방대학의 위기는 어제 오늘의 일이 아닙니다. 이는 꼭 지방대 뿐 아니라 점차 수도권 대학으로도 확산이 되는 분위기인데요.
가만히 앉아서 망하기를 기다리기 보다는 대학의 경쟁력을 높여 비록 지방에 위치하고 있지만 각 지역의 거점 명문대로 발돋움 하려면 무엇을 어떻게 준비해야 할까요? HEARTCOUNT와 함께 그 해결 방법을 찾아보고자 합니다.

Dataset

지방 모 국립대의 지난 10년간 입학/대학생활/비교과활동/취업 데이터를 결합한 데이터셋을 실습에 사용해보려고 합니다. 학생이 입학해서 학점을 취득하고 여러가지 비교과 활동을 수행하며 졸업해서 취업하기까지의 전체 대학생활의 Life Cycle에 맞춘 데이터셋으로 이해하시면 되겠습니다.
주요 변수는
전형 유형
고교 유형
토익, 토익 스피킹, JPT 등 어학 성적
전체 평점, 전공 평점 등 대학 성적
입학 총점, 학생부 성적 등 고교 성적
취업 기업 분류

Analysis in HEARTCOUNT

입학 성적과 재학 중 성적은 관계가 있을까?

먼저, 수시 전형에 따라 대학 성적에는 어떤 차이가 있는지 그리고 고등학교 때 공부 잘 한 학생이 대학 입학해서도 좋은 성적을 얻었는지, 두 변수간의 연관관계를 분석해 보았습니다. 
레시피
최근 10년간의 입시 제도가 수시로 변화함에 따라 전체 학생들의 입학 전형별 성적을 표준화하여 분석을 수행하였습니다.
하트카운트의 시각화 기능 스마트 플롯에서 Y축에 ‘전체 전공 평점’, X축에 ‘전형_수시 분류’를 설정합니다.
범주형 변수의 분포 상태를 확인하기 좋은 ‘박스 플롯’으로 시각화 표현 방식을 설정하였습니다.
분석 결과 해석
입학 후 재학 중 성적(전공 평점)을 분석한 결과 ‘학생부 교과 전형’으로 입학한 경우가 ‘종합 전형’으로 입학한 경우에 비해 학점의 분산도(특히 하위권으로의 분산도)가 더 넓어지는 특징이 있음을 발견할 수 있었습니다.
학생부 교과 전형으로 입학한 학생군이 다른 전형에 비해 학교생활(학점)의 상하위 편차가 크게 나타나고 있음을 알 수 있습니다.
그럼, 이렇게 상하위 편차가 크게 나타나는 ‘학생부 교과 전형’ 학생들을 좀더 세밀하게 살펴볼까요?
레시피
학생부 교과 전형에 해당하는 데이터만 확인할 수 있도록, 필터링하였습니다.
스마트 플롯의 X축은 입학총점의 bin 변수(수치형 변수를 동일한 구간으로 쪼갠 변수)로 바꾸었습니다.
분석 결과 해석
위 그래프에서 보는 것처럼 입학성적과 재학 중 성적이 선형적인 관계를 나타내고 있음(입학성적이 우수하면 재학 중 성적도 우수한 경향)을 알 수 있으나 입학성적 최상위 구간(입학총점 90~100점 위치)에 위치한 학생 군의 재학 중 성적이 오히려 하락하는 경향이 발견됩니다.
이를 좀더 상세하게 파악하기 위하여 HEARTCOUNT의 드릴다운 기능을 활용합니다.
레시피
조건을 제한 없이 추가하며 조합별 전체 평균과의 차이를 한 눈에 확인할 수 있습니다. 위에서 다루었던 입학점수를 조건으로 설정했으며, 추가적으로 ‘고교유형’을 조건으로 설정하였습니다.
분석 결과 해석
세부 내용을 확인한 결과, 학생부 교과전형으로 입학한 학생 중 입학성적 최상위권(90~100점 구간) 학생 중 출신 고교유형이 ‘검정고시’와 ‘특성화고’ 인 경우 전체 평균 평점(3.4)보다 떨어지는 경향이 나타남을 확인할 수 있습니다.
이는 재학 성적이 우수하면 대학의 기준과 평판에 영향을 미치는 취업률과 상관 관계가 높다는 일반적 상식을 기준으로 보면 ‘검정고시’와 ‘특성화고’ 출신으로 우수한 성적으로 입학한 학생들을 주의 깊게 지도 관찰할 필요가 있다는 결론에 이르게 됩니다.

재학성적이 우수한 학생은 취업도 잘 할까?

그럼 앞에서 언급한 바와 같이 “재학 성적이 우수한 학생들은 소위 말하는 ‘대기업’이라는 곳에 취업이 잘 될까?”라는 일반적 상식이 궁금해 집니다. 재학 중 성적과 취업 결과 데이터를 토대로 이를 한번 확인해 보겠습니다.
레시피
다시 시각화 기능(스마트 플롯)으로 이동하여, Stacked bar 그래프로 표현해보았습니다.
Y축에 ‘비율(X축)’을 설정하고 X축에는 ‘취업기업그룹’ 그리고 하위그룹에 ‘전체전공평점_percentile’을 설정하였습니다. percentile이란, 구간별 개수가 최대한 동일하도록 하위권에서 상위권까지 Percentile(%)로 자동 가공한 변수를 뜻합니다.
색이 진해질수록, ‘전체전공평점’도 높아집니다.
분석 결과 해석
A그룹(대기업, 정부기관, 공기업 등)에 입사하는 경우, 전체전공평점이 상위권(상위 40%)에 위치하는 비율이 높은 것으로 확인(A그룹 입사자 전체의 약 70%) 됩니다.
즉, 학교 생활을 성실하게 보낸(전공 평점이 높은) 학생들이 우리가 아는 일반적 상식과 동일하게 소위 ‘대기업’이라는 곳에 취업 하는 비율이 높은 것으로 나타납니다.
그런데 위 그림에서 보이듯이 전공평점이 낮음에도 불구하고 A그룹에 입사한 학생들이 보입니다. 이는 어떤 경우에 해당하는지 심화 분석을 수행해 봅니다.
레시피
동일한 Stacked bar 그래프에서, X축을 ‘전체전공평점_percentile’로, 하위그룹(색상)은 ‘기업분류’로 설정해보았습니다.
A그룹에 속하는 ‘기업분류’만 자세히 보기 위해, 필터링 기능을 이용하여 ‘취업기업그룹’의 A그룹에 관한 데이터만 시각화할 수 있도록 설정하였습니다. 필터링 기능을 통해 상황에 따라 N/A값 등 불필요한 변수/레코드를 직접 제외시킬 수 있습니다.
분석 결과 해석
위 분석 결과에서 보는 바와 같이 성적이 하위권(평점 Percentile)임에도 불구하고 ‘A그룹’에 취업한 학생들은 공기업/공공기관/공무원과 같이 학점과 상관없이 별도의 채용 시험을 거쳐 입사하는 경우로 파악이 되며, 일반 대기업이 경우 학점 우수자의 비율이 높게 나타남을 알 수 있습니다.
우리학교의 주인인 학생들을 바로 이해하고 올바른 길로 지도를 해 주기 위해서는 이와 같은 심화 데이터 분석이 필요합니다. 앉아서 학생들이 찾아와 주기를 기다리기 보다는 적극적으로 학생들을 분석하고 그들이 대학을 선택한 목적을 달성할 수 있도록 개별 학생에 맞는 지도 방법을 데이터 분석을 통해 찾아낸다면 대학의 위기는 더 이상 우리 대학에는 해당되지 않는 위기일 수도 있게 됩니다.
 하트카운트팀의 더 많은 아티클 보러가기
 하트카운트 사용해보기
 하트카운트 도입 상담하기
 하트카운트 뉴스레터 지난 호 보기 & 구독하기
실무자들을 위한 데이터 분석/시각화 커뮤니티 가입하기