이 글은 데이터 히어로 캠프 1기 멤버 김아영님이 4주차 최종 미션으로 수행하신 분석 사례입니다.
Intro (서론)
금융데이터 거래소의 카드결제 데이터들을 조합하여 4월달 시간대별 온라인 판매 추이에 대해 분석하고 최근 2년간 4월달 가장 많이 사용된 업장을 확인하고 신용카드 사용이 가장 활발한 시간과 아닌 시간등을 확인하여 신용카드 소비 촉진 방안등을 기획 할 수 있다. 이를 토대로 신용카드 사용을 증진을 할 수 있는 4월 프로모션 기획을 진행 할 수 있을것으로 예상한다.
가설1) 가족의달인 5월을 대비하여 호텔 숙박등의 지출이 유의미한 소비패턴으로 보일 것이다.
가설2) 각 시간대별 잘 팔리는 상품품목을 대량 구매 하도록 유도하여 판매수를 늘린다. 출퇴근 시간에 가장 많은 구매가 이루어질 것이다 특히 퇴근시간에 맞추어 푸쉬 알림을 진행하는것이 좋다
Dataset
(신한은행 온라인소비 업종별 시간대별 결제 데이터)
- 기간 (2019년 & 2020년 4월)
- 기준년월
- 온라인업종
- 온라인상세업종
- 거래시간
- 카드매출금액
- 카드매출건수
- 건당매출금액
Analysis
•
•
◦
비슷한 양상의 비율이나 2019년도 4월은 48.73%의 비율로 약 1조 7천 만원의 총액이 결제되었고, 8.5%의 비율로 2020년 4월은 2조300만원의 카드 금액이 더 결제 되었습니다.
•
카드매출은 카드 매출건수에 95%의 설명력을 가지고 있습니다. 이는 전체에서 다섯번째 설명력을 가지고 있으며 카드매출금액과 이어지는 상관관계이므로 다음으로 온라인 상세 업종을 더욱 자세히 보아야 할 것 같습니다.
•
변수 한개인 온라인상세업종 만을 보았을때 이는 전체에서 여덟번째 설명력을 가지고 있으며 카드매출금액 차이(변화량)의 74.52% 를 설명할 수 있습니다.
◦
카드매출금액 총합에 기여도가 가장 컸던 조건들:
▪
[ 온라인상세업종 : 대형이커머스 ]인 경우 카드매출금액 총합이 1,988,416,571,000(약 2조)이었습니다.
▪
[ 온라인상세업종 : 일반유통 ]인 경우 카드매출금액 총합이 455,573,738,000(약 4556억)이었습니다.
◦
카드매출금액 총합에 기여도가 가장 작았던 조건들:
▪
[ 온라인상세업종 : 상품권 ]인 경우 카드매출금액 총합이 3,171,901,000(약 317억)이었습니다.
▪
[ 온라인상세업종 : 월납 ]인 경우 카드매출금액 총합이 7,296,359,000(약 730억)이었습니다.
•
변수 두개를 고려하여 분석 하였을때 가장 큰 설명력을 가지고 있으며 카드매출건수와 온라인상세업종이 함께 첫번째 설명력 97.63% 을 가지고 있으며 카드매출금액 차이(변화량)를 설명합니다.
◦
▪
[ 3,500,780 ≤ 카드매출건수 < 3,938,373 ]이고 [ 온라인상세업종 : 대형이커머스 ]인 경우 카드매출금액 총합이 904,368,795,000(약 9404억)이었습니다.
▪
[ 2,187,999 ≤ 카드매출건수 < 2,625,593 ]이고 [ 온라인상세업종 : 대형이커머스 ]인 경우 카드매출금액 총합이 426,675,964,000(약 4천267억)이었습니다.
◦
카드매출금액 총합에 기여도가 가장 작았던 조건들:
▪
[ 29 ≤ 카드매출건수 < 437,623 ]이고 [ 온라인상세업종 : 상품권 ]인 경우 카드매출금액 총합이 3,171,901,000(약 32억)이었습니다.
▪
[ 29 ≤ 카드매출건수 < 437,623 ]이고 [ 온라인상세업종 : 월납 ]인 경우 카드매출금액 총합이 7,296,359,000(약 73억)이었습니다.
전체 카드매출금액 데이터를 분석해본 결과 카드매출금액은 카드 매출 건수와 온라인 상세업종과의 비교를 통해 가장 큰 설명력을 가지며 이는 유의미한 분석이라고 보여 집니다.
특히, 온라인 상세업종의 세부 분석을 통해서 4월달 카드 매출 건수와 상세 업종을 확인 할 수 있었습니다.
- 4월달 가장 많은 매출을 보이는 사용처는 1) 온라인 대형 이커머스 2) 일반유통 3) 온라인 쇼핑 순으로 보여집니다.
- 반대로 가장 적은 매출을 보이는 사용처는 1) 상품권 2) 월납 3) 기타 4) 배달 서비스 순이었습니다.
가설1) 가족의달인 5월을 대비하여 호텔 숙박 상품권등의 기념 지출이 유의미한 소비패턴으로 보일 것이다.
가족의달인 5월을 대비하는 상품권, 숙박등이 유의미한 구매패턴을 보이지 않았으며 추가적으로 위의 데이터에서 낮은 소비 패턴을 보이던 상품권, 레저,관광의 지출에 대하여 모든 달의 구매패턴을 함께 세부 분석을 함께 해야 한다.
각 시간대별 카드건수 및 금액 차이 분석
•
변수 조정
◦
거래시간
◦
건당매출금액
◦
온라인상세업종
◦
카드매출건수
◦
카드매출금액
•
◦
거래시간은 여섯번째 설명력을 가지고 있으며 카드매출금액 차이(변화량)의 1.68%를 설명할 수 있습니다. 그럼에도 불구하고 시간대별 카드매출과 관련하여 분석해보는것이 프로모션 기획에 필요하다고 생각하였습니다.
◦
카드매출금액 총합에 기여도가 가장 컸던 조건들:
▪
[ 거래시간 : 21시-24시 ]인 경우 카드매출금액 총합이 668,799,539,000(약 6688억)이었습니다.
▪
[ 거래시간 : 09시-15시 ]인 경우 카드매출금액 총합이 664,279,916,000(약 6643억)이었습니다.
◦
카드매출금액 총합에 기여도가 가장 작았던 조건들:
▪
[ 거래시간 : 03시-06시 ]인 경우 카드매출금액 총합이 65,718,813,000(약 657억)이었습니다.
▪
[ 거래시간 : 06시-09시 ]인 경우 카드매출금액 총합이 190,358,639,000(약 1904억)이었습니다.
•
◦
거래시간별 카드매출의 총 금액에 대한 바플롯입니다.
▪
21~24시 : 약 6690억
▪
09~15시 : 약 6640억
▪
15~18시 : 약 6600억
▪
09~12시 : 약 6320억
◦
카드매출금액의 총합으로 데이터를 살펴볼 경우 카드 사용의 빈도 및 건당 결제금액의 차이로 정확한 분석을 할 수 없다고 판단하여 거래시간별 카드 매출 건수를 확인 하였습니다.
•
◦
21시~24시 : 13,305,029 건
◦
18시~21시 : 12,833,472 건
◦
09시~15시 : 11,833,968 건
◦
15시~18시 : 11,832,180 건
◦
09시~12시 : 11,274,309 건
◦
00시~03시 : 6,161,146 건
◦
06시~09시 : 4,023,657 건
◦
09시~06시 : 1,459,039 건
◦
위와 같이 거래시간별 카드매출의 건수는 카드매출총금액과 달리 18~21시의 결제 건수가 많다는것을 볼 수 있습니다. 이는 유의미한 차이라고 생각되어 이를 바탕으로 거래시간별 건당 매출금액 평균의 변수를 살펴보겠습니다.
•
온라인상세업종과 거래시간이 카드매출금액 차이(변화량)를 78.29%설명하고 있으며, 이 두변수를 이용하여 시간대별 세부 분석을 통해 가장 적합한 카드사용 프로모션을 기획 할 수 있을것이라 기대합니다.
◦
카드매출금액 총합에 기여도가 가장 컸던 조건들:
▪
[ 온라인상세업종 : 대형이커머스 ]이고 [ 거래시간 : 21시-24시 ]인 경우 카드매출금액 총합이 376,777,199,000 (약 3768억)이었습니다.
▪
[ 온라인상세업종 : 대형이커머스 ]이고 [ 거래시간 : 09시-15시 ]인 경우 카드매출금액 총합이 346,990,827,000 (약 3470억)이었습니다.
◦
카드매출금액 총합에 기여도가 가장 작았던 조건들:
▪
[ 온라인상세업종 : 의료기관 ]이고 [ 거래시간 : 03시-06시 ]인 경우 카드매출금액 총합이 5,548,000 (약 555만원)이었습니다.
▪
[ 온라인상세업종 : 상품권 ]이고 [ 거래시간 : 03시-06시 ]인 경우 카드매출금액 총합이 29,805,000(약 3천)이었습니다.
위에서 보는 바와 같이 온라인 상세업종과 거래시간과 상관관계가 있는것을 볼 수 있기에 세부적으로 건당 평균매출금액에 대해서 확인 해 보겠습니다.
•
◦
의료기관에서의 건당 결제 금액이 가장 높게 나왔고, 이어서 기타, 교통, 교육순으로 왔습니다.
◦
의료기관의경우 기본적으로 의료 수가가 높은경우가 많기 때문일것으로 예상하며 15시~18시에 가장 높은 결제평균금액(약 44만원)을 확인 할 수 있었습니다.
◦
기타, 교통의 경우 세부 사용처에 대한 추가 확인이 필요하며 6시~9시 사이의 건당평균금액이 낮은것은 대중교통의 사용으로 건당 평균액이 낮은것으로 예상되나. 자세한 사항은 교통에 대한 세부 분석이 필요한것으로 보입니다.
◦
다만 유의미한 결과로는 0시~ 3시와 9시~15시에 가장 큰 평균금액을 보입니다.
위의 결과로 확인하였을 해당 의료기관과 교육기관등은 Open Hour가 정해져있는 상황이므로 해당 시간대에 카드 보유자들의 유출을 막고 해당 카드사용을 유도하기위해 해당 시간대 결제에 따른 프로모션 진행을 구상해 볼 수 있습니다.
•
대형이커머스의 경우 카드매출총금액이 가장 높았던것과 달리 건당평균금액은 약 10만원 미만인 것으로 확인 할 수 있었습니다.
•
온라인상세업종과 거래시간이 함께 네번째 설명력을 가지고 있으며 카드매출금액 차이(변화량)의 78.29%를 설명할 수 있습니다.
◦
카드매출금액이 평균보다 높았던 조건들:
▪
[ 온라인상세업종 : 대형이커머스 ]이고 [ 거래시간 : 21시-24시 ]인 경우 카드매출금액 평균값이 188,388,599,500로 전체 평균(13,013,572,538.19)보다 175,375,026,961.81만큼 높았습니다.
▪
[ 온라인상세업종 : 대형이커머스 ]이고 [ 거래시간 : 09시-15시 ]인 경우 카드매출금액 평균값이 173,495,413,500로 전체 평균(13,013,572,538.19)보다 160,481,840,961.81만큼 높았습니다.
◦
카드매출금액이 평균보다 낮았던 조건들:
▪
[ 온라인상세업종 : 의료기관 ]이고 [ 거래시간 : 03시-06시 ]인 경우 카드매출금액 평균값이 2,774,000로 전체 평균(13,013,572,538.19)보다 13,010,798,538.19만큼 낮았습니다.
▪
[ 온라인상세업종 : 상품권 ]이고 [ 거래시간 : 03시-06시 ]인 경우 카드매출금액 평균값이 14,902,500로 전체 평균(13,013,572,538.19)보다 12,998,670,038.19만큼 낮았습니다.
가설2) 각 시간대별 잘 팔리는 상품품목을 대량 구매 하도록 유도하여 판매수를 늘린다. 출퇴근 시간에 가장 많은 구매가 이루어질 것이다 특히 퇴근시간에 맞추어 푸쉬 알림을 진행하는것이 좋다
퇴근 시간에 가장 많이 구매 할 것이라고 생각 했던 가설2) 와는 다른 양상을 보이므로로 가설2는 수정하여야 한다
4월달 신용카드 사용 증진을 위한 방향 수립
•
위의 결과로 확인하였을 해당 의료기관과 교육기관등은 Open Hour가 정해져있는 상황이므로 해당 시간대에 카드 보유자들의 유출을 막고 해당 카드사용을 유도하기위해 해당 시간대 결제에 따른 프로모션 진행을 구상해 볼 수 있습니다.
◦
1시~17시 의료기관의 진료에 대해 일정금액 이상을 지출 하였을시 베네핏을 주는 프로모션을 진행 하며 현재 건당 가장 많은 지출을 의료분야에 대해 다른 신용카드로 유출되는 고객을 막고 유휴고객을 활성화 시키는 프로모션을 기획할 수 있습니다.
◦
해당 프로모션의 혜택 알림 시간은 가장 많은 결제가 이루어지는 9~18시 사이 2회로 1) 푸쉬알림과 2) 상세 카톡 문자알림 등으로 진행 할 수 있습니다. (의료/교육의 경우 금액별 사용이 아닌 필요형 사용으로 세부 안내를 하는것으로 방향을 잡을 수 있습니다. )
•
거래시간대별 카드 매출금액 증진 방향
◦
유독 약세를 보이던 시간대인 0~9시는 취침을 미루고 카드 사용을 이끌어 낼 수 있는 정도의 프로모션이 필요한것으로 보여집니다.
◦
대형 이커머스의 경우 판매 증진을 위하여 0시~9시 사이에 할인 쿠폰등을 협약하여 카드 사용을 이끌어 내게 된다면 더 많은 소비를 이끌어 낼 수 있으리라 기대할 수 있습니다.
◦
가장 많이 사용하는 21시~24시 사이에 카드이용건당 평균금액을 높일 수 있는 프로모션을 진행하여 더 많은 금액을 결제 하도록 유도 할 수 있습니다.
◦
혜택 알림의 푸쉬 시간은 21시 이후로 진행하여 기존 고객 및 추가 고객들의 유입을 유도하는 방향으로 푸쉬알림을 진행할 수 있습니다.
가족의달인 5월을 대비하여 숙박등의 지출이 유의미한 소비패턴을 보이지 않았으며 추가적인 확인을 위해 5월 데이터의 추가적인 분석이 필요하다. 추가적으로 위의 데이터에서 낮은 소비 패턴을 보이던 상품권, 레저,관광의 지출에 대한 분석을 함께 해야 한다.