Intro
안녕하세요. 하트카운트 데이터 히어로 2기 수강자 ‘천태영’ 입니다.
저는 4주차 미션 주제로 제가 좋아하는 주종인 와인과 관련된 것을 해보고 싶었습니다.
와인을 좋아하긴 하지만 와인 품질에 따라 가격이 천차만별이기 때문에 저는 주로 저렴한 가격에
가성비가 좋은 와인을 사서 집에서 주로 마십니다. 여러분들도 혹시 와인을 즐겨 마시나요?
지금부터 레드 와인 품질 분석을 시작하겠습니다!
Dataset
이번 미션에 사용할 데이터셋은 포르투갈 "Vinho Verde" 와인의 빨간색 및 흰색 변종과 관련이 있습니다. 그리고 포도 종류, 와인 브랜드, 와인 판매 가격 등에 대한 데이터가 없는 데이터셋 입니다.
이어서 등장하는 변수에 대하여 간단하게 설명해드리겠습니다.
fixed acidity - 고정 산도
volatile acidity - 휘발성 산도
citric acid - 구연산
residual sugar - 잔류 설탕
chlorides - 염화물
free sulfur dioxide - 유리 이산화황
total sulfur dioxide - 총 이산화황
density - 밀도
sulphates - 황산염
quality (score between 0 and 10) - 품질(0에서 10 사이의 점수) : 최저품질 0 ~ 최고품질 10
Analysis in HEARTCOUNT
스마트 플룻
요인 분석
비교분석
익스플레이너
Insight
•
레드 와인 품질 분석을 통하여 알 수 있는 결론은 좋은 품질의 레드 와인은 알코올 농도가 12~14도 이고, 휘발성 산도는 0.6이하, 황산염 수치는 약0.7 정도인 와인이 품질이 좋다는걸 알게되었습니다.
•
이번 미션에 사용한 데이터셋의 설명력이 가장 높은 수치가 48%이며 알코올 농도, 휘발성 산도, 황산염 수치를 제외한 변수들은 좋은 품질의 레드 와인을 찾기에는 좋지 못한 데이터셋임을 알 수 있었습니다.
•
마지막으로 하트카운트 2기를 통하여 데이터 분석에 관하여 지식이 하나도 없는 초보자였지만, 약 한달동안에 강의와 미션들을 통하여 많은 것을 배울 수 있어서 너무 좋았습니다. 아직 많이 부족하지만 그동안 친절하게 알려주신 하트카운트팀에게 감사합니다! 이상으로 2기 수강생 ‘천태영’ 마지막 주 미션을 마치겠습니다.