home

Path 1 스터디

Literacy, Numeracy, Data Literacy: 데이터 리터러시에 대해 이해하기

인상적인 부분: 단순한 데이터에 대한 분석에서 끝나기 보다 호기심을 가지고 더 깊게 데이터를 살펴볼 때 인사이트까지 이어진다.
느낀점: 분석하는 분야에 대한 관심과 도메인 지식을 가지고 있을 때 의미있는 데이터 분석 결과 도출이 가능하다.

Data Understanding (1): 분석하기 좋은 데이터셋, 변수 유형별 시각화 방법

인상적인 부분
- 분석하기 좋은 데이터셋의 형태
- 좋은 Feature(변수) 발굴의 중요성
- Feature Engineering
느낀점:

Data Understanding (2): 데이터의 모양 묘사하기(히스토그램, boxplot, percentile)

인상적인 부분
- Histogram vs. Density Plot에서 Bin size에 따라 달라지는 형태
- Percentile을 활용할 경우에 서로 다른 단위의 변수를 결합할 수 있다는 것

Data Understanding (3): 평균의 함정, 시각화 기본 문법, 상관 관계 분석

인상적인 부분
-심슨의 역설: 가능한 한 쪼개서 보는 게 가장 현실을 잘 표현
-차원의 저주: 다른 요소들도 고려해야 함. 단순하게 두 개의 변수만 보고 판단을 내리기는 어려움
-전주의 처리: 시각적 요소의 중요성, 중요한 부분 강조의 필요성 > 전달 목적
-상관관계와 스캐터플롯: 상관관계가 높은 것만 의미있는 분석 결과가 아니다.