Search
🔠

데이터 분석 용어 wiki

용어
의미
관련 URL
사용처
Tidy Data
Open
데이터 분석/시각화를 하기 좋은, 깔끔하게 편성된 데이터를 뜻함.
[강의/요약노트] 분석하기 좋은 데이터셋 https://support.heartcount.io/community/learning/lecture/eda-data-type
하트카운트
General
변수(칼럼)
Open
엑셀에서의 열을 영어로 칼럼이라고 부르며, 하트카운트에서는 한 칼럼을 한 변수로 파악하기 때문에 ‘칼럼’을 ‘변수’라고 부름.
[가이드] 캠페인 생성 방법 https://support.heartcount.io/manual/newcampaign
하트카운트
General
수치형 변수
Open
숫자로 이루어진 변수를 뜻함.
[비디오튜토리얼] 데이터셋 업로드&준비하기 https://support.heartcount.io/tutorial/newcampaign
하트카운트
General
범주형 변수
Open
카테고리로 이루어진 변수를 뜻함. (ex) 국적, 이름 등)
[비디오튜토리얼] 데이터셋 업로드&준비하기 https://support.heartcount.io/tutorial/newcampaign
하트카운트
General
파생변수
Open
변수 내에서 새로 생성하는, 기존의 변수를 변형해 만든 변수
[가이드] Binning(파생변수) https://support.heartcount.io/manual/binning
하트카운트
General
bin
Open
하트카운트에서 수치형 변수일 경우 자동 생성하는 파생 변수 중 하나. 구간으로 쪼개어 생성. (ex) ‘나이’ ⇒ 10대, 20대, 30대)
[가이드] Binning(파생변수) https://support.heartcount.io/manual/binning
하트카운트
percentile
Open
직역하면 백분위수. 하트카운트에서는, 수치형 변수일 경우 자동 생성하는 파생 변수 중 하나. 개수로 쪼개어 생성. (ex) ‘점수’ ⇒ 하위 10%, 하위 20%, 상위 20%..)
[가이드] Binning(파생변수) https://support.heartcount.io/manual/binning
하트카운트
N/A(결측값)
Open
데이터에서 값이 비어있는 경우(엑셀에서는 빈 셀)
[가이드] 캠페인 생성 - 2.데이터셋 검토 https://support.heartcount.io/manual/newcampaign
하트카운트
General
EDA
Open
Explorary Data Analysis(탐색적 데이터 분석), 시각화의 목적 중 하나로 본격적인 분석 작업을 하기 전에 데이터를 이리저리 시각화해보며 유용한 패턴이 있는지 탐색해보는 시간을 뜻함.
[블로그] EDA에 대하여 https://support.heartcount.io/blog/what-is-eda-with-hansrosling-dataset
하트카운트
General
회귀분석
Open
둘 이상의 변수 간의 관계를 보여주는 통계적 방법. 일반적으로 독립변수가 종속변수에 영향을 얼마나 미치는지 둘 간의 관계를 그래프로 표현하여 확인함.
[활용사례] 매체별 광고비가 매출에 미치는 영향, 회귀분석 https://support.heartcount.io/case/linear-regression-analysis
하트카운트
General
R2(결정계수)
Open
독립변수(X)가 종속변수(Y)를 얼마나 잘 설명/예측하는가를 알려주는 통계량. 하트카운트의 ‘요인 분석’에서는 종속변수에 영향을 가장 많이 미치는(=R2가 큰) 순서대로 독립변수들을 정렬하여 보여줌.
[활용사례] 매체별 광고비가 매출에 미치는 영향, 회귀분석 https://support.heartcount.io/case/linear-regression-analysis
하트카운트
General
Adjusted R2(수정된 결정 계수)
Open
분석에 사용된 레코드, 변수 개수 등을 반영하여 R2을 조정한 값. (R2가 독립변수의 수가 증가함에 따라 무조건적으로 증가할 수 있기 때문.)
[가이드] 요인분석 https://support.heartcount.io/manual/driveranalysis
하트카운트
General
P-Value 값
Open
해당 결과가 우연에 의한 결과일 확률. 통상적으로 0.05 이하이면 통계적으로 유의미하다고 판단함.
[활용사례] 매체별 광고비가 매출에 미치는 영향, 회귀분석 https://support.heartcount.io/case/linear-regression-analysis
하트카운트
General
필터
Open
하트카운트 공통 기능 중 하나로, 분석에서 불필요한 변수, 레코드를 개수 제한 없이 필터링할 수 있음.
[가이드] 필터링 https://support.heartcount.io/manual/filter
하트카운트
북마크
Open
하트카운트에서 즐겨찾기/스크랩과 같은용도로 사용할 수 있는 기능. 유용한 결과가 나왔을 때 북마크해둔 후 다시 확인하거나 스마트 플롯의 경우 HTML로 내보내기가 가능함. (* 무료 버전 사용자의 경우 세션 만료와 함께 기록이 모두 사라짐.)
[가이드] 검색 기능 및 북마크 https://support.heartcount.io/manual/bookmark
하트카운트
R(상관계수)
Open
두 변수 간에 선형 관계의 정도를 수치화한 것.
[블로그] 데이터분석, 한 주에 한 이론 3. 변수 간의 관계(선형, 비선형) https://blog.naver.com/heartcount/222638913876
하트카운트
General
데이터 스토리
Open
하트카운트
95% 신뢰구간
Open
하트카운트
General
상자그림(Boxplot)
Open
하트카운트
General
히트맵
Open
하트카운트
General
추세선
Open
하트카운트
General
화면 분할(Facet)
Open
하트카운트
Smart Discovery
Open
하트카운트
트리맵
Open
하트카운트
General
드릴다운
Open
하트카운트
의사결정나무
Open
하트카운트
General
타겟 비율
Open
하트카운트
순도
Open
하트카운트
이상치(outlier)
Open
관측값(데이터의 개별 레코드)의 대부분 범위에서 벗어나 극단적으로 크거나 작은 값, 중앙값에서 많이 떨어진 값.
[블로그] 집계 말고 개별 레코드 수준 분석의 장점 https://support.heartcount.io/blog/the-trap-of-averages
General
COUNT31
용어장은 계속해서 업데이트 예정입니다. 추가되었으면 하는 용어가 있다면 슬랙 통하여 말씀해주세요.