Search

데이터 분석 용어 wiki

데이터 분석/시각화 관련 알아두면 좋을 용어들을 정리했습니다.

용어장은 계속해서 업데이트 예정입니다.
추가되었으면 하는 용어가 있다면 데이터 히어로 슬랙 을 통하여 말씀해주세요.
용어
의미
관련 URL
사용처
데이터 분석/시각화를 하기 좋은, 깔끔하게 편성된 데이터를 뜻함.
하트카운트
General
엑셀에서의 열을 영어로 칼럼이라고 부르며, 하트카운트에서는 한 칼럼을 한 변수로 파악하기 때문에 ‘칼럼’을 ‘변수’라고 부름.
하트카운트
General
숫자로 이루어진 변수를 뜻함.
하트카운트
General
카테고리로 이루어진 변수를 뜻함. (ex) 국적, 이름 등)
하트카운트
General
변수 내에서 새로 생성하는, 기존의 변수를 변형해 만든 변수
하트카운트
General
하트카운트에서 수치형 변수일 경우 자동 생성하는 파생 변수 중 하나. 구간으로 쪼개어 생성. (ex) ‘나이’ ⇒ 10대, 20대, 30대)
하트카운트
직역하면 백분위수. 하트카운트에서는, 수치형 변수일 경우 자동 생성하는 파생 변수 중 하나. 개수로 쪼개어 생성. (ex) ‘점수’ ⇒ 하위 10%, 하위 20%, 상위 20%..)
하트카운트
측정값(엑셀에서는 셀)을 뜻함.
하트카운트
General
데이터에서 값이 비어있는 경우(엑셀에서는 빈 셀)
하트카운트
General
Exploratory Data Analysis(탐색적 데이터 분석), 시각화의 목적 중 하나로 본격적인 분석 작업을 하기 전에 데이터를 이리저리 시각화해보며 유용한 패턴이 있는지 탐색해보는 시간을 뜻함.
하트카운트
General
둘 이상의 변수 간의 관계를 보여주는 통계적 방법. 일반적으로 독립변수가 종속변수에 영향을 얼마나 미치는지 둘 간의 관계를 그래프로 표현하여 확인함.
하트카운트
General
독립변수(X)가 종속변수(Y)를 얼마나 잘 설명/예측하는가를 알려주는 통계량. 하트카운트의 ‘요인 분석’에서는 종속변수에 영향을 가장 많이 미치는(=R2가 큰) 순서대로 독립변수들을 정렬하여 보여줌.
하트카운트
General
분석에 사용된 레코드, 변수 개수 등을 반영하여 R2을 조정한 값. (R2가 독립변수의 수가 증가함에 따라 무조건적으로 증가할 수 있기 때문.)
하트카운트
General
해당 결과가 우연에 의한 결과일 확률. 통상적으로 0.05 이하이면 통계적으로 유의미하다고 판단함.
하트카운트
General
하트카운트 공통 기능 중 하나로, 분석에서 불필요한 변수, 레코드를 개수 제한 없이 필터링할 수 있음.
하트카운트
하트카운트에서 즐겨찾기/스크랩과 같은용도로 사용할 수 있는 기능. 유용한 결과가 나왔을 때 북마크해둔 후 다시 확인하거나 스마트 플롯의 경우 HTML로 내보내기가 가능함. (* 무료 버전 사용자의 경우 세션 만료와 함께 기록이 모두 사라짐.)
하트카운트
두 변수 간에 선형 관계의 정도를 수치화한 것.
하트카운트
General
하트카운트에서 제공하는 사용자 커스텀 비디오 보고서. 사용자는 자신이 북마크해둔 분석 화면들을 조합하고 제목 및 설명을 덧붙여 하나의 스토리(보고서)로 완성, HTML로 내보낼 수 있음.
하트카운트
데이터 측정/추정 과정에서 발생할 수 있는 오차의 크기를 알아내기 위한 구간 추정 방법으로, 100번 반복하여 95번 모수가 측정된 구간을 95% 신뢰구간이라고 부름. 즉, 95% 정도 신뢰할 수 있는 구간이라고 이해하면 됩니다. :)
하트카운트
General
상자그림(박스 플롯)은 데이터의 다섯 가지 대푯값을 상자로 나타낸 그래프. 최솟값, 최댓값, 제 1~3분위를 확인할 수 있음. 상자 밖에 있는 값을 이상치(Outlier)로 인식함.
하트카운트
General
열(heat)과 지도(map)을 결합시킨 단어로, 데이터의 분포와 밀집도를 컬러의 진함으로 확인할 수 있는 시각화 기법. 색이 짙어질수록 높은 밀도를 나타냄.
하트카운트
General
의미 있는 두 개 이상의 고점 혹은 저점을 연결한 선으로, 기울기를 통해 상승 추세, 하락 추세 등을 파악할 수 있음.
하트카운트
General
하트카운트의 시각화 부가 기능 중 하나로, 한 화면에 여러 차트를 구성하여 볼 수 있음. (ex) 대륙들의 연간 소득 변화를 한꺼번에 확인하고 싶다면, x축은 연도, y축은 소득, 화면 분할(facet)을 대륙으로 설정하면 됨.)
하트카운트
하트카운트의 증강 분석 기능으로, 사용자가 업로드한 데이터셋 그리고 설정한 KPI를 기반으로 모든 경우의 수로 분석한 결과를 중요도 순으로 요약하여 알려주는 기능. 사용자는 Smart Discovery를 통해 주요 지표(수치, KPI) 관련 가장 중요도 있는 분석 결과를 확인하고 해당 기능으로 이동할 수 있음.
하트카운트
하트카운트의 시각적 발견 기능 중 하나로, 전체 평균을 기준으로 범주별 수치가 어떻게 분포되어 있는지 한 눈에 비교할 수 있는 여러 차트 보기를 제공함.
하트카운트
블록 형태로 영역을 구획화하여 데이터를 계층적으로 시각화하는 방법. 하트카운트에서는 ‘드릴다운’기능을 통해 계층적인 시각화를 이용해보실 수 있습니다.
하트카운트
General
데이터에서 규칙을 찾는 알고리즘으로, 서로 다른 두 집단을 분류하는 규칙을 발견하는 데 용이함. 스무고개처럼 조건을 계속해서 더해나가며 집단을 구획해나가는 분류 모형.
하트카운트
General
하트카운트의 ‘마이크로세그먼트’ 기능에서 사용하는 통계적 수치로, 특정 분류 규칙이 해당되는 집단/전체 집단의 비율.
하트카운트
하트카운트의 ‘마이크로세그먼트’ 기능에서 사용하는 통계적 수치로, 분류 규칙+전체 집단/분류규칙 집단의 비율. 해당 분류 규칙이 얼마나 정확한 지 알 수 있음.
하트카운트
관측값(데이터의 개별 레코드)의 대부분 범위에서 벗어나 극단적으로 크거나 작은 값, 중앙값에서 많이 떨어진 값.
General
COUNT31

관련 콘텐츠

 더 많은 데이터 콘텐츠
 하트카운트 사용해보기
 하트카운트 도입 상담하기
 하트카운트 뉴스레터 지난 호 보기 & 구독하기
실무자들을 위한 데이터 분석/시각화 커뮤니티 가입하기