1. 基本的な使い方
•
X軸変数が数値型の場合、サブグループは選択した変数のすべてのレコードをグループ化(集計)します。下の図は、上記のX軸をサブグループにして散布図を表示した可視化結果です。
•
デフォルトのサブグループ計算方法は[平均]ですが、[sum]または[count]に変更することができます。[count]の場合、NA値(欠損値)を除いて各サブグループクラスに対するレコード数を計算します。
•
各データをクリックすると、データの詳細説明を見ることができます。
•
X軸、Y軸二つの変数間の相関関係を相関係数で把握することができます。
相関係数とは?
二つの変数の相関度を指数で表した値を意味します。
通常rと表現し、-1から+1までの値です。
•
-1:片方が増加するともう片方は減少
•
0:お互いに影響を与えない
•
+1:片方が増えるともう片方も増える
2. トレンドライン
右上のトレンドラインを押すと、2つの変数の相関関係を表すトレンドラインを青い線で表示します。トレンドラインの傾きにより、2つの変数間の関係を一目で確認することができます。
3. ヒートマップ
ヒートマップとは、熱を意味するヒート(heat)と地図を意味するマップ(map)を組み合わせた言葉で、データの値をカラーに変換して視覚的な分析を可能にするデータ視覚化技法です。ヒートマップアイコンを押すと、データの分布と密度を視覚的に把握することができます。色が濃くなる(紫色)ほど高い密度を示します。
プロットが重複している場合には、×2、×3などのアイコンで重複を知らせます。データをクリックして表示されたポップアップウィンドウで矢印< >を押すと、各レコードの確認が可能です。
X軸とY軸が共に数値型データである場合、次のように散布図グラフが描かれます。 各点は個々のデータ(レコード)を意味します。視覚化画面の右上から相関係数を確認することができ、トレンドラインとヒートマップで視覚化できるアイコンがあります。
4. 時系列データの可視化
もしかして、日付なのに日付変数として認識されないのでしょうか?
エクセルで該当列を選択して'右クリック → セルの書式設定'で日付形式に設定されていることを確認してください!エクセルの日付形式に設定されていなければ、ハートカウントで日付形式として認識し、年/四半期/月/週/曜日/曜日タイプなどの派生変数が生成されます。
時系列データとは、時間の流れに沿って一定期間について時間の関数として表現されたデータを指します。HEARCOUNTを通じて時系列データを可視化し、予測することができます。
•
X軸に日付や時間変数を設定し、Y軸を可視化したい変数に設定します。サブグループデータを指定することで、次のような時系列を可視化することができます。
•
右上にあるアイコンをクリックすると、様々な可視化グラフに変更することができます。
HEARTCOUNT를 이용한 시계열 데이터의 시각화는 (1) 계절성과 (2) 예측이라는 두 가지 특징이 있습니다.
HEARTCOUNTを用いた時系列データの可視化には、(1)季節性と(2)予測という2つの特徴があります。
1) 季節性
毎年繰り返されるパターンを季節といいます。 売上などのビジネスKPIは、時間や曜日などの季節的要因の影響を大きく受けます。 そのため、季節のパターンを定量的に理解することが重要です。
しかし、下記のように時間(注文日)の売上(平均)を可視化すると、季節のパターンを把握することは非常に困難です。
HEARTCOUNTは、すべての日付と時間変数の四半期・月・曜日(周期)等の変数を自動的に作成します。
曜日ごとの売上パターンを知りたい場合は、以下のグラフで把握することができます。
または、各製品大分類の季節(曜日)の販売パターンを比較することができます。
(2) 予測
HEARTCOUNTはAR(Auto Regression、自己回帰)モデルを使用して時系列を予測します。ARモデルは、前の時間段階の観測値を回帰式に入力して、次の時間段階の値を予測する時系列モデルです。
X軸が日付と時刻変数に設定されている場合、常に右端に予測線アイコンが表示されます。アイコンをクリックすると、過去のデータに基づいて予測値が表示されます。
最小二乗法に基づく予測線と最大エントロピーに基づく予測線、合計2つの予測線が次のように描かれます。
各ポイントをクリックすると、予測値と予測方法を確認することができます。