1. 基本的な使い方
•
X軸変数が数値型の場合、サブグループは選択した変数のすべてのレコードをグループ化(集計)します。下の図は、そのX軸をサブグループにして散布図を表示した視覚化の結果です。
•
デフォルトのサブグループ計算方法は [平均] ですが、[合計] または [件数]に変更することができます。[件数] の場合、NA値(欠損値)を除いて各サブグループクラスに対するレコード数を計算します。
•
それぞれのデータポイントをクリックすると、そのデータの詳細な説明を見ることができます。
•
X軸とY軸の2つの変数間の相関関係を相関係数で把握することができます。
相関係数とは?
2つの変数の相関度を指数で表した値を意味します。
通常rと表現し、-1から+1までの値です。
•
-1: 一方が増加するともう一方は減少する
•
0: お互いに影響を与えない
•
+1: 一方が増加するともう一方も増加する
2. トレンドライン
右上のトレンドラインを押すと、2つの変数の相関関係を表すトレンドラインを青い線で表示します。トレンドラインの傾きにより、2つの変数間の関係を一目で確認することができます。
3. ヒートマップ
ヒートマップとは、熱を意味するヒート(heat)と地図を意味するマップ(map)を組み合わせた言葉で、データの値を色に変換して視覚的な分析を可能とするデータ視覚化技法です。ヒートマップアイコンを押すと、データの分布と密度を視覚的に把握することができます。色が濃くなる(紫色)ほど高い密度を示します。
プロットが重複している場合には、×2、×3などのアイコンで重複を知らせます。データポイントをクリックして表示されるポップアップウィンドウで矢印 < > を押すと、それぞれのレコードを確認することができます。
X軸とY軸が共に数値型データである場合、散布図グラフは以下のように描画されます。各ポイントは個々のデータ(レコード)を意味します。視覚化画面の右上では相関係数が表示され確認することができます。また、トレンドライン や ヒートマップで視覚化するためのアイコンがあります。
4. 時系列データの視覚化
日付であるのに日付変数として認識されていないのではないでしょうか?
Excelで該当の列を選択して、「右クリック → セルの書式設定」で日付形式に設定されていることを確認してください! Excelで日付形式に設定されていない場合でも、HEARTCOUNTで日付形式として認識させれば、年/四半期/月/週/曜日/曜日タイプなどの派生変数が生成されます。
時系列データとは、時間経過に伴う一定期間についての時刻の関数として表現されるデータを指します。HEARCOUNTを用いて時系列データを視覚化して予測することができます。
•
X軸に日付もしくは時刻変数を設定し、Y軸を視覚化したい変数に設定します。サブグループデータを指定することで、以下のように時系列を視覚化することができます。
•
右上にあるアイコンをクリックすると、様々な視覚化グラフに変更することができます。
HEARTCOUNTを用いた時系列データの視覚化には、(1)季節性 と (2)予測 という2つの特徴があります。
(1) 季節性
毎年繰り返されるパターンを季節といいます。売上などのビジネスKPIは、時期や曜日などの季節的要因の影響を大きく受けます。そのため、季節のパターンを定量的に理解することが重要です。
しかし、以下のように時(注文日)の売上(平均)を視覚化しても、季節のパターンを把握することは非常に困難です。
HEARTCOUNTは、以下のようにすべての日付や時刻変数について季節性(周期性)の変数を自動的に作成します。
曜日別の売上パターンを知りたい場合は、以下のようなグラフで把握することができます。
また、製品カテゴリー別の季節(曜日)の売上パターンを比較することもできます。
(2) 予測
HEARTCOUNTはAR(Auto Regression: 自己回帰)モデルを用いて時系列を予測します。ARモデルは、前の時間ステップの観測値を回帰式に代入して、次の時間ステップの値を予測する時系列モデルです。
X軸が日付変数や時刻変数に設定されている場合、常に右上に予測アイコンが表示されます。アイコンをクリックすると、過去のデータに基づいて予測値が表示されます。
最小二乗法に基づく予測線と最大エントロピーに基づく予測線の合計2つの予測線が上のように描かれます。
それぞれのポイントをクリックすると、予測値と予測方法を確認することができます。