Search
◼️

X軸: カテゴリ型変数、Y軸: 数値型変数

 スマートプロットメニュー

1. 基本的な使い方

X軸にカテゴリ型変数を指定すると、各カテゴリに対するY軸の値の分布を確認することができます。右上には以下のような6つのボタン(棒グラフ、箱ひげ図、95%の信頼区間、トレンドライン、分布、ヒートマップ)が表示されます。

2. 棒グラフ

それぞれのカテゴリが持つ変数値の大きさ(Quantitative Amount)を効果的に比較するために棒グラフを用いて視覚化することができます。
X軸をサブグループとして選択すると、右上に表示されているグラフの種類が変わり、Y軸を平均/合計のどちらで見るかを選択することができるようになります。
サブグループの左側のアイコンをクリックすると、Y軸の値の降順で並び替えることができます。
上の画像では、Y軸の値の始点が 12.2K(12,200) となっていますが、始点を 0 に変更したい場合は、視覚化画面の右側のコントロールウィンドウで [常に"0" を表示する] をクリックします。
グループ化された棒グラフ
2つのカテゴリ間の違いを比較するためにグループ化された棒グラフや積み上げ棒グラフを使用することができます。
グループ化された棒グラフでは、1番目のカテゴリをX軸に配置した後、2番目のカテゴリ(サブグループ)を1番目のカテゴリそれぞれの中に配置します。以下の例は、X軸にカテゴリ型変数「年齢_bin」を選択し、サブグループに2番目のカテゴリ型変数として「勤務部署」を選択したグラフです。
グループ化された棒グラフは、カテゴリの数が多すぎると解釈が難しくなります。勤務部署別の年齢による従業員の満足度の違いであれば、X値とサブグループとを入れ替えて以下のように表示することもできます。
積み上げ棒グラフ
積み上げ棒グラフは、棒グラフを横に並べるのではなく、縦に積み重ねる方が効果的な場合に使用する視覚化方法です。
右上の2番目のアイコンを押すと、積み上げ棒グラフが画面に表示されます。
サブグループを上に積み上げる積み上げ棒グラフは、個々のカテゴリの [平均] 値よりも [件数] や [合計] で積み上げる方が視覚的効果や解釈の面で適しています。
以下のグラフは、Y軸に「スコア:エンゲージメント」を選択し、変数の計算を「合計」に変更した後、降順で並び替えした図です。
関心のあるセグメントをクリックすると、そのセグメントの詳細情報をみることができます。
比率を表現する
X軸とサブグループを設定すると、Y軸の値リストの上部にレコード数ボタンが生成されます。
レコード数をクリックすると、Y軸をレコード件数やその比率(構成比)に設定することができます。

3. 箱ひげ図

箱ひげ図(boxplot)とは、最大値、最小値、中央値、四分位偏差を用いて、データの測定値がどのような形に分布しているかを簡単に把握することができるグラフです。
右上の 箱ひげ図 アイコンをクリックすると、視覚化画面に箱ひげ図が表示されます。その中から1つのボックスプロットをクリックすると、各カテゴリの詳細な値を確認することができます。

4. 95%の信頼区間

95%の信頼区間とは、同じ方法で100回測定したとき、特定の区間内に95回入る数値と言うことができます。各カテゴリごとに平均と信頼区間の範囲が表示され、各カテゴリ値の違いを把握することができます。
以下の分析画面からは、全体のコピー機の売上の平均は1620円であり、コピー機の売上の平均が95%の確率で測定される区間は1380円から1850円までと理解することができます。
参考までに、すべてのカテゴリの信頼区間が同じであれば、通常それは無意味な結果であると判断します。

5. トレンドライン

各カテゴリの平均値をつないた形で全体のトレンドラインを把握することができます。右側のコントロールウィンドウを使ってX軸の並び替え方法を変更し、トレンドを一目で見ることができます。データポイントをクリックすると、対応するカテゴリの平均値が表示されます。

6. 分布

分布は、データの頻度を青い線で表現する視覚化機能です。青い線が長いほど、対応する値にデータが多く存在することを意味します。

7. ヒートマップ

データの値を色に変換して視覚的な分析を可能にするデータ視覚化手法で、色が濃くなる(紫色)ほど高い密度を示します。