Search
◼️

X軸:カテゴリ型変数、Y軸:数値型変数

 スマートプロットメニュー

1. 基本的な使い方

X軸にカテゴリ型変数を指定した場合、各カテゴリに対するY軸の値の分布を確認することができます。 右上に次のような6つのボタン(棒グラフ、ボックス図、95%信頼区間、トレンドライン、分布、ヒートマップ)が表示されます。

2. バーチャート(Bar Chart)

異なるカテゴリーが持つ変数値の大きさ(Quantitative Amount)を効果的に比較するために棒グラフを使用して視覚化することができます。
X軸をサブグループに選択すると、右上のグラフタイプが変わり、Y軸を平均/合計のどちらで見るかを選択できるようになります。
サブグループの左側のアイコンをクリックすると、Y軸値の降順でソートすることができます。
上の画像はY軸の値が47から始まっていますが、これを0に変えたい場合は、可視化画面右側のコントロールウィンドウで[Always show "0"]をクリックします。
グループ化された棒グラフ
二つのカテゴリー間の違いを比較するためにGrouped/Stacked Bar Plotを使用することができます。
Grouped Bar Plotでは、最初のカテゴリをX軸に配置した後、2番目のカテゴリ(サブグループ)をそれぞれの最初のカテゴリ内に配置します。下の例は、X軸にカテゴリ型変数である[年齢_bin]を選択し、サブグループに2番目のカテゴリ型変数である[勤務部署]を選択した図です。
Grouped Bar Plotは、カテゴリの数が多すぎる場合、解釈が難しくなります。もし職群別の年齢による従業員の満足度の違いであれば、X値とサブグループを入れ替えて以下のように表すこともできます。
積み上げ棒グラフ
Stacked Bar Plotは、棒グラフを水平に置くのではなく、縦に積み重ねる方が効果的な場合に使用する視覚化方法です。
右上の2番目のアイコンを押すと、Stacked Bar Plotが画面に表示されます。
サブグループを上に積み上げるStacked Bar Plotは、個々のカテゴリーの[平均]値より[個数]や[合計]で積み上げる方が視覚的な効果と解釈に適しています。
下の図は、Y軸を[不良件数]に選択し、変数に対する計算を[合計]に変更した後、降順でソートした図です。
興味のあるセグメントをクリックすると、セグメントの詳細情報を見ることができます。
比率を表現する
X軸とサブグループを設定すると、Y軸の値リストの上部にレコード数ボタンが生成されます。
レコード数をクリックすると、Y軸をレコード数または比率で設定することができます。

3. ボックスプロット

ボックスプロット(boxplot)とは、最大値、最小値、中央値、四分位偏差を使用して、データの測定値がどのような形に分布しているか簡単に分かるグラフです。
右上のボックスプロットアイコンをクリックすると、可視化画面にボックスプロットが表示されます。 そのうちの一つのボックスプロットをクリックすると、各カテゴリの詳細な値を確認することができます。

4. 95% 信頼区間

95%信頼区間は、同じ方法で100回測定したとき、特定の区間内に95回入る数値と言えます。 各カテゴリーごとに平均と信頼区間の範囲が表示され、各カテゴリー値の違いを把握することができます。
下の分析画面を活用すると、全体のコピー機売上の平均は2,080円であり、コピー機売上の平均が95%の確率で測定された区間は1250円から2910円だと理解できますね。
参考:すべての変数の信頼区間が同じ場合、通常は無意味な結果であると判断します。

5. トレンドライン

各カテゴリーの平均値をつなぎ、全体のトレンドラインを把握することができます。右側のコントロールウィンドウを使用してX軸の配置方法を変更し、トレンドを一目で見ることができます。データをクリックすると、該当するカテゴリーの平均値が表示されます。

6. 分布

分布は、データの頻度を青い線で表現する可視化機能です。青い線が長いほど、該当する値にデータが多く存在することを意味します。

7. ヒートマップ

データの値をカラーに変換して視覚的な分析を可能にするデータ可視化手法で、色が濃くなる(紫色)ほど高い密度を示します。