Search

セグメンテーション

How? KPIを最適化するパターンを見つける マイクロセグメント機能により、任意のKPIを最適化できる実行可能なルールを発見することができます。
ここで言うKPIとは、分析の目標となる変数を意味します。 つまり、必ずしもKPIとして登録されていなくても、全ての変数をマイクロセグメントの目標変数として設定することができます。
メニューに戻る

1. セグメンテーションとは?

人は常に業務の最適化を考えています。
もしある企業のマーケティング担当者がマーケティングキャンペーンを展開する際に、このキャンペーンに積極的に反応するグループ/反応しないグループを区別するルールを見つけたとします。 そうすると、その企業は今後反応する可能性の高い集団だけを選んで効率的にターゲティングを行うことができるようになります。
このように、自分が望む目標を最適化する方法を自動的に見つけ出すことができたらどうでしょうか?
HEARTCOUNTはKPIを最適化できるルールを自動的に発見し、どのような条件で実行するのが最適なのかを推薦してくれるマイクロセグメント機能を提供しています。マイクロセグメント機能は、意思決定木(decision tree)、つまり、異なる二つの集団を分類する(classify)ルールを作り出す代表的な機械学習アルゴリズムを使用します。
決定木とは?

2.セグメンテーションを活用する

以下の例は、ディスカウントマートの利益を最適化するルールを自動的に見つけるプロセスを示す例です。 このように、特定のKPIの最適化ルールをマイクロセグメント機能を活用して見つける方法を一緒に見てみましょう。

(1) 最適化ルール探索

1.
まず、最適化したい変数を選択してください。 (例では[利益]を変数に設定) そして、右上の分析ボタンをクリックすると、自動的にテーブルにtop20%bottom20%を分類するルールが提示されます。
セグメンテーションは目的変数が数値型の場合は自動的に上位/下位グループを分け「最適化ルール」を、カテゴリ型の場合は2つのグループの「分類ルール」を探します。カテゴリ型変数は以下のように設定可能です。
1.
(オプション) マイクロセグメンテーションの基本原理は、2つのターゲット集団を区別して、2つの集団が分類される「ルール」を見つけることです。 ユーザーは、デフォルトで提供される上位20%/下位20%集団以外にも、様々なターゲット集団を直接設定することができます。歯車をクリックして、分類ルールを作成したい二つの集団の範囲を直接調整したり、数値を入力することもできます。
1.
テーブルの各項目を詳しく見てみましょう。ちなみに、テーブルのルールは、ターゲット比率が高い順に降順になっています。
純度 : 分類規則が該当する集団でターゲット集団が占める割合、その分類規則がどれほど正確であるかを知ることができる。 (ex.'割引率が12%未満の全体集団'から'割引率12%未満+利益上位20%である集団'が占める割合)
ターゲット比率:ターゲット集団のうちルールが該当する集団が占める割合。 (ex.'利益が上位20%である全体集団'で'割引率が12%未満の集団'が占める割合)
平均KPI差:個別分類ルールが該当するセグメントとターゲットに設定した変数の全体平均の差。
(スマートサーチ) : 各行の右側にあるをクリックすると、各ルールに該当する個々のレコード(データ)をより詳細に探索できる「スマートサーチ」メニューに移動します。
4.
予測モデルの概要情報もご覧ください。
下図の赤線で示した部分の矢印をクリックしてください、
デフォルトで提供される2つのターゲット集団またはユーザーが直接設定したターゲット集団の概要情報を確認することができます。
要約情報のターゲット比率は、上記で説明した各セグメントのターゲット比率とは異なります。 分母である全体ターゲットは同じですが、分子であるセグメントターゲット数が異なるためです。要約情報では、導出されたすべてのルールセグメントを合計し、総ターゲット数で割ります。利益上位20%集団の場合、合計1.64kのサイズであり、導出された全てのセグメントのサイズは1.53kですね。 つまり、利益が上位20%である集団のうち93.6%が驚くべきルールを持っているという意味になります。

(2) 可視化グラフ

ユーザーがテーブルに提示されたルールをより簡単に理解できるように、下の画面のようにグラフを通じて最適化ルールを詳しく把握することができます。
下図は「利益最適化」を基準に導出されたルールのうち、テーブルの一番上にあるルールである98955<=売り上げ条件に該当するグラフ/セグメントの特性を示す図です。
クラス:該当条件である98955<=売り上げに分類されるレコードの多くが利益トップ20%に該当することを意味します。
サイズ : 該当条件を満たすレコード数(2,493レコード)
純度 : 該当条件を満たすセグメントサイズ1,643個中2,493個(65.9%)が販売利益上位20%に該当することを意味します。純度が高ければ高いほど、分析結果に対する信頼性も高くなります。 簡単に言えば、その分類ルールがどれだけ正確に予測するかを示す尺度です。
④ ターゲット比率:販売利益上位20%に属する総レコード数(1,674個)のうち、1,643個(98.15%)がそのセグメントに属することを意味します。 (リコール/再現率とも呼ばれます)
⑤平均KPI差:該当セグメントに属するレコードの平均KPIと分析対象全体の平均KPIの差(全体利益平均+18.1K、該当条件のレコード平均利益 +65.5K、平均KPI差=+47.3)
⑥セグメント分類規則:上記図上部の最初の表に該当する分類規則を詳細に表示したものです。
⑦可視化グラフ:導出された利益最適化条件をグラフで表現したものです。青色で鮮明に表示された領域が該当する分類ルールの領域です。
⑥決定木 : アイコンをクリックすると、下図のように分類ルールがツリー形式で表現されます。

(3) ファイル出力

SQLをクリックすると予測モデルを下記のクエリで確認することができます。
アイコンをクリックすると予測モデルの結果をcsvもしくはxlsxファイルとして保存することができます。