こんにちは、長谷川です。
第8回は、アソシエーションについてお話します。
■ [ アソシエーション ] |
アソシエーションは、マーケットバスケット分析に代表される分析手法で、例えばどのような組み合わせで商品を購入しているかといったパターンを発見する手法です。
アソシエーションルールは、フィールド間の関連性を元にパターンを発見する分析手法で、フィールド間のクラスタ化を行います。
アソシエーションルールは、AprioriかCarmaで分析することができます。
モデルを作成する際のロールは、“入力”と“対象”の両方を同時に持つ“両方”を設定します。どのような事象が同時に起こるのか、“入力”と”対象”の“両方”の方向でルールを発見します。そこには時間の概念がなく、順序の概念がありません。またWebグラフで示されるような単一の関係だけではなく、複数の組み合わせから事象の起こるパターンを発見することができます。その際考慮するのは、組み合わせの件数を元にした確率からルールを作成します。
作成されたアソシエーションルール
このような順番の概念がないアソシエーションルールに対し、事象の起こる順番を考慮したモデルは、シーケンスのモデルで発見することができます。シーケンスモデルは、ウェブサイトの閲覧の順序など、順序を示すルールを発見することができます。
作成されたシーケンスのルール
これらアソシエーションのモデルは、インスタンス、サポート、確信度といった指標を元にルールを発見します。それぞれの指標は、データの件数を元にしていますので、比較的簡単に理解することができます。それぞれの指標で、インスタンスは前提条件を満たすレコードの数、サポート%は前提条件を満たすレコードの全体に対する割合、確信度%は前提条件を満たすレコードが結果に至る割合を示します。その他にリフトやデプロイアビリティなどの指標も出力されます。これらモデルを発見するデータの入力形式は、テーブル形式またはトランザクション形式を使用することができます。
ML0R4:IBM SPSS Modeler顧客分析【クラスタリング&アソシエーションモデル編】