こんにちは、長谷川です。
第6回は、予測モデルについてお話します。
■ [ 予測モデル ] |
予測モデルは、“対象”フィールドのロールを持つ教師ありモデルと言われる分析になります。
また、予測のモデルでは、“対象”のロールフィールドがカテゴリ型と連続型のフィールドで分析手法が変わります。
例えば、統計解析の予測モデルでは、線型回帰とロジスティック回帰があります。線型回帰では連続型の“対象”フィールドを予測するのに対して、ロジスティック回帰ではカテゴリ型の“対象”フィールドを予測します。
マシンラーニングのモデルであるニューラルネットワークやサポートベクターマシン(SVM、LSVM)では、カテゴリ型“対象”フィールドでも連続型“対象”フィールドでも予測することができます。
また、ディシジョンツリーのモデルでは、一部2値データしか使えない手法がありますが、カテゴリ型“対象”フィールドは全てのモデルで使用できます。連続型“対象”フィールドでは、C&
&RT(CART)とCHAIDの手法しか使えません。この2つのディシジョンツリーの手法は、“対象”のデータ型がカテゴリ型と連続型で、使われる計算の方法が変わります。C&RTの手法は、カテゴ
リ型“対象”フィールドではGiniの分散の測度を使うのに対して、連続型“対象”フィールドでは分散を使用します。CHAIDの手法は、カテゴリ“対象”フィールドではカイ2乗検定を使うのに対して、連続型“対象”フィールドでは分散分析(ANOVA)を使用します。ディシジョンツリーの手法で、カテゴリ型対象フィールドでは、最頻値(モード)で予測するのに対して、連続型対象フィールドでは平均値に予測します。
連続型“対象”フィールドの予測
カテゴリ型“対象”フィールドの予測
このように、予測モデルの場合、“対象”フィールドのデータ型で使える、使えない手法や計算方法が変わるので、モデル作成の際にはデータ型を考慮に入れるべきです。
MLA38:IBM SPSS Modeler 顧客分析【予測モデル:カテゴリ編】 MLA39:IBM SPSS Modeler顧客分析【予測モデル:スケール編】