i-Learning 株式会社アイ・ラーニング

i-Learning 株式会社アイ・ラーニング



コラム 第6回「予測モデル」


こんにちは、長谷川です。
第6回は、予測モデルについてお話します。

 ■ [ 予測モデル ]

予測モデルは、“対象”フィールドのロールを持つ教師ありモデルと言われる分析になります。
また、予測のモデルでは、“対象”のロールフィールドがカテゴリ型と連続型のフィールドで分析手法が変わります。

例えば、統計解析の予測モデルでは、線型回帰とロジスティック回帰があります。線型回帰では連続型の“対象”フィールドを予測するのに対して、ロジスティック回帰ではカテゴリ型の“対象”フィールドを予測します。

マシンラーニングのモデルであるニューラルネットワークやサポートベクターマシン(SVM、LSVM)では、カテゴリ型“対象”フィールドでも連続型“対象”フィールドでも予測することができます。

また、ディシジョンツリーのモデルでは、一部2値データしか使えない手法がありますが、カテゴリ型“対象”フィールドは全てのモデルで使用できます。連続型“対象”フィールドでは、C& &RT(CART)とCHAIDの手法しか使えません。この2つのディシジョンツリーの手法は、“対象”のデータ型がカテゴリ型と連続型で、使われる計算の方法が変わります。C&RTの手法は、カテゴ リ型“対象”フィールドではGiniの分散の測度を使うのに対して、連続型“対象”フィールドでは分散を使用します。CHAIDの手法は、カテゴリ“対象”フィールドではカイ2乗検定を使うのに対して、連続型“対象”フィールドでは分散分析(ANOVA)を使用します。ディシジョンツリーの手法で、カテゴリ型対象フィールドでは、最頻値(モード)で予測するのに対して、連続型対象フィールドでは平均値に予測します。


連続型“対象”フィールドの予測


カテゴリ型“対象”フィールドの予測

このように、予測モデルの場合、“対象”フィールドのデータ型で使える、使えない手法や計算方法が変わるので、モデル作成の際にはデータ型を考慮に入れるべきです。



関連講座