i-Learning 株式会社アイ・ラーニング

i-Learning 株式会社アイ・ラーニング



コラム 第2回「データ型の設定」


こんにちは、長谷川です。
第2回は、データ型の設定についてお話します。

 ■ [ データ尺度 ]

分析者は分析を行うにあたって、まずデータの型を認識することが重要です。
データ尺度には、4つの尺度があり、名義尺度、順序尺度、間隔尺度、比(率)尺度になります。この4つの尺度で、どの尺度にあたるのかを認識することが重要です。そこで、この4つの尺度について、次にまとめておきます。


  • 名義尺度:大小関係を持たないカテゴリデータです。男・女といった性別や地域で東西南北など単にカテゴリを表すだけで、大小関係を持たないカテゴリデータになります。
  • 順序尺度:大小関係を持つカテゴリデータです。大・中・小、上・中・下、低・中・高など大小関係を持つカテゴリデータになります。
  • 間隔尺度:ある一定の測度で測られたデータです。その測度は、一定の間隔を持つデータで、大小関係があり、等間隔で目盛りが降られたものです。スケールのデータになります。
  • 比(率)尺度:間隔尺度の概念にプラス原点0 を追加したものです。ここでの 0 の持つ意味は、「0 =なし(存在しない)」ことを意味します。これもスケールデータになります。


そこで、カテゴリデータである順序尺度とスケールデータである間隔尺度と比率尺度の違いは、等間隔で目盛りが降られているかによって違います。順序尺度の大小関係だけでは、どれくらいの違いがあるのかを測定することはできませんが、ある一定の測度で測られたスケールデータ場合には、どれくらいの違いがあるのかを数値として判断することができます。このことは、加法性という概念が可能となります。この違いが、カテゴリデータとスケールデータの違いです。まず、この違いと確認することが必要です。

データの型についての設定をIBM SPSS StatisticsとIBM SPSS Modelerで設定する画面は以下になります。

IBM SPSS Statisticsでは、データ ビューのタブ


IBM SPSS Statistics のデータ ビューの設定:尺度の設定

IBM SPSS Modelerでは、データ型のノード


IBM SPSS Modelerのデータ型ノードの設定:尺度の設定



関連講座