i-Learning 株式会社アイ・ラーニング

i-Learning 株式会社アイ・ラーニング



コラム 第3回「データの有効数と記述統計量」


こんにちは、長谷川です。
前回のコラムではデータの型について、4つの尺度の確認をすることを書きました。
次に、その4つの尺度において、どのようにデータを要約すればいいのかということを説明します。

 ■ [ 記述統計量 ]

分析を行う場合、まず確認したいのが扱うデータの件数です。
データの件数を確認するため、記述統計量を出力することで確認することができます。

IBM SPSS Modelerでは、テーブルを実行することでフィールド数とレコード数を確認することができます。


IBM SPSS Modelerでのテーブルの表示


またIBM SPSS Statisticsでは記述統計量が出力されますが、統計量を読む際には注意が必要です。
その理由は、出力結果において、使える統計量と使えない統計量があるからで、それはデータ型から判断します。


IBM SPSS Statisticsの記述統計量の出力結果


データ型は、カテゴリデータとスケールデータに分けることができます。
記述統計の出力結果では「平均値」「標準偏差」なども出力されますが、カテゴリデータでは、これら統計量は使えません。平均値といった中心傾向の測度や、標準偏差といった散らばりの測度はカテゴリデータでは意味がないからです。
名義尺度の場合でも、有効数とデータ入力値の最小値と最大値を確認することができます。しかし、この最小値や最大値は入力された数値の一番小さいものと一番大きいものが表示されるだけで、この数値の大小関係には意味がありません。ですので、単なる記号としての数値が出力されるだけです。
順序尺度の場合には、この最小値と最大値には意味があり、データの範囲(最大値-最小値)に意味があるものとなります。
スケールデータの場合には、統計量すべてが統計的に意味のあるもので、統計量として扱うことができます。このように、データ型から統計量が使えるか使えないかを判断します。

また、文字型データで入力された変数は、記述統計を実行することができません。記述統計のダイアログボックスの変数リストには、文字型データは表示されません。
IBM SPSS Modelerでは、データ検査ノードがあります。このノードを使えば、カテゴリ数から統計量、有効数まで確認することができます。データ型によってスケールデータの場合には統計量が出力され、カテゴリデータの場合にはカテゴリ数のみが表示されます。


IBM SPSS Modelerのデータ検査ノードの実行結果



関連講座