i-Learning 株式会社アイ・ラーニング

i-Learning 株式会社アイ・ラーニング



SPSS「教えて!内田先生」File01

file01:

「教えて!」:

  • 最近では正規性を仮定できない場合でも、標本が30ケース以上あり極端に分布が偏っていなければ正規性を仮定する分析を行っても良いという頑健性がうたわれていますが、自分で判断する自信がありません。

    正規性を仮定するパラメトリック検定を使用するかしないかの判断をする際の何か良い基準や指標になるものはありますか?

回答:

  • 分布の正規性を前提にしたt検定や分散分析などは、正規性に対して頑健である言われています。

    頑健であるというのは、正規分布から大きくズレていなければ結果に影響を与えないということです。

    ところが、この大きくズレているかどうかの判断が難しいわけです。

    このような判断には正規性の検定と正規確率プロットが役に立ちます。
    正規確率プロットにはP-PプロットとQ-Qプロットがあります。どちらもグラフ手法で、視覚的に判断します。目で見て明らかに直線的でないのであれば、大きくズレていると判断してよいでしょう。


  • 一方、正規性の検定も役に立ちます。
    この検定で有意でないと出てきても、正規分布だと結論することはできませんが、大きくズレてはいないだろうと判断することはできます。


  • ただし、どの検定手法にも言えることですが、データをあまり取らなければ、有意にはなりません。
    その意味では最低30以上は欲しいところです。
    さりとて、取りすぎると鋭敏すぎきて、ほんのわずかなズレも有意になってしまいます。

    正規性の検定とは、このように使いにく面を持っていますので、先の正規確率プロットと併用することをおすすめします。


    ちなみに、正規性の検定にせよ、正規確率プロットにせよ、データは正規分布しているから安心してt検定をおやりなさいというストーリーに使うのではなく、正規分布していないから、正規性を仮定しないノンパラメトリック法を使いましたというストーリーに使うのが本来の使い方でしょう。
    ノンパラメトリック法は、分布を仮定しないということが使うことのメリットですが、そのことよりも外れ値に頑健なので、外れ値を除外せずに解析できるというメリットのほうが大きいです。