« 統計分析の基本(16) | トップページ | CNNへの道のり(1) »

2020年5月17日 (日)

統計分析の基本(17)

 実験データには、外れ値が付きものである。実験担当者は、データ整理の段階で外れ値に気付き、取り扱いに悩む。

 外れ値が単なる計測ミスや転記ミスの場合は、再実験で出現しないので問題ない。再実験で、やはり外れ値に見えるものが出現するときどうすればよいだろうか。

 やってはいけないことは、主観で外れ値を取り除くことである。外れ値があると、分類結果が変わったり、有意差が変わったりすることもあり、「外れ値」というくらいなので外してしまいたいと思うのが常である。外したいときは、そのデータを外してもよいか棄却検定をやってもよい。また、パラメトリック検定とノンパラメトリック検定の両方を実施するのもよい。一般的に、ノンパラメトリック検定の方が厳しいため、それで有意差が変わらなければよいだろう。それでもだめなら、外れ値が出ないようなパラメータを考えることである。

 今回の解説で統計分析の基本は終了する。明日からは新シリーズを展開する。

 

|

« 統計分析の基本(16) | トップページ | CNNへの道のり(1) »

コメント

コメントを書く



(ウェブ上には掲載しません)




« 統計分析の基本(16) | トップページ | CNNへの道のり(1) »