| 要旨トップ | 本企画の概要 | | 日本生態学会第66回全国大会 (2019年3月、神戸) 講演要旨 ESJ66 Abstract |
自由集会 W13-2 (Workshop)
統計が苦手なユーザーの立場から、ノンパラメトリック検定を使うかどうかの選択や、使うときの方法について、困ったり迷ったりしている問題を述べ、他の演者に引き継ぎたい。
ノンパラメトリック検定のシンプルな原理は気持ちよく納得できる。また、どんな分布をしているデータにも使うことができるというのは嬉しい。正規分布をしているデータの場合には、パラメトリック検定のほうが検出力が高いとはいうが、あまり大きな違いはないようなので、それは構わない。このような考えで、好んでノンパラメトリック検定を使ってきた(ただし、データが正規分布をするはずだという体サイズのデータでは、大勢にしたがってパラメトリック検定を用いたこともある)。
ところが、ノンパラメトリック検定の代表選手というべきMann-WhitneyのU検定について、分散が等しくない2群間で用いるとまずいという指摘が聞こえてきた。しかも、分散が等しくないと第一種の過誤を犯しやすくなることもあるという。それは避けたいところだ。ここから苦難の道が始まった。大きく分散が異なる2群間で比較を行なうときに、Robust rank order testというのを使ったこともある。群間で分散が異なる場合、片方の群のデータに0が非常に多いということもある。このことも問題になるのではないかと思えてくる。分散に影響しそうな検出限界以下(例えば、<0.01 ppm)のデータや、測定が難しいほど大きな値のデータがある場合(1000 m超はすべて1001 mとして処理した場合など)も、特別な考慮が必要なはずではないのだろうか。Robust rank order testだけでよいのだろうか。シンプルな、できればすっきりと理解できる代わりの方法(あるいは補正法)を探している。