ESJ57 一般講演(ポスター発表) P2-051
*小泉逸郎(北大・創成), 池田隆美(Lincoln Univ.)
極端なデータ、つまり“外れ値”の存在は解析結果に大きな影響を与える。そのため散布図を描いて生データの分布を確かめたり、統計手法を使ったりと、外れ値を検出するために多くの努力が払われている。しかしながら、個体間の体サイズ差や地域間の群集類似度といったペアワイズデータの解析に対しては外れ値の検討がほとんどなされてこなかった。本講演ではペアワイズデータの相関を調べる際の(通常、マンテル検定を使用)、外れ値の検出法を紹介する。
一例として、個体群間の地理的距離と遺伝的距離の関係を調べるIsolation-by-distance(IBD)解析を取り上げ、既にパブリッシュされた論文にも多くの外れ値が含まれており、それにより結論が変わる可能性さえあることを示す。ペアワイズデータではひとつの個体(群)が複数のデータポイントを持つため、外れ値の影響がひときわ大きく、その検出が非常に重要である。
本手法はマンテル検定を用いるような全ての相関分析に適用可能であり、IBD以外にも地域間の群集類似度の解析、個体群間の同調性解析などに利用できる。本公演はKoizumi et al. (2006)の手法を用いて既存の文献をレビューし再解析したものである。統計パッケージRで解析プログラムコードを書いたので、多くの人達に本手法を用いて頂ければ幸いである。
Koizumi et al. (2006) Decomposed pairwise regression analysis of genetic and geographic distances reveals a metapopulation structure of stream-dwelling Dolly Varden charr. Mol Ecol, 15, 3175-3189.