| 要旨トップ | 本企画の概要 | | 日本生態学会第65回全国大会 (2018年3月、札幌) 講演要旨 ESJ65 Abstract |
シンポジウム S10-1 (Presentation in Symposium)
データの分散の計算は、各数値から標本平均を引いて2乗して(サンプル数nでなく)n-1で割る。統計学の最初に学ぶ基本であり、今日、たいていの計算ソフはこれで分散を求めてくれる。
ところで、なぜnでなくn-1なのかと尋ねられた時、納得のいく回答を返せるだろうか?
複数の統計モデルをデータに適用すると、たいていの計算ソフトは赤池情報量規準(AIC)の値も示してくれる。これが小さいほどいいモデルなのでそれを選ぶ。
ところで、「いいモデル」とはどういう意味で「いい」のか。人を納得させられるよう回答できるだろうか?
AICの算出では、パラメータ数を「罰則として引く」ことを知っている人も多いだろう。ではなぜぴったりパラメータ数なのか。2倍ではダメなのか。実際、別な情報量規準BICでは、ln(n)倍する。AICとBICの違いは何なのか。こうした疑問に答えられるだろうか。
こうした素朴な疑問に答えられるようになるには、学会中の短いチュートリアル講演では無理で、3単位15コマ以上の授業で教わる必要があるという認識を持つことが最初のステップである。とりわけ、キーワードとして挙げられるのは、確率分布と帰納推論である。