| 要旨トップ | 目次 | | 日本生態学会第66回全国大会 (2019年3月、神戸) 講演要旨 ESJ66 Abstract |
一般講演(ポスター発表) P2-367 (Poster presentation)
RNA-seqの誕生と共に、その特有のデータ構造(高次元、小サンプルサイズ)に適応した統計学的手法が必要とされ発展してきた(例えばedgeR、DESeq、Cuffdiffなど)。これらRNA-seq解析における統計学的手法の主目的の一つは発現量が変化した遺伝子を検出することにある。そのため検出された各々の遺伝子発現量と表現型値の関係を適切に推定する統計学的手法が存在せず、遺伝子発現量が表現型値にどの程度影響を与えているのか未だ理解が進んでいない。
SeoらはBMI(Body Mass Index)やホルスタイン乳量のデータに線型回帰モデルを適用して、遺伝子発現量の表現型値への影響度(回帰係数)を推定した。この研究ではBMIや乳量に関係する多数の遺伝子について、発現量の間に相関(多重共線性)がない、つまり独立であることを仮定している。ところが、この仮定は多くの生物学的現象で成り立たない。したがってSeoらの研究では遺伝子発現量の相関性の問題に対応しておらず、遺伝子発現量の表現型値への影響度を適切に推定しているとは考えづらい。
本研究の目的は、線型回帰モデルにおいて説明変数(遺伝子発現量)の間に相関が存在しても、説明変数の応答変数(表現型値)への影響度(回帰係数)を適切に推定することである。特に高次元、小サンプルサイズ、多重共線性が存在するデータに対してリッジ型線形回帰モデルの有効性をシミュレーションで検討し、さらに実データにも適用検討した。