| 要旨トップ | 本企画の概要 | | 日本生態学会第61回全国大会 (2014年3月、広島) 講演要旨 ESJ61 Abstract |
シンポジウム S02-5 (Lecture in Symposium/Workshop)
近年のセンサ技術の飛躍的な進歩により、半自動的に収集されたビッグデータを様々分野で見られるようになった。生物の行動に関するデータも、気象や地理などの周辺データから、個体の位置情報や定点カメラによる映像まで、様々なデータが大量に手にはいるようになった。ビッグデータは非常に初歩的でクセのあるデータが多いため、ビッグデータ解析を主体とする研究するさいには、ある種のコツと的確な視点が必要である。本講演では、データ解析手法のいろはから、ビッグデータ固有の注意点までを簡単に解説したい。
近年主に使われているデータ解析の手法は大きく分けて4つ、統計、機械学習、データマイニング、可視化がある。それぞれデータから知識を得るための手法であるが、目的が気づきであるか判別であるか、背景知識と仮説モデルがあるかないか、など利用状況と目的に異なりがある。これらの手法について、俯瞰的な解説を行う。
また、ビッグデータに典型的な構造や性質から来る難しさを解説し、ビッグデータ利用で起こりうる解析上の困難を俯瞰する。特に多様性に対しては、新しく開発した多様性解析手法を紹介し、複雑に絡み合った関係性のグラフからグループ構造を効率良く抽出できる様子を解説する。