ESJ69 シンポジウム S08-1

シンポジウム S08-1 （Presentation in Symposium）

生物多様性ビッグデータの作り方
How to create biodiversity big data

*塩野貴之（琉球大学）
*Takayuki SHIONO（University of the Ryukyus）

これまで我々のチームは、全球・日本・沖縄県など様々な空間スケールで多様な分類群を対象とし、生物多様性地図を作成してきた。地図化には、生物種ごとの分布・機能・系統情報と環境データを統合し解析することが必須である。このような生物多様性ビッグデータは、1)既存のデータベースの統合、2)個別の学術論文、同好会誌、環境アセスメント報告書など紙媒体資料のデジタル化、3)情報不足地域での現地調査という流れで整備される。また、データの形式は不均一で空間バイアスも大きく、種名や地理座標などの間違いも多く含まれているので、これらを規格化、強化、浄化する必要がある。
データは、GBIF採用のフォーマットである Darwin Coreに従い管理し、座標情報は、測地系や空間精度を検証し、紙媒体の和名やシノニムは、標準的な学名を与え規格化を行っている。また、かつての同一種が新種として複数種に区分される場合も多く、種名を付け直す必要がある。一方で、気候などの環境データも様々な空間解像度で作成され、空間的な欠損も多いために、欠損を内挿し、解像度をそろえることで規格化している。
強化プロセスは、分布の地理座標が欠損していることが多く、地名からジオコーディング作業により座標を与えて補完する作業を行う。既存データを解析することで情報不足地域を特定し、その地域は紙媒体の資料をデジタル化し、それでも不足している時は、可能ならば現地調査を行うことで、空間バイアスを最小化するようにデータを作成している。
浄化プロセスでは、誤同定や入力過程での誤植などを、地域ごとの種チェックリストやエキスパートレンジマップを用いて特定して補正または除外し、座標情報の誤りは地名情報と照合することで補正する。また在来種と外来種を種チェックリストで区分し、適宜、機能情報、系統情報などをあたえ、機能群、系統群ごとにまとめ、データを管理している。

生物多様性ビッグデータの作り方 How to create biodiversity big data

生物多様性ビッグデータの作り方
How to create biodiversity big data