| 要旨トップ | 目次 | 日本生態学会第72回全国大会 (2025年3月、札幌) 講演要旨
ESJ72 Abstract


一般講演(ポスター発表) P3-007  (Poster presentation)

Semantic Segmentationによる鳥類が鳴いている区間の高精度な抽出【O】【S】
High-precision extraction of bird song intervals using semantic segmentation【O】【S】

*水村春香, 安田泰輔, 松山美恵, 塚田安弘, 瀧口千恵子(山梨富士山研)
*Haruka MIZUMURA, Taisuke YASUDA, Mie MATSUYAMA, Yasuhiro TSUKADA, Chieko TAKIGUCHI(MFRI)

 近年,機械学習により録音された音声から自動で種を識別する技術が発展し,鳥類全体を対象とした自動音声抽出が進み始めている.一方,音源から鳥類の音声を網羅的に抽出することは難しく,解析者が手作業で切り出している場合が多い.本研究は鳥類の音声抽出においてこれまで使用例のないセマンティック・セグメンテーション(SS)を用いて,富士山麓の森林性鳥類の音声のみを効率的かつ正確に抽出する手法の開発を試みた.本研究ではSSモデルとしてDeepLabv3+を採用し,エンコーダーとしてResNetを用いた.音声データをスペクトログラム画像へ変換した画像データを使用し,これに対して”鳥類の音声(複数種含む)”と”鳥類の音声ではない(無音も含む)”の2クラスで色分けし,教師データを作成した.教師データは訓練,検証,テストデータそれぞれ1248枚,416枚,416枚と6:2:2となるよう分割した.トレーニングの結果,複数種の鳥類の音声が含まれていても検証データのIoUスコア(一致率)は0.936と高い精度で鳥類の音声を抽出可能であることが明らかとなった.


日本生態学会