| 要旨トップ | 目次 | 日本生態学会第65回全国大会 (2018年3月、札幌) 講演要旨
ESJ65 Abstract


一般講演(ポスター発表) P1-031  (Poster presentation)

畳み込みニューラルネットワークを用いた鳴き声による鳥類の種判別

*前川侑子(国際航業(株)), 松井孝典(大阪大学), 牛込祐司(国際航業(株)), 岡野隆行(国際航業(株)), 黒田治男(日本鳥学会)

鳥類は、生態系の指標種として扱われることが多く、環境アセスメント等における調査対象項目となっている。しかし、従来の鳥類調査では、専門知識を持った調査員が現地に行って種判別を行っているため、調査員の高齢化による人材不足やコスト面等での問題がある。そこで、機械学習技術を用いて鳴き声による鳥類の種判別を自動的に行うことで、現状の問題解決と様々な場面での活用(長期間モニタリング、危険地帯での調査等)が期待できる。海外では、2014年以降、鳥類の識別器の開発精度を競う国際コンテスト(BirdCLEF)が開催されており、近年、ディープラーニングを用いることで精度の高い識別器が開発されている。一方、日本では、鳥類の種判別を行う研究は少なく、精度の向上や対象種数の拡大等の課題がある。よって、本研究では、鳥類を対象に、畳み込みニューラルネットワークによる機械学習を用いることで、高精度な種判別を自動的に行うことを目的とする。まず2007〜2017年の間に日本の各地で14種類の鳥類の音声を収集した201のWAVEファイル(サンプリング周波数44100Hz, 16bit)を用いた。そのラベル付き音声を100ms間隔でサンプリングし、音圧が3dBバーストした時点を自動検出した。検出された時点を中心に前後500ms間、周波数帯100Hz~12kHzの領域で、224×224pixelのFFTスペクトログラム画像を抽出した。またこの際に、鳥の鳴き声以外の環境中の雑音も別途抽出して、ノイズクラスを含む15クラス、計5585枚の画像データベースを構築した。その画像データベースに対して、畳み込みニューラルネットワーク(Convolutional Neural Networks)のネットワーク構造の一種である事前学習済みのResnet-50をファインチューニングすることで、種レベルの識別で交差検証の正答率が97%であった。今後は実環境下に適用するために、より頑健かつ汎化性の高い識別器の構築を目指し、未知の音声に対する汎化性能を評価する。


日本生態学会