ディープラーニングによる画像認識技術には、画像に何が写っているのかを分類する"分類(Classification)"や全体として何を表しているのかを認識する"認識(Recognition)"とどこに何が写っているのかを抽出する"物体検出(Detection)"があります。
弊社では、「何が写っているのかを分類した上で、それがどこに写っているのかを提示する」仕組みとして、Tensorflow+KerasのSSD(SingleshotMultiDetector※)を検証しています。
※SSD:1枚の画像から複数の物体を検出する。
画像、映像に何が写っているのかの定義を、人間がコンピュータ(ディープラーニングモデル)に教えることを、 "学習させる"と言います。学習に使うデータを、教師データと言い、これらをどれだけ用意して、何回学習させるか?によってモデルの抽出率※、認識精度※や、汎化性能※が高まります。
※抽出率:対象をどれだけ漏れなく抽出できるか
※認識精度:認識した結果がどれくらい合っているか(どれくらい間違いなく認識したか)
※汎化性能:学習させた画像、映像以外の同対象を認識できるかどうか?(自分が見たもの以外の特徴をどれだけ認識できるか)
1区分最低100枚。学習回数は50回実行する。Accuracyが0.7以上得られれば成功。それ以下は失敗。
SSD300(VGG16派生モデル)のモデルを転移学習。
教師データに4K動画からの静止画を活用する
高速道路上を走行する車両から撮影した前方映像を使って、案内標識、キロポスト、クッションポール、跨道橋、
クッションドラム等の高速道路設備の物体認識をします。
GPSによる位置情報と、画像/映像に何が写っているのかの情報を合わせて、データベースの検索情報として活用できます。
高速道路設備・施設コンクリート部の剥落、ガードレール等金属部分の錆、付近植生の変化を認識します。
異常個所の特徴をうまくモデル化できれば、変状箇所と位置情報を紐づけたデータベースを自動的に作成できます。
▼この記事を書いたひと
R&Dセンター 松井 良行
R&Dセンター 室長。コンピュータと共に35年。そしてこれからも!
●富士見事務所 TEL : 052-228-8733 FAX : 052-323-3337
〒460-0014 愛知県名古屋市中区富士見町13−22 ファミール富士見711 地図
交通部 R&Dセンター