減災機械学習とデータ分析からリスクを検証

機械学習とデータ分析からリスクを検証

最新のデータ分析手法である「機械学習」を用いて、旧来からの地名(農業集落名)と災害の発生可能性がどんな関係にあるのかを調査してみました。

分析プロセス

Step1: データ取得

総務省「e-Stat」より、農業集落データ(GISデータ)をダウンロードします。

使用したデータ・参考文献

  • 農業集落データ(農林業センサス調査単位、総務省「e-Stat」より入手)
  • 学習データ(※下記文献を参考に作成)
  • 愛知県平均N値データ(愛知県防災危機管理課提供データをもとに作成)
  • 東日本大震災による千葉県香取市内の液状化被害地域データ(千葉県香取市HPを参考に作成)

【※参考文献】

  • 河合真梨子、福和伸夫、護 雅史、飛田 潤:地震ハザードの説明力向上のための地名活用に関する研究 : 地形に由来する分類方法の提案と活用可能性の検討、日本建築学会構造系論文集 74(636)、2009年、pp.409-416.

Step2: 機械学習で地名を分類

機械学習フレームワーク"Jubatus(ユバタス)"の分類機能を使い、※参考文献に提示された分類方法を参考に、各農業集落を地名(漢字)で「軟弱」・「良好」・「例外地名」の3種類に分類します。
「軟弱」・「良好」に区分された集落名には、そのグループに属することの「確からしさ」がスコアで付与されます。

入力(学習用データ)
■地名の漢字分類データ
出力
■Classifierの結果

機械学習で地名を分類

「"山"という漢字が含まれる地名は"良好・山地"という地形である」・・・といった漢字と地形がペアになったデータをいくつか与える
地名に含まれる漢字から地形を分類する

Step3: GISで可視化

分類した結果を農業集落データにリンクさせ、GISで主題図表示をします。
これにより、結果がどのように分布しているかがわかります。
実際に災害被害のあったエリアなどと重ねて、どの程度正しく分類されたかを確認します。

愛知県西部での分析結果

愛知県西部での分析結果

千葉県香取市での分析結果

千葉県香取市での分析結果


Step4: 統計分析

災害被害データがない地域については、地盤の軟弱度を表すN値(ボーリング調査結果)などの数値と比較をし、分類した結果(「確からしさ」のスコア)との間に、どの程度の相関関係があるかを調べます。


わかったこと

  1. 愛知県の農業集落データを用いた分析。「確からしさスコア」と、地盤の軟弱度を示すN値とを比較した結果、県西部には「軟弱」の地名分類に属し、N値も小さい集落が多いことが分かった。
  2. 東日本大震災時の液状化被災地である、千葉県香取市で同様の分析を行ったところ、実際に液状化被害に見舞われたほとんどの集落が「軟弱」の地名分類に属した。
  3. 農業集落名による地名判定と旧河道の重ね合わせによって、液状化被害エリアを推定できる可能性がある。


パンフレット

 

おすすめの関連記事