災害救援のための、機械学習ベースの被害評価 第03回 20年08月 / 最終更新:2020.08.07

こんにちは。野田貴子です。今回から海外のWeb関連のAIニュースを意訳して紹介していきます。興味がある方はご覧ください。

 

地震やハリケーン、洪水などの自然災害は広大な土地と数百万の人々に影響を及ぼしますが、このような災害への対応が物流面での大きな課題になっています。政府、NGO、国連組織などの危機対応者は、限られた資源を割り当てるための最適な方法を考えるために、包括的かつ正確な災害状況を迅速に知る必要があります。このために最大30cmの解像度を持つ超高解像度(VHR)衛星画像がますます重要な危機対応ツールとなり、災害によって地形やインフラ、人口がどのように変化したのかについて、これまでにない幅広い視覚情報を提供しています。

しかしながら、未加工の衛星画像から作戦に必要な情報(崩壊した建物、橋の亀裂、一時的な避難所が設置された場所)を抽出するには、依然として集中的な手作業が必要です。たとえば2010年のハイチ地震の場合、首都のポルトープランス地域だけでも9万を超える建物をアナリストが手動で調査し、それぞれが受けた被害を5段階で評価しました。これらの手動分析を完成させるためには専門家チームが数週間かける必要がありますが、このような分析が最も必要とされるのは、最も緊急な決断が行われる災害後48~72時間以内になります。

このような災害の影響を軽減するための、「Building Damage Detection in Satellite Imagery Using Convolutional Neural Networks」をご紹介します。これは、衛星データを自動的に処理して建物の被害評価を生成する機械学習(ML)のアプローチについて詳しく述べたものです。国連世界食糧計画(WFP)イノベーションアクセラレータとのパートナーシップにより開発されたこのシステムは、危機管理者が被害評価報告書を作成するために必要な時間と労力を大幅に削減できる可能性を秘めていると考えています。このおかげで、最も深刻な被害を受けた地域にタイムリーな災害支援を提供するために必要な時間を短縮し、そのような重要なサービスがカバーする地域を拡大することができるようになります。

アプローチ

自動被害評価プロセスは、建物の検出と被害の分類の2つのステップに分かれています。建物検出ステップでは、物体検出モデルを用いて画像中の各建物の周囲に境界線の囲いを描画します。次に、検出した各建物を中心とした災害前と災害後の画像を抽出し、分類モデルを用いて建物の被害の有無を判定します。

[image]

この分類モデルは、建物を中心とした50メートル四方の敷地面積に対応する161ピクセル四方のRGB画像2枚を入力とする、畳み込みニューラルネットワークで構成されています。一方の画像は災害発生前のもので、もう一方の画像は災害発生後のものです。このモデルは2つの画像の違いを分析し、0.0から1.0までの間のスコアを出力します。

災害前の画像と災害後の画像は別々の日時に撮影され、場合によっては違う衛星から撮影されているため、さまざまな問題が発生する可能性があります。たとえば、画像の明るさ、コントラスト、彩度、照明条件が大きく異なっていたり、画像のピクセルがずれていたりすることがあります。

色と照明の違いを修正するためにヒストグラム均等化使用して、変更前と変更後の画像の色を正規化しています。また、トレーニング中に画像のコントラストと彩度をランダムに乱すといった標準的なデータ拡張手法を使い、有意ではない色の違いに対してモデルがより安定するようにします。

トレーニングデータ

このシステムの主な課題の一つは、トレーニングデータセットの組み立てです。高解像度の衛星画像を持つ災害はほんの一握りであり、既存の被害評価を持つ災害はさらに少ないため、このアプリケーションで利用できるデータは本質的に限られています。ラベルについては、UNOSATのような、この分野で活動している人道的組織が手動で作成し一般公開されている被害評価を使用しています。手動評価が行われた場所の衛星画像を入手し、Google Earth Engineを使って衛星画像と被害評価ラベルを空間的に結合し、最終的なトレーニングサンプルを作成します。モデルの訓練に使用した画像はすべて市販のものを使用しました。

<さまざまな災害による被害を受けた建物と被害を受けていない建物の前後の画像を撮影した個々の画像パッチの例>

結果

過去3つの主な地震でこの技術を評価しました。2010年のハイチ地震(マグニチュード7.0)、2017年のメキシコシティ地震(マグニチュード7.1)、2018年にインドネシアで発生した一連の地震(マグニチュード5.9~7.5)です。それぞれで、地震の影響を受けた地域の一部の建物でモデルをトレーニングし、別の地域の建物でモデルをテストしました。UNOSATやREACHが実施した人間の専門家による被害判断を評価の根拠として利用しました。正確度(専門家判断との比較)とROC曲線の下の面積(AUROC)の両方を使ってモデルの品質を測定しました。AUROCは、モデルの真陽性の検出率と偽陽性の検出率のトレードオフを把握できるもので、テストデータセットの陽性サンプルと偽性サンプルの数が不均衡な場合に品質を測定する一般的な手法です。AUROC値0.5はモデルの予測がランダムであることを意味し、1.0はモデルが完全に正確であることを意味します。危機対応者のフィードバックによると、災害後の最初の72時間で高レベルの意思決定を行うためには、70%の精度が必要とのことです。

 

| 発生 | 精度 | ROC曲線の下面積 |
|---|---|---|
| 2010年 ハイチ地震 | 77% | 0.83 |
| 2017年 メキシコシティ地震 | 71% | 0.79 |
| 2018年 インドネシア地震 | 78% | 0.86 |

<人間の専門家の評価に対するモデル予測の評価(高いほど良い)>

※2010年ハイチ地震のモデル予測の例。予測値(Prediction)が1.0のとき、このモデルは建物が損傷していることを確信しています。0.0のときは、建物が損傷していないことを確信しています。しきいの値0.5は通常、建物が損傷したかどうかの予測を区別するために使用されますが、これを調整して予測の精度を調整できます。

今後の予定

このモデルは今のところ、同じ地域(たとえば同じ都市や国)の建物でトレーニングやテストを行った場合にはかなりうまく機能していますが、最終的な目標は、世界中のどこかで発生する災害による建物の被害を正確に評価できるモデルを作成することです。すでにモデルがトレーニングされている災害と似ているものだけが対象ではありません。しかし、過去の災害に対して実行できるトレーニングデータは限られているため、これは難しい問題です。したがって、新しい場所で発生する可能性が高い将来の災害に大してこのモデルを一般化することは、私たちにとって依然として課題であり、現在の作業の焦点となっています。私たちは、重要な救援物資の配分の決断が経験豊富な危機対応者によって常に検証できるように、分析の専門家が対話的に訓練し、検証し、展開できるシステムを思い描いています。私たちはこの技術によって、人々が必要な時に必要な支援をタイムリーに受けられるようになることを願っています。