世界で最も強力なマッピング・解析ソフトウェアをうたう「ArcGIS」を開発するEsriが、新型コロナウイルスに関するデータをマッピングしながら、地図を用いて正確にユーザーに情報を伝えるための重要なポイントを解説しています。

Mapping coronavirus, responsibly

https://www.esri.com/arcgis-blog/products/product/mapping/mapping-coronavirus-responsibly/

2019年12月に新型コロナウイルスが発見されて以降、2020年2月25日の時点で中国・湖北省では7万7000人以上が同ウイルスに感染し、2600人以上が命を落としています。世界保健機関(WHO)は2月25日時点では、新型コロナウイルスについて「パンデミックには当たらず」と評価していたものの、2月27日に「パンデミックの可能性がある」と、各国により一層の警戒を要求しています。

新型コロナウイルスの感染拡大を受け、Esriで地図作成のプロとして働くケネス・フィールド氏は、中国での集計データのみを用いて「新型コロナウイルスの感染拡大を視覚的に表すマップ」を作成。そして、データと地図を掛け合わせるうえで注意すべき点を解説しています。

まず、中国での新型コロナウイルスに関するデータをマッピングする場合、地図は等面積投影法を用いて表現されるべきであるとフィールド氏は主張しています。フィールド氏は「メルカトル図法などを用いることで、地図上の各エリアのサイズが正しく表現されていない場合、多くの印象を変えてしまう可能性がある」として、等面積投影法であるアルベルス正積円錐法などを用いるべきとしています。

以下の地図は等面積投影法ではないメルカトル図法(赤線)と、等面積投影法のひとつであるアルベルス正積円錐法(青色)で中国全土を表したもの。重ねてみるとわかるように、用いる投影法によって中国全体の形が大きく異なってきます。



地図でデータを示す際に使用される一般的な方法のひとつが、階級区分図です。統計数値に合わせて色調を塗り分けた地図で、地域ごとの数値を比較するというこの方法は、適切に用いられれば素晴らしいものです。しかし、適切に使用されていない場合は人を誤解させる可能性があります。

例えば以下の階級区分図は、2020年2月24日時点の新型コロナウイルスに関するデータを示したもの。地域ごとの新型コロナウイルスの感染者数をまとめたもので、色調が濃くなるにつれて感染者数が多いということになるため、複数の地域で最大レベルの感染者数を記録しているように思えます。しかし、実際のところは新型コロナウイルスの感染源となっている湖北省では、他の地域をはるかにしのぐ6万5000件もの感染者が出ています。そのため、以下の階級区分図は適切なものではないとフィールド氏は主張しているわけです。



実際に地域ごとの感染者数を棒グラフで示すと以下の通り。湖北省ではずば抜けて多い感染者が確認されていることがわかります。



また、フィールド氏が「間違った例」として挙げた階級区分図には、地域ごとの人口や、人口における感染者数の割合なども記されていません。湖北省の人口が10万人しかいない場合、感染者の割合は脅威的なものとなりますが、10億人の人口を抱えているとするなら、感染の影響は微々たるものといえるかもしれません。

そこで、フィールド氏は湖北省を外れ値として、湖北省とその他の地域の間にある感染者数の格差を明確に示すことが重要としています。「間違った例」と同じように、階級区分図で中国の地域ごとの新型コロナウイルス感染者割合をまとめたのが以下の図。「10万人中0.5人以下」「10万人中1人以下」「10万人中2人以下」「10万人中3人以下」「10万人中111人」と、感染者の「数」ではなく「割合」で示し、外れ値である湖北省のデータは他の地域とは異なる色および数値とすることで強調しています。



フィールド氏は階級区分図で使用する色を赤系から青系に変えた理由について、「人々は赤い地図が好きです。そして、赤色は人の目を引きます。しかし、データセットを考慮してください。我々は今後さらに悪化する可能性のある悲劇そのものをマッピングしています。真っ赤なマップを見て悲鳴を上げたいですか?依然として統計的に見れば新型コロナウイルスによる『死』は極めてまれなものですが、赤色はそれを暗示してしまいます」として、扱う題材によって配色にも気を配るべきと主張しています。

また、階級区分図だけが地図上でデータを示すのに使える手法ではありません。例えばドット密度表示ならば、地図上に感染者の割合ではなく数字を明確に示すことが可能。以下の地図の場合、1つの点が10人の感染者を表しています。ただし、地図上にドットで感染者を示す場合は「感染事例などを特定できてしまう可能性がある」という問題点があるとフィールド氏。



さらに、比例シンボルマップでは、各地の感染者数をより感覚的に比較可能。



階級区分図やドット密度表示図では香港やマカオといった小さな地域を区別することができませんが、比例シンボルマップでは地域ごとに感染者数を示すことが可能。そのため、フィールド氏は「中国のような大きな国土を持つ国の場合、小さな地域が見落とされることは避けられません。しかし、比例シンボルマップを用いることで、香港やマカオといった小さな地域を強調することが可能です」と、その利点を説明しています。

さらに、比例シンボルマップの場合、対数スケールを用いることでより見栄えのよいマップになる場合があるとも説明しています。



また、フィールド氏は新型コロナウイルスの感染拡大状況を示すマップのような、責任のあるデータを取り扱うものの場合、何が重要な情報かを正しく認識することが重要としています。例えば新型コロナウイルスの場合、「湖北省では10万人に111人の割合(人口の0.1%)が新型コロナウイルスに感染」「中国の湖北省以外の地域では、感染率は10万人に2.5人未満の割合」「その他の国ではさらに感染率が低くなる」「マップにはメッセージが含まれるケースがありますが、善意に見えるものは役立たないケースがよくある」といった点には注意が必要とのこと。

また、マップを作成する場合にはこれらの要素を考慮し、誤った情報を含むものを作らないよう留意する必要があるとしています。