データ可視化専門のデザイナーが語る、新型コロナウイルス流行の複雑さ | アドビUX道場 #UXDojo

Creative Cloud UI/UX & Web

データの可視化は、新型コロナウイルスの世界的流行の中、その状況を知らせる手段として注目を集めています。流行曲線を滑らかにするよう促すグラフィックに始まり、各国の流行状況を伝えるジョン・バーン・マードックのFinancial Timesのチャート、そして、Johns Hopkins COVID-19 Dashboardのように定期的に更新されるダッシュボードまで、いたるところにパンデミックのデータの視覚的な解釈が見られます。

Johns Hopkins COVID-19 Dashboardのスクリーンショット。
The Johns Hopkins COVID-19 Dashboardは、世界保健機関 (WHO) 、米疾病管理センター (CDC) 、欧州疾病管理センター (ECDC) などの情報源からデータを収集している 出典: John Hopkins

「私が覚えている限り、このパンデミックは、その出来事の最中に大量のデータが一般公開された最初のケースのひとつです」と、ベイエリアでデータ可視化のデザイナーとして働くシャーリー・ウーは指摘します。人々は毎日のように、そうした状況を伝える数字に触れています。トロントに拠点を置くデータ可視化デザイナーのジェーン・チャンは、「実際のところ、データを使わずにパンデミックの状況を伝える方法はありません」と付け加えます。突如として、データとそのデザインが、人々の生活の中の大きな部分を占めるようになりました。

図表やグラフは、複雑で理解が困難な一連のデータの意味を見つけるための頼れる安心な方法に感じられます。扱うべき量的データが大規模である場合(この記事の執筆時点では何百万という症例数です)、データを可視化することは、人々が自分の周囲で起きていることを理解可能だと感じられるようにするのに役立ちます。ウーにとって、データ可視化は「大量のデータをもっとも素早く効率的に理解できる方法のひとつ」です。

実際、新型コロナウイルスによる危機的な状況を伝えるために可視化されたデータは、分かりやすそうな見た目をしているかもしれません。しかし、データとデータ可視化の役割は、その一見単純そうな外観よりも、はるかに複雑で繊細です。

データ可視化がパンデミックの報道で重要な役割を果たしている理由

Financial TimesによるインタラクティブなCovid-19データの視覚化。
Financial Timesに掲載されたジョン・バーン・マードックのチャートは、Financial Timesの歴史の中で最も閲覧されたページである。インタラクティブ版では、国同士の比較が可能で、症例数と死亡数のカウント方法、対数スケールと線形スケールの差、データソースに関する詳細な情報が提供される 出典: Financial Times

基本的に「データ可視化とは、その言葉の通りデータを目で見えるようにすることです」とチャンは説明します。「通常、データは定量的なもので、可視化はそれをグラフィカルに表示することが目標です。意味をつくり出す目的でよく使われる方法のひとつは、データを比較できるようにすることです」

基本的に、データ可視化とは、情報を伝達し、意味を与える方法です。世界規模の危機を経験する一員として、人々は何が起こっているのかを理解する助けになるストーリーと情報を切望しています。各国のCOVID-19データを比較したグラフが普及している理由もそこにあります。

スージー・ワイルズ博士とトビー・モリスによる流行曲線についてのアニメーション。
「曲線の平坦化」 の概念を簡略化された図表により説明することを目的としたスージー・ワイルズ博士とトビー・モリスのコミックは、広く共有された多くのグラフィックスのひとつ

コミュニケーションだけでなく、データの可視化は人々の行動を変えるきっかけづくりにも役立ちます。ひとたびウイルスが広まったら、公衆衛生を管理する当局は、いつどの程度の情報を伝えるかという重要な決定を下さなければなりません。「アウトブレイクを封じ込める上で最も重要な側面のひとつは、本当に何かをするべきなのかがすぐにははっきりしない状況において、人々に行動を変えるよう説得することです。データの可視化は説得のために非常に重要な役割を果たしています」とウーは言います。パンデミック初期の頃に、北米とヨーロッパで広く共有されて影響力を持ったグラフィックスの中には、 「曲線を滑らかにする」 という概念を簡潔に説明することにより、人々にとるべき行動を促したものがあります。

ウーは、人々に家にいるよう説得するために、自ら何らかの行動を起こさ無ければならないと感じてPeople of the Pandemicというゲームを構築しました。このゲームにおいて、プレイヤーは自分の選択が地域社会で利用可能な病院のベッド数に与える影響を体験できます。このシナリオは、データモデルから導き出されるデータを、データの可視化とストーリーテリングにより体感できるようにしたものです。「私たちは、人々の日常の行動と、その結果として起こりうる状況を結びつける手助けをしたいと考えていました。このゲームは、プレイヤーの状況を地域社会に合わせて極端にパーソナライズし、プレイヤーの行動によるゲーム内の結果を示すことでその目標を実現しようとしています」

People of the Pandemicは、プレイヤーは郵便番号を入力するか、コミュニティの大きさを選択することで、現実の状況に合わせてゲームをよりパーソナライズできる

ゲームの作成には6週間を要し、その間にパンデミックのデータを効果的に視覚化する上での多くの課題が浮き彫りになりました。ウーと彼女のチームは、専門家と協力してゲーム内の選択肢を吟味しながら、ゲームのロジックとシミュレーションの背後にある方法論などの問題に取り組みました。最終的には、ゲームの発想の元になったデータの複雑さと繊細さを理解することになりました。

不確実性の可視化という挑戦

パンデミックの最中に目にするすべてのチャット、グラフ、モデルの背後には、デザイナーが最終段階にたどり着くまでに行なわなければならなかった複雑な選択やトレードオフがあります。Excelaのデータ可視化リーダーで、公衆衛生学の経験を持つアマンダ・マクレックは、行われているトレードオフについての彼女の理解を次のように語ります。「症例データや死亡データには不確実性があります。データは即時に更新されると期待されていますが、実際のところCOVID-19データの症例報告には、ある程度の手作業が関わります」。たとえば、検査が実施され、検体がラボで処理されて、その結果が地方自治体または国の機関のデータとして正式に記録されるまでには時間が必要です。

多くのグラフはデータの比較可能性を強調しています。しかしマクレックは、定義の一貫性の無さを指摘します。たとえば、COVID-19に起因する死亡とみなされるものは何かといった定義は、州や国によって異なります。また、症例数は行われている検査の関数となり、これも国によって大きく異なります。さらに、データの質についても考慮しなければなりません。「データを集約するすべての段階において、小さなデータ品質の問題が、集計を重ねるごとに複雑になっていきます。これが、地方行政レベルのデータを第一に信頼するようにとCDCが言っている理由です」

同様に、People of the Pandemicゲームの制作プロセスについて話したウーは、「パンデミックのデータを可視化しようと考えている人は、データ収集の難しさを理解するようになること」が重要だと振り返ります。「データ収集の方法も、検査を受ける人の基準も国によって異なります。COVIDによる死亡としてカウントされる数の基準についても同様です」

ウーと彼女のチームにとって、これらの課題は、ゲームについての重要な決断につながりました。「不明瞭な領域があまりに多すぎたため、現実のデータは使用しないことにしました。代わりに、架空のウイルスを想定しなければなりませんでした。私たちは、実際のデータに近い数値になることを目指してはいましたが、ウイルスそのものを再現しようとしているとは思われないように気をつけて、シミュレーションのバランスを取りました」

People of the Pandemicでは、データの可視化はプレイヤーの選択の潜在的な影響を示し、感染した患者の年齢、日、利用可能な病院のベッドが可視化されます。
People of the Pandemic』のゲームプレイ中、データ可視化は、プレイヤーの選択による潜在的な影響を示し、感染した患者の年齢、日、利用可能な病院のベッドごとに可視化される。COVID-19のデータは新しく急速に変化しているため、このゲームでは、新型コロナウイルスではないウイルスを可視化した

おそらく、データ可視化デザイナーにとって、パンデミックの最中の最大の課題は、データの変化の速さと、対処することになる不確実性でしょう。この状況下のデータ可視化への信頼と人気の一部は、それがデータをより確実に見えるようにするものだと人々から認識されているためです。「データを視覚化するとより確実に見えるようにはなりますが、新型コロナウイルスのデータには、未知の定量化されていない不確実性が非常に多く存在します。それほど不確実なデータの可視化を要求する人々がいるとき、私たちは何をすればよいのでしょう?不確実性の可視化は私たちが得意とするところではありません」とマクレックは振り返ります。

より良いデータ可視化デザイナー、またはその消費者になる

人は確実なものが好きです。人は、自分が理解しているという感覚、状況をコントロールする何らかの手段を持っているという感覚が好きなのです。ウーは次のように語ります。「データ可視化をしない多くの人々は、方法論を調べることを知らないでしょう。彼らは一般に公開された図表を見て、それを明確な事実として受け取るでしょう」。ここには、データ可視化デザイナーとその消費者の両方に対するリスクが示されています。

チャンの視点から見ると、この問題の鍵は信頼です。彼女は、データを信頼することに関する問題と、データが操作されたり、誤って表現される可能性について言及しました。「アルベルト・カイロによる『How Charts Lie』という素晴らしい本があります。この本には、人々がどのようにして、時には意図的に、さもなければ経験不足のために意図せずに、誤ったデータの表現方法を選ぶのかについて書かれています」

ウーはこれに同意して、「統計がいかに簡単に誤解を招くかは長い間知られてきたことです。図表が誤った解釈を与えるケースもよくあります。ラベルやタイトルが適切なものではなかったり、注釈が正しく付けられていなかったり、軸が誤解されやすいものであれば、そこにリスクが生まれます」

世界的なパンデミックが発生して、世論と行動に訴えることが重要になると、デザイナーは自分たちが作成したグラフィックに大きな責任を負うことになります。この記事でインタビューした3人のデザイナーは皆が、この責任を繰り返し強調しています。3人ともデータ可視化学会のメンバーです。学会は、マクレックが執筆した「COVID-19について新たに図表を作成する前の10の考慮事項(Ten Considerations Before You Create Another Chart About COVID-19)」という記事を通じて、この責任についてのガイダンスを提供しています。

基本となるメッセージは「可視化を無責任に行うな」です。「善意だけでは十分ではありません。それでも害を為すことはあります。害を与えないという原則を固持し、データ可視化デザイナーとしてできることとできないことに正直になりましょう」と、マクレックはアドバイスします。

ウーにとって、ゲームを制作する上で、専門家との提携は譲れない部分でした。「ゲームをつくり始めたとき、自分一人ではできないこと、そして専門家と協力する必要があることは理解していました」。彼女は、空間データの専門家であるスティーブン・オッサーマンと協業し、ウイルス進化の博士号を持つ計算生物学者であるシドニー・ベル博士にも相談しました。チームはまた、ゲームプレイの基礎となるモデルと仮定を詳細に公開しました。

「データの可視化は学際的です。データの理解は必要ですが、デザインの理解も必要です」とチャンは言います。「可視化されたものを消費することになるエンドユーザについて考える必要があります」。この点、すなわち、エンドユーザーに焦点を当て、彼らに力を与え、教育することを目指すという点で、デザイン原則の多くとデータ可視化は似ています。データ可視化のアクセシビリティもまた、パンデミック中の重要なトピックになりました。全ての人に、データ可視化と図表がアクセス可能であることを保証するためには、多くの研究が必要です。

一方、パンデミックの報道の一部として可視化されたデータを消費している側の人々にとっては、得た情報を批判的に考えることが極めて重要です。「正確かつ適切にオリジナルの情報源を引用し、何が表現されているか明確な定義を提供する信頼できる情報提供者を探しましょう。可視化やデータの限界に正直な人を探しましょう」とマクレックは言います。「追加の手がかりとしては、急激な変化や例外を解説する注釈があります。データに関する制限や注意事項について正直なソースを探してください」。図表を額面通りに受け取らないようにするという点に関しては、読者にも責任の一半があります。

データをより人間的なものにする

Reuterのデータ可視化は、イタリアで3月21日から22日の間にCovid-19により死亡した人数を図解しています。
ロイターのグラフィックチームのデータ駆動型レポートは、データの人間的側面を前面に出そうとする試みであり、症例数と死亡数が人間を表していることを思い出させる 出典: A deluge of death in Northern Italy

「非常に大量のデータがすぐに利用可能な状態にあります。これは祝福であると同時に呪いです」とウーは言います。これまで以上に、誤解や間違った情報を与えず、ノイズにならない明確なデータ可視化デザインが必要です。世論に伝える役割を持つデータ可視化デザイナーには、思慮深くあることへの大きな責任が存在します。

図表やグラフが有用に見えたとしても、結局のところ「私たちは数字に動かされるのではなく感情に動かされるのです」とチャンは強調します。パンデミックが統計や数字で報告されていたとしても、マクレックは、これがまさに人間にとっての危機であることを覚えておいて欲しいと言います。「最も優れた可視化は、人間的な側面について考えさせる力を持つものです」

データの可視化は、私たちが経験している、複雑で繊細で不確実な危機を理解しようとするためのひとつの方法です。それは、落とし穴、利点、複雑さと共に提供されます。


この記事はCommunicating COVID-19 Complexity Through Data Visualization(著者:Linn Vizard)の抄訳です

POSTED ON 2020.06.22