新型コロナの図表を見るときの5つの注意点とか

FavoriteLoadingAdd to favorites
3
Rated 3 out of 5

ここ数年は毎日のようにCovid-19に関する図表を目にしますが、可視化は情報を一目でわかりやすくしてくれる反面、情報の解釈に間違いを誘導してしまう可能性があるのもまた事実。そんなところでIUPUIの論文(R)では、「SNSでCovid-19に関する情報を共有するときに陥りがちな5つの落とし穴を見つけたよ!」みたいな話になっていて勉強になりました。

まずは研究チームの問題意識から見てみるとこんな感じです。

現実には、人々は子供を学校に送っても安全かどうか、休暇をとっても安全かどうか、レストランに夕食を食べに行っていいかどうかなど、日常生活における重要な決定をビジュアライゼーションに依存している。

その影響力を考えると、私たちが可視化についてもっと理解すること、そしてそれらを作成、閲覧する人々が無意識にデータを誤って解釈する原因となりうる共通の問題を特定することが重要であると考えた。

とのこと。要するに、感染者数の推移のような図表の数々が日常生活における強力な判断材料になってるんだから、情報を発信する人も受信する人も気を付けるべきところをちゃんと認識しておこうぜ!って話ですな。

で、研究チームはTwitterをクロールし、2020年4月14日から5月9日の間に共有されていたCovid-19関連の5,409件のデータビジュアライゼーションを特定。これらの中には専門機関以外に非専門家が投稿したものも含まれてまして、(1)どんな内容の情報が共有されているのか、(2)どんなツイートが最もリツイートされてるのか、(3)可視化に起因する問題点といったところを探っております。

まあこの内容はパンデミック初期のものなんで、現在では少々変化・改善してきている点もありましょうが、Covid-19以外でも情報社会を生き抜く中で共通する重要なリテラシーになるポイントもいくつかあるんではないかと思う次第です。

では、本論文で勉強になったポイントをまとめておきましょうー。

  • 投稿されてる図表の内容:
    折れ線グラフや棒グラフなど、時間の経過に伴う変化を示す可視化が最も多く発信されていた。図表の25.5%はデータソースが明記されておらず、それは個人によって作成されたもの以外に、機関が作成されたものの中にも確認された。


  • リツイートされてる図表:
    個人によって作成されたものよりも、組織によって作成されたものの方が多くリツイートされていた。グラフの種類として、横軸に地理(感染者数や時間、経済等と比較)、縦軸に死者数(経済や感染者数、ワクチン接種等と比較)をとったグラフが最もリツイートされていた。これは、健康や社会への悪影響よりもウイルスの致死性に関心を持っていたことを示唆しているものと考えられるが、最近では状況が変化している可能性も高そう


  • 可視化された情報の半数以上に、以下に示す5つの共通エラーのいずれかが含まれており、これらが情報のわかりやすさ、正確性、信頼性を低下させていた。

    • ミストラスト:分析された投稿の20%で、データの出所を明確にされていなかった。また、対数軸を使った場合のように、同じデータでも全く逆方向の解釈を促す場合も少なくない(グラフ次第で感染者が急増してる!ともほとんど変わってない!とも取れる)

      このような問題に対しては、データソースを明確に表示すること、また情報を共有する際には画像のみが利用されることが多いため、画像内に引用元を記載すること、同一のデータでも別の解釈がありうる可能性を意識しておくことを提案している。

    • 比例的推論:比率や分数に基づいて変数を比較する能力に関連する問題で、11%の投稿で確認された。例えば、人口が少ない地域と多い地域では、同じ数の感染者数でも重症率が異なるため、地理的に異なる場所での感染を理解することは比例的推論の問題といえる。また、同じ陽性者数でも症状の有無等が異なったり(Part-Whole Relationship)といった問題もこれに含まれる。

      この課題の対応策としては、人口が異なる地域を比較する際には、絶対数やパーセントよりも、1,000人当たりの感染数などを指標として利用することが提案されている。

    • 時間的推論:時間的変化を理解する能力に関する問題で、投稿の7%に確認された。具体的には、累積感染者数は現在の感染者数を意味しないこと、PCR等の検査受診者の数が増えれば陽性率が変化し必ずしも感染者数の変化を反映していないこと、感染から死亡までのラグが考慮されていないことなどが含まれていた。

      この問題に対しては、1つのグラフでデータを伝えるのではなく異なる時間スケールに依存する指標を別々のグラフに分割すること、上昇率を指標とすることなどが挙げられた

    • ウイルス自体に対する誤解:インフルエンザや同ファミリーの別のウイルスに関するデータの使用など、新型コロナウイルスに関する誤解に基づく可視化が2%存在していた。

    • 認知バイアス:0.51%の投稿で確認されたもので、図表作成者の「人種、国、移民に関する偏見」に基づいた表現が含まれていた(外国人が自国で感染を拡大している主要因だ!みたいな)。

      政治的なコメントとは慎重に切り離された、明確で客観的な記述で提示されるべきであるとコメントされている。

Tomohiro Okugawa

科学的知見を自分の体で試して、日常生活に活用していく人。知識の収集が趣味で一般向けにその共有をしたいと思って執筆中。京都大学環境衛生学等。

コメント

この記事へのコメントはありません。

求む──私たちと一緒にエビデンスを発信しませんか?
Homo Evidenceライターになる
あなたが持つリテラシを発揮してみませんか?
Homo Evidenceライターになる