データは語る
データジャーナリズムというと、数字が示すある側面をすばやく、わかりやすく、かつ機能的に伝えるビジュアリゼーションや、地域の病院や通りを検索して表示できるデータベースといった、データをどう表現するかを扱うもの、と思う人もいるだろう。もちろん、それも価値がある。だが、他の形のジャーナリズムと同じように、データジャーナリズムも、やはりストーリーなのだ。では、どんなストーリーをデータから見出すのか? BBCでの私の経験に基づいて、リストを示すとともに、データによるストーリーの種類を分類してみよう。
このリストを頭に入れておけば、データを分析している時だけでなく、その前段階、データを収集しているとき(誰でもアクセスできるデータを探すときであれ、自分で望む情報を集めるときであれ)にも、役に立つだろう。
- 数字を測る
-
もっともシンプルなやり方。数字を数えあげるか、合計したりする。たとえば、「この国の地方自治体は昨年、クリップに数十億ポンドを費やした」というように。しかし、その数字が多いのか、少ないのかわからないこともある。そうしたときには、コンテクスト、文脈が必要になる。それは次のようなものだ。
- 比率で表す
-
「昨年、地方自治体は、文房具の予算のうち、3分の2をクリップに費やした」。
- 内部のものと比較する
-
「地方自治体は、お年寄り向けの給食サービスよりも、クリップの方に多くの予算を費やしている」。
- 外部のものと比較する
-
「地方自治体は昨年、国の援助予算の2倍の額をクリップに費やした」。
データによってコンテクストを示したり、比較する方法は他にもある。
- 経年変化
-
「地方自治体は過去4年と比較して、3倍もの予算をクリップに費やしている」。
"比較テーブル" 他の国や地域、組織と比較する方法もある。ただし、比較する基準はフェアでなくてはならない(地域で比較する場合、人口の違いは考慮に入れなければならないだろう)。「ボーセッシャーは一人あたり、国の平均の4倍ものお金をクリップに費やしている」。
データをグループごとに分割してもよい:
- カテゴリによる分析
-
「パープル党政権の議会はイエロー党政権下の時よりも50%も多く、ペーパークリップに費やしている」。
数字で要素を関連付けることもできる:
- 関連付ける
-
「文房具会社から献金を受けている議員らが運営する議会は、1ポンドの献金につき、平均で100ポンドも多くペーパークリップに費やしている」
もちろん、因果と相関は別物であることは忘れてはいけない。
もしあなたがクリップの予算について調べているとしたら、あなたは次のようなデータを持ち合わせているだろうか?
-
状況をはっきりさせるための予算の総額のデータはあるか?
-
比較データを提供するための地理的、歴史的その他のデータの内訳はあるか?
-
比較がフェアになるように、たとえば人口の大きさのような別のデータはあるか?
-
興味深い分析が可能となるような比較可能なまたは関連するようなデータはあるか?
— マーティン・ローゼンバウム, BBC