データ・ジャーナリズムとは何か?
データ・ジャーナリズムとは何か? 単純に、データで実現するジャーナリズムと答えることもできるかもしれない。しかし、それではあまり理解の助けにならない。
「データ」も「ジャーナリズム」と共に厄介な用語だ。スプレッドシートにまとめられたような、数字の集合ならなんでも「データ」と考える人もいる。20年前なら、ジャーナリストが扱うデータといえば大概その類だけだった。しかし、我々が今住んでいるのはデジタルな世界、ほとんど何でも数字で表現可能な――そして実際ほとんどすべてがそうなっている――世界なのだ。
あなたの経歴、30万もの機密文書、あなたの交友関係で誰が誰を知っているかはたった二つの数字で表現可能なのだ(実際表現されている)。つまり、0と1である。写真、ビデオ、音声もすべて同じ二つの数字で表現される。0と1だ。殺人、病気、投票、腐敗、そして嘘、これもまた0と1で表現される。
データ・ジャーナリズムをそれ以外のジャーナリズムと違うものにしているのは何だろう? おそらく、従来からの「ニュースをかぎつける鼻」や人の心に訴える物語を語る力と現在利用可能な壮大なスケールと範囲に及ぶデジタル情報を組み合わせることで開ける新たな可能性ではないだろうか。
そしてその可能性は、ジャーナリストの作業過程のどの段階にも入ってくる可能性がある。Adrian Holovaty が ChicagoCrime 、つまり後の EveryBlock で行ったように、プログラミングで地方自治体、警察、その他の市民からの情報を収集して組み合わせるプロセスを自動化するとか。
あるいは The Telegraph が 国会議員の出費 についてやったように、数十万もの文書間のつながりをソフトウェア使って見つけるとか。
データ・ジャーナリズムは、ジャーナリストが人をひきつけるインフォグラフィックで複雑な話を説明する助けになりうる。例えば、 Gapminder で世界の貧困問題を視覚化するハンス・ロスリングの鮮烈な講演は、世界中の数百万もの視聴者を魅了してきた。また巨大な数字――公共支出を関連付けて筋道を通したり、アイスランドの火山によって引き起こされたり、防がれたりする汚染など――を精製してみせる David McCandless の人気作品は、 Information is Beautiful における明快なデザインの重要性を見せ付けている。
データ・ジャーナリズムは、BBC と Financial Times が現在日常的に予算についてインタラクティブに行うように、データはある記事が個人にどんな関係があるか解説する役に立つ(その予算が「一般大衆」でなくあなたにどんな影響を及ぼすか分かる)。またガーディアンが Datablog でデータ、文脈、そして質問の共有にかなり成功しているように、データはニュース収集プロセスそのものを切り開く可能性がある。
データはデータ・ジャーナリズムのソース、または記事を伝えるツール、もしくはその両方になりうる。そして他のどのソースとも同様に、データは懐疑的な見方を持って取り扱いされるべきだし、また、他のどのツールとも同様に、データで作った記事がデータによってどのように型どられ、制限されてしまうかについて常に自覚的である必要がある。
— Paul Bradshaw, Birmingham City University