データ・ジャーナリズムの馬車馬としてのビジュアライゼーション
チャートやマップにデータを投入しようとする前に、あなたのジャーナリズムの中で静的およびインタラクティブなグラフィックの要素が演じる多くの役割について、すこし時間をとって考えてみてほしい。
レポーティングの段階において、ビジュアライゼーションは:
-
あなたの報道以外に対してテーマや疑問を見分けるのに役にたつ
-
データの中の良いストーリーとなるはずれ値や確実でないエラーを見分ける
-
代表例の発見を手助けする
-
あなたの報道の全体像をみせる
ビジュアライゼーションもまた公開中に多くの役割を演じる。それらが演じるのは、
-
ストーリーの中で作られたポイントをより強制力のある方法で描く 散文から不必要な技術的な情報を排除する
-
それらがインタラクティブかつ探索を許すときは特に、あなたの読者にあなたの報道のプロセスについて透明性をもって提供できる
電子的なデータや記録を使って始める始めないに関わらず、報道のなかでのビジュアライゼーションを素早く、頻繁に手始めにすべきであることをそれらの役割は示している。段階を飛ばしていることなど気にすることなく、ストーリーがおおかた書かれた後で気にする方がよい。この効果はあなたの報道の助けになる。
始めるときは、ビジュアル・フォームを既に取り入れたノートを当てはめることを意味する。2006年にthe Washington Postが提供したFigure 2について考えてみよう。
のべ過去45年で助成金や重要なイベントに関連した農家の所得を月ごとに構築したものを示す。時間軸のなかで同様の定義と意味付けをもつデータを探すことが課題であった。山や谷のすべてを調査することは、私たちの報道以外の文脈を読み解く手助けとなる。それはまたストーリーが書かれる前に雑用がほとんど完了していたことを意味する。
データセットを探索し始めようとするために、ビジュアライゼーションを使うためのいくつかの小話をここに書く。
Tip 1:大規模なデータセットを小さな倍数ですばやくあなた自身に合わせる。
George W. Bush政権が政治的、実質的ではない、根拠に基づいて助成金を授与された話について調べていたときに、このテクニックをthe Washington Postで利用していた。援助プログラムのほとんどは数式によってなされており、他人は長年に渡って蓄えられてきた。だから、私たちが1500近くある異なった任意の文脈をみることでパターンを見いだすかどうかに私たちは興味をもっていた。
私は、それぞれのプログラムのためのグラフを作成し、大統領選の年を示す赤い点や議員選挙を示す緑の点を用いた。問題は、大統領選の前の6ヶ月ごとの釘がいくつかの問題としてあることだ。ピークの赤い点の数点がそれらに近づくときがあるが、しかしそれは、選挙の年ではない。そのパターンは、2004年ではなくAl GoreとGeorge W. Bushの間の2000年の大統領選の間で現れる。
たくさんのテーブルを見ることや私たちに様々な許諾や地域、所属機関などを答えさせるインタラクティブ・フォームよりむしろ、一連のグラフを見る方が簡単である。小さな多機能のなかのマップは時間や場所をインタラクティブより比較するのが簡単に静的なイメージを見せる一つの方法である。最小限の努力で地図は時にはインタラクティブな地図よりも簡単に静的なイメージ乗で場所や時間などを比較して見せることのできる一つの方法である。
この例はPHPで書かれた短いプログラムで作られているが、いまやエクセルの2007と2010の折れ線機能でより簡単に作ることができる。ビジュアライゼーションのエキスパートであるEdward Tufteは巨大なデータ・セットを見渡して情報を伝えるために、それらを「刺激的で、シンプルで言葉のようなグラフィックス」として発明した。あなたは今や、どこにいても株式市場の相場に基づいた小さなグラフからスポーツの勝ち負けの記録までそれらを見ることができる。
Tip 2: 自分のデータを隅々までみること
あなたがストーリーやデータ・セットについて理解しようとするとき、それらを凝視すること以外に正攻法はない。思い付く限りの方法をためすことで、異なった視点を得ることができる。もしあなたが犯罪についてのレポーティングをするなら、あなたは年鑑の暴力犯罪の変化のチャート群を見るかもしれないし、別の方法として割合の変化を見るかもしれない。一方で他の市との比較を行ったり、時間変化を見るかもしれない。生の数値やパーセンテージ、指標をつかって。
異なったスケールでそれらをみよう。X軸はゼロが存在するべきだというルールに従うようにしよう。それからルールを壊し、より発見があるかを見てみよう。変わった分布をもつデータのために対数や平方根を試してみよう。
ビジュアル的な観測を行うリサーチで気をつけること。William Clevelandの実験は平均線が約45度の角度のときに画像の変化を目が認識することを示した。この提案は洞察的なグラフィックに向けた効果の変わりに常にゼロから始めるという訓戒を無視することを示す。別の疫学の研究では、あなたがチャートのための境界線としての目標レベルを発見することを提案する。これらの方法のそれぞれは異なった方法でデータを見ることを手助けしている。何か新しいことを伝えることをやめようとしているとき、あなたは自分がしてしまったことを知るだろう。
Tip 3: 思い込むな
いまや、自分のデータを様々な方法で見ることができるようになったが、あなたは正しいと思えない記録を見つけてしまっているかもしれない。あなたは、初期の部分でデータのミスのようにいくつかのはずれ値をみていたり、または、後に続く傾向として意味があると理解していないかもしれない。
もし、あなた自身の初期の探索や、すでに公開されているビジュアライゼーションに基づいたものを公開したいなら、これらの質問を解決しなければならないし、仮説を作ることはできない。それらはむしろ、おもしろい物語や間違いであり、面白いチャレンジが共通の知見や間違った理解になるだろう。
地方行政がエラーで満たされたスプレッドシートを提供することは珍しくない。そして、データ・セットの中で行政の専門用語を間違えて理解することは容易い。
最初に、自分自身の作品を振り返ってみよう。文書作成は完了しているか、データのオリジナルバージョンに警告や問題が存在していないだろうか。もしあなたの終点の全てが正しいように見えるなら、電話をかける時かもしれない。もしそれを使う計画があるなら、それを解決しなければいけないだろうし、すぐに取りかかるべきだ。
必ずしもすべてのミスは重要ではない。選挙資金の記録では、十万レコードのデータベースに存在しない数百の郵便番号を持つことが一般的だ。同じ都市のなかに存在するものでもなく、候補者に属するものでもないように、時折不正データがあっても重要な問題ではない。
自分自身へ尋ねるときの質問は、もしこれをつかっていなければ、読者はデータが何を示すのかという基礎的な洞察的で正確な視点を得ていただろうか、である。
Tip 4: 正確性について悩むことを避ける
それが重要となる前に十分な疑問を必要としないぽっと出の側面は正確性について悩みの種になる。あなたの探索的なグラフは一般的に正しくあるべきだが、しかしデータを丸める作業に色々なレベルがあるか、100%の正確性に追いつく必要がない場合やあなたが20以上の内の1、2年後のデータを失うかどうかについて心配しなくてよい。これは探索のプロセスの部分に占めることが大きい。あなたは、いまだ大きな流れを見ることができ、公開するまでに何を正さなければならないのか知るだろう。
実際に、あなたはラベルやマーカーのスケールを取り除くことを考えるかもしれないが上のチャートのようなもののほとんどは、データの意味をより得ることができる。
Tip 5: 事例や出来事の年譜をつくる
複雑なストーリーを始めるとき、重要なイベントや事例の年譜を立て始める。エクセルやワードやタスクのためのTimeFlowのような特別なツールを使えるが、重要なのは後ろに重ねることのできるデータ・セットを見るけることである。定期的なデータ・セットの読み込みがあなたに、提出しなければならない報道での全体像をしめす。
Tip 6: グラフィックス部門と迅速に何度も打ち合わせする
ニュースルームの中でアーティストやデザイナーとともに可能なグラフィックスのブレインストームを行う。それはあなたのデータを見るのにとても良い方法であり、いかにしてインタラクティブに作用させるかの提案であり、いかにしてデータとストーリーを結びつけるか知ることができる。何を最初に集めるべきかを知っているか、データを集めることができなかったときにグラフィックが作れないチームに警告を出せるかどうかで、あなたの報道はよりよいものとなる。
公開のためのTips
探索のために2、3日や2、3時間しか費やせないかもしれないし、またはあなたのストーリーは報道するために数ヶ月も掛かるかもしれない。しかし公開への移行のタイミングになったとき、二つの重要な側面がある。
あなたの早期の探索において年代のミスがあったとき覚えておいてほしいことがある。突然、それなしには何も出来なくなってしまう。すべては報道の中で悪いデータを無視していなかったか。それはあなたを後戻りさせることになるだろう。理由として、悪いデータまわりについて書かなかったからである。グラフィックスにとって、中間層もなければ、あなたが必要とするしないに関わらず、すべてのものを書く必要がある。
インタラクティブグラフィックとデータ集合への努力をあわせる インタラクティブグラフィックスにおいて隠すものはない。もしあなたが本当に読者の望むいかなる方法でもデータの探索を提供するつもりなら、要求された全てのデータ要素があるべきだ。ユーザはいつでもエラーを発見でき、それはあなたを多数の年月を費やさせることになるだろう。もし、独自のデータベースを構築したら、校正し、事実確認をし、データベース全体の整理をしなければいけないことが予測できるだろう。行政の記録を使うならば、あなたがすべき部分的なチェックはどれくらいか、再編集が必要なエラーを発見したときにどう対処するか決める必要がある。
- 2タイプの読者のためのデザイン
-
スタンドアロンなインタラクティブ型、あるいはストーリーと一緒になった静的なビジュアライゼーション型のどちらかのグラフィックスは2種類の異なった読者を満足させるべきだ。一目みて理解しやすいようにするべきであるが、より深く知りたい人々を満たすような十分な複雑性をもつ必要もある。もしインタラクティブなものをつくるなら、読者に対して単一の数や名前を得るのではなくより多くの何かを得られるようにするべきた。
- ひとつのアイディアを伝える、それから単純化する
-
あなたが人々に見せたいたった一つのものがあるか確かめよう。あなたが読者に得てほしい圧倒的な印象に決定づけられ、そしてその他のすべてが消えていく。多くの場合、インターネットがあなたに全てを提供することを認めたときでさえ、情報を取りこぼしていることを意味する。あなたの主な目的が報道の浸透でない限り、あなたのタイムラインや年譜上であなたが集めた詳細なデータのほとんどはあまり重要ではない。静的なグラフィクにおいては、無駄なものになるだろう。インタラクティブなグラフィックでは退屈なものになるだろう。
— Sarah Cohen, Duke University