Loading

データを世間に公開する

データを公開する方法には様々な方法がある。生のデータセットと共にその物語を公開する方法、美しいビジュアライゼーションやインタラクティブなウェブ・アプリケーションをつくって公開する方法などだ。そこで私たちはデータを駆使するジャーナリストたちに公開方法の秘訣を尋ねた。

ビジュライゼーション、するか否か

データが言葉や文字よりもニュースを物語ることができると考えられるようになると、「新しいアプリケーション」とか、「データ・ビジュライゼーション」といったバズワードがニュースの現場でも聞かれるようになる。さらに、(多くの場合無料の)新しいツールが注目を浴び、データに扱いなれていないジャーナリストでも簡単にビジュアライゼーションができるようになった。

Google Fusion Tables や、Many Eyes, Tableau, Dipity といった新しいツールのおかげで、地図、チャート、グラフ、さらにはこれまで専門家にしかできなかったような熟達したデータ・アプリケーションの作成が簡単にできるようになった。しかし、誰もが手っ取り早くこうしたツールを使えるようになったことでジャーナリストが直面した問いは、データセットをビジュライゼーションできるかどうか、ではなく、そもそもデータをビジュアライズするべきなのか、ということだった。 劣悪なデータ可視化 は全く可視化をしなかったよりもあらゆる点で劣ってしまうのだ。

Aron Pilhofer, New York Times

動的なグラフィックを使う

スクリプトやアニメーションを上手に用い、明快な解説とともに動的なグラフィックを使うことで複雑な数字や概念も、生き生きとしたストーリーとして読者(視聴者)の関心を導くことができる。Hans Roslingの解説ビデオを見れば、スクリーン上でデータがストーリーを伝える良い事例を知ることができる。この方法に同意する人もそうでない人も、エコノミストの Shoe-thrower’s index をご覧いただきたい。こちらも、ビデオを用いて数字ベースのストーリーを伝える良い事例だ。こうしたニュースは、静的な画像として公開すべきではない。いろいろなことが起きているということを静止画では伝えることができないからだ。一つずつ組み立てていって、どうしてこのインデックスがこの形になったかわかるようになるだろう。動画やアニメーションを使えば、視聴者にわかりやすいビジュアルとともに解説のナレーションをつけ、パワフルで記憶に残るストーリーテリングが実現できる。

Lulu Pinney, freelance infographic designer

世界に伝える

私たちの作業手順は、エクセルからはじまることがほとんどだ。データに面白いものがみつかったら手っ取り早く取り掛かることができる。意味のあるストーリーがデータの塊から見つかったら、デスクに連絡する。the Guardianの、メインのニュース・デスクのすぐ隣に席がある我々は本当に幸運なことだ。デスクに伝えたら、次にページでの見せ方を考える。そしてそれにあわせた記事を執筆する。そうして記事を書くときはたいがい、テキストエディターのすぐそばにスプレッドシートの縮小版を置いている。書きながら、ちょっとした分析をして面白いことを見つけたりするためだ。記事を公開したら、しばらくツイッターで記事のことをつぶやいたり、適切な人に記事のことをメールしたりして時間を過ごす。自分の記事が適切な場所からリンクされるようにためだ。

記事へのアクセスの半分はTwitterやFacebookからやってくる。the Guardianの記事の平均滞在時間が1分なのに対し、Datablogの記事でのページ滞在時間が平均6分であることを誇りに思っている。6分という数字は、ウェブページの滞在時間としてはかなりいい数字だ。ページの滞在時間というのは、アクセス解析において重要な指標の一つである。

こうしたことが、同僚に自分たちの仕事の価値を納得してもらうのに役立っている。それから、私たちが取り組んだビッグ・データを元にした記事はニューズ編集室の誰もが知るところとなる --COINS、WikiLeaks、イギリス暴動。COINSでは、イギリス政府が発行したデータについて、5、6人の専門レポーターが私見を述べてくれた。さらに政府が£25k の支出データを公開したときは、著名なレポーターであるPolly Curtisを含む5、6人のチームが一緒に取り組んでくれた。Wikileaksも、イラクやアフガニスタンに関する大量のニュースを持っていた。イギリス暴動の記事も、2日間で550kのアクセスがある大きなニュースだった。

短期的なトラフィックの増大だけではなく、信頼でき手役立つ情報源となることが大切だ。私たちは報道しているトピックについて良質で価値のある情報を届けられるよう努力している。

Simon Rogers, the Guardian

データをpublishするときには

多くの場合、我々はデータをサイトにビジュアライゼーションして組み込み、データセットのダウンロードが容易な形式で提供している。そうすることで読者もニュースの裏側のデータをビジュアライゼーションを動かしながら知ることができるほか、データそのものを使うことができる。どうしてこれが重要かというと、シアトルタイムズの透明性を高まる。読者に我々が辿り着いた物語の結論のもととなったデータを見せているのだ。そうすれば批評家も使うだろうが、この記事や派生するニュースに興味を持っているジャーナリストも使うことができる。データを利用可能な状態にすることで、一般読者や批評家たちからヒントとなるコメントをもらうことができる。我々が気づかなかったことや、もっと調査すべきことがあればそれを知らせてくれる。こうしたことは意義あるジャーナリズムを追い求めるうえで非常に価値あることだ。

Cheryl Phillips, The Seattle Times

データをオープンにする

ニュースの消費者に、われわれが使ったデータへの容易なアクセスを与えることはいくつかの理由から正しいことだ。データを見せてしまえば、偏った結論にむりやり記事の内容を曲げていないという確証を与えることにもなる。データを公開することは社会科学の伝統であり、他の研究者に論文をつかって更なる議論を展開してもらうために行われてきた。ニュースの読者にデータを調べることを促せばことは、さらなるフォローアップ記事をつくるためのヒントを与えてくれるだろう。そして、データに興味をもった読者は必ずやまた記事に戻ってきてくれる。

Steve Doig, Walter Cronkite School of Journalism, Arizona State University

オープンデータのプラットフォームを設ける

私たちの働くLa Naciónでは、オープンデータを公開することがデータジャーナリズム活動の一環として行われている。アルゼンチンでは、情報公開法がなく、国のデータを閲覧できるポータルもない。そこで、読者に記事の中で使われたデータを提供する必要があると強く感じている。

そこで、生の構造化されたデータを Junar プラットフォームに公開し、グーグルのGoogle Spreadsheetでも公開している。私たちはほかの人にデータを再活用してもらうよう促すとともに、 ドキュメンテーションやビデオのチュートリアル で活用方法を少しだけ説明している。さらに、こうしたデータセットやビジュアライゼーションについてブログでも公開している。

また、我々の Nación Data blog でこうしたデータセットやビジュアライゼーションを公開している。こうした活動はアルゼンチンにデータ公開やデータを発行するツールを伝道し、私たちがどうやってデータを集め、それを利用したか、またどうやって再利用するかを知らせるために行われている。

2012年の2月のプラットフォームを開設してから、データセットについてのアイディアや提案を頂いた。主に学者や研究者、そして大学生―質問に回答したり、データセットを提供すると大変感謝してくれた―からだ。ほかにもTableau上で私たちのデータを活用してくれたり、コメントしてくれるユーザーがいたおかげで、Tableauでコメント最多や、最も閲覧されたデータとなった。2011年には、最もビュー数の多いビジュアライゼーショントップ100位のなかに7つがはいった。

Angélica Peralta Ramos, La Nación (Argentina)

データをヒトにする

ビッグ・データに関する議論がより広く意識されるようになったが、ひとつ重要な部分が抜け落ちている。それは人間の要素だ。データというと多くの人は切り離されて自由浮遊の数字をイメージするだろう。しかし実際は(多くの場合非常に人間的で)有形なものを測定したものなのだ。データは現実の人々の生活を繋いだもので、数値に取り掛かるときは、そのデータのもととなっている実際の世界の仕組みを考慮する必要があるのだ。

例えば、位置情報について考えてみよう。位置情報は、数億の写真や携帯電話から収集されている。こうしたデータ(経度、緯度、時間)をただの、「デジタルな排ガス」ととらえがちだが、本当は人間のストーリーの一瞬を抜き取ったものなのだ。スプレッドシートで見るデータは、ドライで客観的なもののように見えるかもしれないが、その位置情報を残した人たちに地図に跡をつけてもらい、改めて道筋を辿ってもらうと、力づよく人間的な記憶のリプレイを経験できる。

現状では、位置情報はたくさんの第三者によって利用されている。アプリケーション開発者、大手ブランドや広告代理店など。セカンドパーティーにあたる通信会社やディバイスマネージャーがデータを握り、所有しており、ファーストパーティー―つまりあなた―はこの情報について何のコントロールもできなければ情報を手に入れることもできない。NYTimesのR&D部では、プロトタイプの事業 OpenPaths を開始し、一般の人々に自分自身の位置情報を探索してもらうとともに、データの所有権についてその概念を体験してもらおうとしている。なんといっても、自分自身の生活や経験につながるこうしたデータの数値を自身でコントロールするべきだろう。

ジャーナリストはデータの持つ固有の人間性に光を当てる重要な役割を担うのです。そのことで、データと数値が洗われる仕組み両方において世間一般の人々の理解をシフトさせる力を持っているのです。

Jer Thorp, Data Artist in Residence: New York Times R&D Group

オープンデータ、オープンソース、オープンニュース

2012年は、オープン・ニュース元年になることだろう。オープンデータは、いまや編集上イデオロギーの中心であり、ブランディングのキー・メッセージでもある。そんな中で、データ・ドリブン・ジャーナリズムのためのオープン・プロセスが必要なのは明白である。オープン・データによって促進されるだけでなく、オープンなツールによって可能にさせられるプロセスでなければならない。年末までに、全てのビジュアライゼーションに元となったデータと、コードの両方を公開できるようにしたいと思っている。

今日、ビジュアライゼーションに使われている多くのツールはクローズドのソースが多い。またはデータの二次創作を禁ずる厳しいライセンスを伴ったものかのどちらかだ。オープンソースのライブラリはある一つの問題を解決してくれるが、より広い方法論は提供しそこなっている。こうした背景から、互いの作品を元にさらにストーリーを組み立てていくということが非常にやりづらい状況にある。会話をオープンにするものよりも、閉じてしまうものばかりという現状に対し、我々はインタラクティブなストーリーテリングを可能にするMiso Project (@themisoproject) を開発している。

このプロジェクトはほかの様々なメディアと共に話し合い、行っている。オープン・ソース・ソフトウェアの最大のポテンシャルを実現するにはコミュニティーの参画なしにはできない。これが成功すれば、読者にまったく新しい機能を提供できることだろう。コメントだけでなく、フォークしたり、バグをフィックスしたり、予想を超えるデータの活用がなされるなど、様々な方法での寄与が可能になるだろう。

Alastair Dant, the Guardian

ダウンロード・リンクを追加する

ここ数年、数ギガバイトのデータをつかった記事に取り組んできた。1960年代のタイプライターで書かれた文書をスキャンする作業から、WikiLeaksが発行した1.5ギガバイトにもおよぶケーブルの処理まで。いつも、編集者にオープンでアクセス可能な形式で、システマチックなソース・データの提供が必要だと納得させるのに苦労した。その問題を飛び越えて、「データをダウンロードする」というリンクを記事の中に追加し、関係あるデータのアーカイブをグーグルドライブで手に入れられるようにした。データのリユースをしてくれそうなユーザーの関心は政府助成プログラムとだいたい同じくらいだった。(つまり、とても低い)しかし、限られた少数の活用事例は新たなインサイト(洞察)を提供し、会話に拍車をかけてくれた。プロジェクトにつきほんの数分の+αの努力の損はなかった。

Nicolas Kayser-Bril, Journalism++

スコープを把握する

スコープを把握することだ。スケールやパフォーマンスのためのハッキングと、遊びのハッキングは別物である。プロジェクトのための適切なスキルを持った人たちとパートナーシップを組むようにしよう。ユーザビリティ、UX、そしてプレゼン資料のデザインを忘れてはいけない。これらはプロジェクトの成功を左右する重要な要素である。

Chrys Wu, Hacks/Hackers