Loading

成功例の紹介

貢献者の何人かにデータ・ジャーナリズムのお気に入りの事例とそれのどこが好きなのか尋ねてみた。以下がその回答である。

Do No Harm(Las Vegas Sun)

私のお気に入りの例は、Las Vegas Sunが2010年に病院看護の分野で行った Do No Harmシリーズだ。Sunは290万を超える請求書の記録を分析し、避けられた怪我、感染、手術ミスが3600件を超えることを明らかにした。Sunは公記録を請求して取得し、避けられるはずだったミスのせいで患者が死んだ300件を超える事例を特定した。Do No Harm はいろんな要素を含んでいる。それは外科的損傷がどこで想定以上に発生しているか読者が病院ごとに見ることができる 対話型グラフィックスであり、病院ごとに院内感染の広がりを表示する時系列付きの 地図 であり、そしてユーザが避けられた怪我や人々が被害にあっている病院ごとにデータを取り出せる 対話型グラフィックス である。ここが好きなのは、理解して利用するのがとても簡単だからだ。ユーザはかなり直感的にデータを調査できる。

Do No Harmは現実にも影響を与えた。ネバダ州議会は 6つの法案でこれに応えた。これに関わったジャーナリストは、データを入手して整理するのに懸命に働いた。そうしたジャーナリストの一人であるAlex Richardsは、誤りを訂正してもらうために、病院と州に 少なくとも十数回データを返送している。

Angélica Peralta Ramos, La Nacion(アルゼンチン)

01 GG
Figure 3. Do No Harm(The Las Vegas Sun)

公務員給与データベース

私はRyan Murphyのような優れたデータ記者を抱えているProPublicaやthe Texas Tribuneみたいな小規模の独立系組織が日常的にやっている仕事が好きだ。あえて選ぶなら、the Texas Tribuneの 公務員給与データベース プロジェクトになる。このプロジェクトは、660,000人もの公務員給与情報をデータベースに集め、利用者が検索して記事を作成するのを支援する。このデータベースは部局、氏名、給与で検索をかけられる。シンプルにして有意義で、入手しにくい情報を公にするものである。このサイトは簡単に利用でき、そして記事を自動生成してくれる。the Texas Tribuneのトラフィックの大半は同社のデータページが占める理由がこの実例を通してよくわかるだろう。

Simon Rogers, the Guardian

01 FF
Figure 4. 公務員の給与 (the Texas Tribune)

AP通信のイラク戦争記録の全文視覚化

Jonathan Stray (ジョナサン)と Julian Burgess (ジュリアン)の仕事に Iraq War Logs (イラクの戦争記録)というのがある。これは、巨大なテキストデータ群の中から探索に値するテーマを見抜くために、実験的な手法を用いてテキスト分析と可視化する刺激的な試みであった。

JonathanとJulianは、テキスト分析の技術とアルゴリズムを用いることで、ウィキリークスによって漏洩された何千という米国政府のイラク戦争に関するレポートからキーワードのまとまりを視覚的に表現する方法を編み出した。

ここで使われた手法には限界があるし、そのアプローチは実験的だが、革新的で斬新なアプローチでもある。この技術は、すべてのファイルを読もうとしたり、特定のキーワードを入力してその結果について調査するという先入観をもった戦争記録の調査を行うのではなく、特別な関連性のある話題/キーワードを算出して視覚化するものである。

データ量――文章データ(電子メール、報告書など)と数値データの両方――の増大やパブリックドメインへの参入により、主要な関心領域を目立たせる方法を見つけることがますます重要になる――それこそデータ・ジャーナリズムの刺激的なところである。

Cynthia O’Murchu, Financial Times

01 YY
Figure 5. 戦争記録分析(AP通信)

Murder Mysteries

私が好きなデータ・ジャーナリズムの場の一つがScripps Howard News ServiceのTom Hargroveによる Murder Mysteries プロジェクトである。彼は政府のデータと公記録から、185,000件を超える未解決の殺人事件についての人口統計学的に詳細なデータベースを作り上げ、それから連続殺人鬼が存在する可能性を示唆するパターンを検索するアルゴリズムを設計した。このプロジェクトには、政府独自のデータベースよりも優れたデータベースを寄せ集める重労働、社会科学の技術を用いた巧妙な分析、そして読者が自分で探究可能なオンラインにおけるデータの双方向的なプレゼンテーションのすべてがある。

Steve Doig, Walter Cronkite School of Journalism, Arizona State University

01 XX
Figure 6. Murder Mysteries (Scripps Howard News Service)

Message Machine

私はProPublicaの Message Machineの記事や おたくっぽいブログ投稿 が好きだ。Message Machineは、一部のツイッターユーザがオバマ陣営からいろんな電子メールを受信することへの好奇心を表明したことがすべての始まりである。ProPublicaの人たちがそれに気づき、読者にオバマ陣営から受け取ったどんな電子メールも転送するようお願いした。このプレゼンテーションは、その晩送られたさまざまな電子メールの違いをエレガントに視覚化されたものだった。これがすごいのは、ProPublicaが独自のデータを収集したことだ(サンプル数は明らかに少ないが、ストーリーを語るには十分に大きい)。でももっとすごいのは、彼らが新興の現象である、特定の個人に向けてメッセージを送る選挙キャンペーンにおけるビッグデータの話を語っているところだ。これはこれから起こることの序章に過ぎない。

ブライアン・ボイヤー, シカゴ・トリビューン

01 HH
Figure 7. Message Machine (ProPublica)

チャートボール

私の好きなデータ・ジャーナリズムのプロジェクトのひとつに、Andrew Garcia Phillips (アンドリュー)の作品で Chartball (チャートボール) というものがある。Andrewはかなりのスポーツファンで、貪欲なまでにデータを欲していて、デザインについてはヤバいくらい目利きで、プログラムだって書くことができた。 チャートボールで彼が可視化したのは歴史の流れだけではなく、個々のプレイヤーやチームの成功や失敗の詳細だった。できごとの背景を描き出し、魅力的なグラフィックスを産み、その作品は深みがあって楽しくて面白いのだ。たいしてスポーツに興味のない私でさえそう思ってしまうのである!

Sarah Slobin, Wall Street Journal

01 JJ
Figure 8. 勝敗の図示 (チャートボール)