OpenSpending.orgで国庫を見ていく
2007年、Open Knowledge Foundationに、1ページのプロジェクト案を携えたJonathanがやってきた。それは Where Does My Money Go?(ぼくのお金はどこに行くの?) というプロジェクトで、英国市民が政府予算の使い道を理解しやすくなるものだった。これは公共情報をビジュアルに提供するという、より大きなプロジェクトの実証を意図していた。1940年代のOttoおよびMarie Neurathによる先駆的な仕事、Isotype Instituteをベースにしていた。
Where Does My Money Go?プロジェクトは、幅広いソースからの公共データを、直感的なオープンソースのツール群で探っていくことを可能にした。我々は賞を取ってプロトタイプの開発に援助をもらい、後にはChannel 4の4IPから完全な形のウェブアプリケーションにするための助けを得た。情報デザインのグル、David McCandless( Information is Beautifulの人)は、国内の各地域に予算がどのように配分されているかを見せる‘Country and Regional Analysis’(国と地方の分析)や、支払った税金の一日あたりの内訳をポンドとペンスを単位に示す 'Daily Bread' など、巨大な数たちを自分と関連付けやすくするさまざまなデータビューを作成した。
当時のプロジェクトの聖杯はアクロニムで Combined Online Information System、COINSデータと称されていた、存在する中で最高の網羅度と詳細性をもつ英国政府財政データベースだった。Lisa Evanse(the Guardian のDatalogチームに入るまで)、Julian Todd、Francis Irving(今やScraperwikiで有名)、Martin Rosenbaum(BBC)ほかと共同で、われわれはこのデータの閲覧請求を何度も何度も出していた---ほとんどは成功しなかった。
2010年についにこのデータはリリースされ、透明性支持者にとっての革命であると広く捉えられた。我々はウエブ・アプリケーションにロードするためデータに先行してアクセスできるという状況にあり、そのことが公になったときはプレスに非常に注目された。このためリリース日には、リリースについて論じ、頼み、またそれをオープンして見ていく方法を尋ねるといったことのために(ファイルは数十Gバイトあった)、我々のIRCチャンネルに何ダースものジャーナリストがあらわれた。こうした超大規模のリリースは複雑過ぎて効果的な「透明性を通じた不明瞭」あると難ずる評論家も居たが、読者に公共財源の使途について前代未聞の解説をすべくデータに突っ込んだ勇敢なジャーナリストもたくさんいた。the Guardianはこのリリースをライブブログ中継したし、他にも多くのメディアが取り上げ、データから読み取れることを分析した。
同様のプロジェクトを他の国でも走らせることについて世界中からリクエストや問い合わせを受けるようになるまで長くは掛からなかった。プロジェクトのドイツ版で連邦国予算を扱うOffenerHaushaltがFriedrich Lindenbergの作成でローンチされてすぐ、我々はプロジェクトの国際版であるOpenSpendingをローンチした。これは世界中のユーザーが公共支出をマッピングする助けとなるもので、場所の解説を入れる機能はちょっとOpenStreetMap的だ。天才Gregor Aischの助けを借り、部分的にはオリジナルのDavid McCandlessのデザインをベースにして、我々は新デザインを実装した。
OpenSpendingプロジェクトでは、支出データの取得、記述、解釈、一般への提示においてジャーナリストと大々的に共同した。OpenSpendingは公共支出の---高レベルの予算情報から執行レベルの実際の支出までの---検索可能な大規模データベースとして重要な第一弾である。トップはツリーマップやバブルツリーといった一連のすぐ使える可視化ツールで構成されている。誰もが地元の議会データをロードして可視化できるのだ。
我々は当初、一部のより洗練された可視化ツールに大きな需要があると考えていたが、さまざまなニュース媒体と話してみて、最初に充足すべきより基本的な要望があることを理解した。つまり、ブログ記事に動的な表を埋め込む機能などである。ニュース媒体にはストーリーに添えてデータへのパブリック・アクセスの提供を促したい---だからそうしたウイジェットも作成した。
我々が最初の大きなリリースをおこなったのは、ペルージャで行われた第一回のInternational Journalism Festivalがある頃だった。開発者、ジャーナリスト、公務員たちがイタリアのデータを共同でOpenSpendingプラットフォームにロードし、支出が中央、地域、地方政府に分割されていく様子のリッチな可視化を得た。それはIl Fatto Quotidiano、Il Post、La Stampa、Repubblica、Wired Italiaといったメディアで取り上げられ、the Guardianにも出た。
2011年にはPublish What You FundやOverseas Development Instituteとの共同作業で、2003-2006年のウガンダへの援助資金をマッピングした。これは新しかった。援助資金の流れを国の予算と並べて見ることができる最初のものだったからだ---援助国の優先順位と地方政府の優先順位を並べて見ることまでできるのだ。興味深い結論がいくつも得られた。たとえばHIVプログラムや家族計画はほぼ完全に外部の援助でまかなわれていることがわかった。これはthe Guardianでカバーされた。
我々は、その他の情報ソースを元にした支出データを相互参照をするためにNGOや支持団体にも働きかけた。例えば、Privacy Internationalは調査技術企業の膨大なリストや口語表現では`wiretappers ball’として知られている国際的な調査トレードショーに参加している代理店のリストを持って、我々にアプローチしてきた。企業名を支出データセットとシステム的に相互参照することで,どの企業が政府と契約しているのかを特定することが可能になった。その企業は情報公開請求(FOI: freedom of information request)で追跡調査ができた。このことは Guardian で報道された。
現在我々はSpending Storiesというプロジェクトの一環として、ジャーナリストや公衆の財政リテラシーを高めることに取り組んでいる。このプロジェクトはユーザーが公共支出データと公共支出にまつわるストーリーをリンクすることができるようになるというもので、ニュースの裏にある数字を、数字にまつわるニュースを閲覧できるようになるのだ。
この分野でやってきたことを通じ、我々は以下のことを学んだ:
-
ジャーナリストは生データの扱いに慣れていないことが多く、自分の取材の不可欠な基礎であるとは考えない者が多数である。生の情報を論拠としたストーリーというのはいまも比較的新しいアイディアである。
-
データの分析と理解は時間のかかるプロセスであり、それは必要なスキルがあっても同じだ。これを短寿命のニュース・サイクルに当てはめるのは大変なので、データ・ジャーナリズムは比較的長期の分析的なプロジェクトに使われることが多い。
-
政府がリリースするデータは不完全なものや古いものが多い。公共向けのデータベースは、情報公開法に基づく請求で取られる具体的な情報のかけらで補ってやらなければ分析的な用途に使えないことが、本当に多い。
-
支援団体、学者、研究者は、ジャーナリストより大規模なデータ駆動研究を行うだけの時間やリソースを持っていることが多い。彼らと組み、チームとして働くと大きな成果が出ることがある。
— Lucy Chambers および Jonathan Gray、Open Knowledge Foundation