Loading

アルゼンチンにおけるバスの補助金

アルゼンチンにおける公共のバス輸送システムに対する補助金の額は、2002年以降は毎年の最高額を更新しながら急増し続けている。しかし2011年、選挙での勝利の後、アルゼンチン政府は同年12月から公共サービスに対する補助金を削減することを宣言し、それと同時に中央政府は地方のバスと地下鉄の管理をブエノスアイレス市政府に移行することを決定した。しかし、地方政府へ補助金が移行するのかが明らかにされておらず、また運送システムの安全を保証するための資金も不十分だったことから、ブエノスアイレス市政府はこの決定を却下した。

この事態を受けて、私はLa Naciónで働いている仲間と初めて会い、私たちのデータ・ジャーナリズム活動をどのように始めればよいかを話し合った。経済部門担当の編集者は、 Secretaría de Transporte(運輸省)で公開されている補助金のデータから始めたらよいのではないかと提案してくれた。というのも、データの形式や専門用語のためにそれを理解するのはとても難しかったからだ。

公共輸送システムの不便さは、毎日580万人もの乗客の生活に影響を与えている。遅延やストライキ、故障、おまけに事故もよく起こる。私たちは、アルゼンチンの公共輸送機関に対する補助金がどこへ渡っているのかを調査して、現在開発中の「輸送機関に対する補助金のエクスプローラー」によってそのデータに簡単にアクセスできるようにしようと決めた。

03 LL 01
Figure 21. 輸送機関に対する補助金エクスプローラー (La Nación)

私たちはバス会社が政府から毎月どのくらいのお金を受け取っているのかを計算することから始めた。そのために、私たちは 運輸省のWebサイト で公表されている、PDFで400ページを越えるデータを調査した。そこには、2006年以降の1300社以上に対する毎月の支払い金額が掲載されていた。

03 LL 02
Figure 22. 補助金をもらっている運送会社のランキング(La Nación)

私たちはスクレイパー(Webページから情報を取り出すプログラム)を開発する専門のプログラマーとチームを組んだ。それは、データの常時ダウンロードを自動化し、PDF形式のデータをエクセルやデータベース形式のファイルに変換するためだ。私たちが使用しているのは、印刷物やオンラインで提供されている自分たちで調査や可視化した28万5,000以上の記録を含むデータセットだ。それに加えて、私たちはこのデータを全てのアルゼンチン人が再利用やシェアできるように、コンピュータで読み取れる形式に直している。

次のステップは、公共の輸送車両を1ヶ月維持するのに政府は1台あたり平均してどれだけの支出をしているのかを特定することだった。そのために私たちは別の政府機関のWebサイトを閲覧した。それは、アルゼンチンの輸送関連の規制に責任を負っている 国家運輸規制委員会(CNRT) だ。このWebサイトに掲載されているバス会社が所有している車両は全部で9,000台だ。私たちはバス会社の名前を一致させ2つのデータセットを串刺し検索できるようにするためのノーマライザーを開発した。

調査を進めるためには、それぞれの車両の登録ナンバーが必要だった。CNRTのWebサイトには、ライセンス・プレートと一緒になった会社ごとかつ路線ごとの車両のリストが掲載されていた。アルゼンチンの車両登録ナンバーは車両の製造年と文字と数字で構成されている。例えば、私の車の登録ナンバーはIDF234だ。「I」は、2011年の3月‐4月を表している。私たちは会社ごとのバスの平均的な使用年数を突き止めるために、この仕組みを逆転させて、リストに掲載されている全ての会社が所有しているバスのライセンス・プレートを割り出した。そうすることで、それぞれの会社にどのぐらいのお金が流れているかを示し、車両の平均的な使用年数に基づく金額を比較できるからだ。

その課程の途中で、私たちが必要とするデータが含まれている政府が公表したPDFの内容が変更された。不思議なことに、ファイルの名前やURLはそのままだった。いくつかのPDFは今でも縦の「合計」が記載されていない状態のままだ。それによって2002年から2011年の調査全体が照合できなくなってしまっている。

私たちはこの事例をボストンのハッカー達が組織しているハッカソンに持ち込んだ。そこでは開発者のマット・ペリーが気前よく「PDF Spy」と呼ばれるものを作ってくれた。このアプリケーションは、そのハッカソンで最優秀賞を獲得した。 PDF Spy は、Webページに掲載されているPDFを探してPDFの内容に変更があったかどうかをチェックしてくれる。マット・ペリーは「政府の言う”透明性”に決して騙されるな」と書き記している。

03 LL 03
Figure 23. 政府から受け取っている金額に対する車両の年数の比較(La Nación)

プロジェクトの参加者

ジャーナリスト7名とプログラマーたちそしてインタラクティブ・デザイナー1名のチームで、13ヶ月かけて実行した。

このプロジェクトで必要とされた職業は以下の通りだ。

  • 公共輸送システムに対する補助金の働きとそのリスクそしてバス会社の市場について熟知しているジャーナリスト。

  • データを解体、解析、標準化し、PDFから抽出してエクセルのスプレッドシートにする技術を持っているプログラマー。

  • データを分析し何通りかの異なった計算ができる統計学者。

  • インタラクティブなデータのビジュアル化ができるデザイナー。

使用したツール

アプリケーションに対してはVBasicを、RailsにはRubyとともにExcel Macros、Tableau Public、そしてJunar Open Data Platformを、またSubsidies ExplorerにはGoogle charts APIとMysqlを使用した。

このプロジェクトの影響はとても大きかった。私たちのサイトは数え切れないほどたくさんの人に閲覧され、調査はLa Naciónの紙版で注目記事としてトップページに掲載された。

この最初のデータ・ジャーナリズム活動の成功は、私たちが対内的に調査報道をカバーし公衆にサービスを提供するようなデータ操作を確立するための事例を作る役に立った。その結果が、Data.lanacion.com.ar というプラットフォームだ。私たちはそこで、公共の利益に関わるさまざまなトピックについてのデータを、コンピュータで読み取れる形式で公開している。

Angélica Peralta Ramos, La Nación (Argentina)