Mapa76 ハッカソン
2011年4月、我々は Hacks/HackersのBuenos Aires支部を立ち上げた。立ち上げに合わせ、2つのミーティングを開催した。どちらもジャーナリストとソフトウェア開発者がコラボレーションするためのイベントで、120人から150人の参加者がいた。3回目のミーティングでは、Buenos Airesから300キロ離れたRosario,という町にある、デジタル・ジャーナリズム協議会の8人メンバーと、30時間のハッカソンを行った。
3つのミーティングを通して掲げられたテーマは、ウェブから集めた大量のデータから余計なものを省き、目に見える形で表現することだった。データの抽出と、データの視覚的な表示。使ったデータの表示。その支援を行うため、Mapa76.infoと呼ばれるプロジェクトが発足したが、これは簡単な作業ではなかった。
なぜMapa76というプロジェクトが始まったのか? 1976年3月24日、アルゼンチンでクーデターが発生した(訳注 : 汚い戦争と呼ばれるアルゼンチンの内戦。クーデターにより成立した軍事独裁政権が、知識層やジャーナリストへの弾圧を行った)。この戦争が終わる1983年までの間に、30,000人の行方不明者、何千人もの死者、そして500人の児童誘拐が行われた。30年以上たった今、たくさんのアルゼンチン国民が、この戦争で人道に対する罪が行われたと考えており、2011年9月現在、この犯罪に関わったとされた人物は262人に達している。現在は14の裁判が行われており、7つの裁判の開始日が決まっている。公開裁判にかけられているのは802人である。
これらの告発は、研究者、ジャーナリスト、人権組織、法廷、検事、あるいは他の手続きにより集められた、大量のデータによって行われた。データは分散して処理されたが、調査者達はソフトウェアを使わずにデータを調べることもあった。これはつまり、何かしら見落としが存在することや、データから導き出せる仮説の内容に限界があることを意味している。Mapa76は報道、法律、裁判や歴史に関する調査で、大量のデータにオープン・アクセスするためのツールなのである。
ハッカソンに備え、ジャーナリストと開発者がコラボレーションできるプラットフォームを作成した。マーチン・サルサレが、テキストデータから構造化されたデータを抽出するための、基本的なアルゴリズムを作成した。幾つかのライブラリはDocumentCloud.orgプロジェクトでも使用されているものだが、大量に流用しているわけではない。プラットフォームは自動的に分析を行い、名前や日付、場所といった情報を抽出する。ユーザは様々な事件の重要な事実を調べていくことが可能となる(誕生日、逮捕された場所、行方不明になったとされる場所など)。
我々の目標は、アルゼンチンの軍事独裁政権に関する裁判のためのデータを自動で抽出することだ。文章になっている証拠や証言、判決内容から自動的(あるいは半自動的)に、1976年から1983年の間に起こった事件に関する、重要なデータを見つけられるようにしたいと思っている。抽出されたデータ(名前や場所、日付けは保存され、研究者が分析し、より良いデータにできるようになっている。データは、地図、年表、ネットワーク分析ツールを使って解析することも可能だ。
このプロジェクトによって、ジャーナリスト、調査者、検察官や証人は、ある個人の人生がどうであったかを知ることができるようになるだろう。そこには、誘拐や行方不明、解放などの出来事も含まれる。もし何か足りない情報があれば、ユーザは膨大な量のドキュメントから、事件に関係がありそうな情報を探し出すことができる。
ハッカソンのために Hacks/Hackers Buenos Aires で公示をした。当時は200人ほどのメンバーがいた(この記事を書いている時点では540人)。我々はたくさんの人権団体とも連絡を取り合っていて、このミーティングにはおよそ40人のジャーナリスト、支援団体、開発者やデザイナーなどが参加した。
ハッカソンの最中、いろいろな種類の参加者達が、それぞれに独立して取り組むことができるようにタスクを分割できることに気が付いた。そうすることで、作業を円滑に進めることができるのだ。例えば、デザイナーに地図と年表を一つにしたインタフェースを作るようにお願いし、開発者には構造化されたデータの抽出方法や、はっきりと名前を取ることができるアルゴリズムに関する調査をお願いし、ジャーナリストには特定の人達に関して考え得るストーリーについての比較検討や、特定の事件に関する資料の精査をお願いする、といったやり方だ。
ハッカソンを開催して気付いた、大きな問題がある。我々のプロジェクトがとても野心的であったこと、短い時間にたくさんの要求を出してしまったこと、そして、ボランティアのような緩いつながりを調整していくことの難しさだ。プロジェクトを手伝ってくれた人達のほとんどは仕事で忙しいうえ、他のイベントやプロジェクトにも関わっていた。Hacks/Hackersブエノスアイレスが2011年に行うことができたミーティングは9回だった。
プロジェクトは今でも開発を続けている。4人からなる、コアチームがあり、12人以上の協力者と活動をしている。 公開メーリングリスト と プログラムのGitHubリポジトリ を通して、プロジェクトには誰でも参加することが可能だ。
— Mariano Blejman, Hacks/Hackers Buenos Aires