Loading

(ガーディアンの)データブログは五輪チケットに関する報道のためにクラウドソーシングをどう使ったか

最も反響が大きかったクラウドソーシングプロジェクトは 五輪チケット抽選に関する記事 でしょう。英国の何千という人が2012年五輪のチケットを手に入れようと試み、手に入らずに怒りが渦巻きました。人々は数百ポンド分を注文し、何も手に入れられなかった。しかし、誰も本当のところどうなのかはわかりませんでした。一部の人だけが大声で不満を言っているだけで、ほとんどの人は実際には満足だったのか。だから我々はそれを確かめようとしたわけです。

この話題に関する良いデータが何もないという状況の中、私たちが実際に出来うる最善のことは、人々に質問する外ないと判断しました。しかし同時にその結果を軽視せざるをえないとも考えていたのです。なぜならサンプルがバランスのとれたものではないからです。

私たちはグーグルフォームで、 非常に具体的な質問項目を作成しました。それは実に多くの項目からなり、いくら分のチケットを注文したのかやカードからいくら引き落とされたのか、どのイベントに赴いたのかなどといった内容を含んでいました。

04 FF
Figure 13. 何枚の五輪チケットを手に入れましたか?読者の答えはこちら。(ガーディアン)

私たちはそれを小さな画像ファイルにして、サイトのトップに置きました。すごい勢いでシェアされていきました。私が考えるに、これが重要なことの一つです。「記事のためにどんな情報が欲しいのか?」と考えるだけではなく、人々は私にいま何を語りたいのだろうと考えなければなりません。そして人々が話したいものをあなたが引き出せたときだけ、クラウドソーシングは成功するのです。このプロジェクトは、私たちがクラウドソーシングに取り組んだ最初の試みの一つでしたが、反応は巨大なものでした。1時間もかからず千件の反応があり、その日の内に7千件に達しました。

そんなわけで、この時点で我々は結果をより真剣に発表しました。当初はどの程度うまくやれるのかわかりませんでした。だから、私たちはガーディアンの読者は他の人々よりも裕福かもしれない、思っていたよりも少ないチケットしか手に入れなかった人はそれを私たちにいいたがるかもしれない、などいくつかの警告もつけました。

私たちはこの結果がどれほどの価値をもつであろうか知りませんでした。最終的に私たちの記事のよりどころとなる7千件の良い記録を得ました。そしてその半分がチケットを買おうとして手に入らなかったことがわかりました。我々はこれらをすべて報道しました。たくさんの人が参加していたため、大きな影響力がありました。

数週間後、チケット抽選に関する公的な概要報告書が発表されました。私たちの記事の数字と驚くほど近かったのです。ほとんど完全に正しかった。運が良かった部分もあると思いますが、私たちがそれほど多くの人々から声を集める事ができたからでもあるでしょう。

もしあなたが読者にこのようなことをコメント欄を使って聞き始めたら、その結果を用いてできることは限られるだろう。だからあなたはまず考えないといけません。「私が知りたいことのために何が最高のツールなのだろう」と。コメント欄なのか。アプリなのか。もしアプリなら、あなたは考えないといけない。それが出来上がるのを待つ価値があるのか。それをつくるために必要なリソースにみあったものかと。

この例では、私たちはグーグルフォームを使うことを思いついた。もし誰かがフォームを埋めると、その結果がスプレッドシートに並んでいるところを見ることができる。これはつまり、もしそれがいまもアップデートされていても、結果がいまも入ってきていても、スプレッドシートをあけてその結果のすべてをすぐにみることができるということだ。

グーグルのサービスを使って作業を続けることもできたのだが、私はスプレッドシートをダウンロードし、数値が低いものから高いものにソートするなどの処理をエクセルを用いて行った。また、使ったお金の額がアラビア数字で書かれていない場合、そのエントリーをみつけ、それらをすべて修正した。私はできるだけ除外はしないと決めていたので、正しいフォーマットの回答だけを採用するのではなく、受け取った回答のフォーマットのブレを修正していった。例えば、外国の貨幣を使った人もいたから、それを英国通貨に換算したりした。しかしそれらは少々骨が折れるものであった。

この分析のすべてを数時間で終えたものの、私はあきらかにバカげた投稿にうちのめされていた。多数の人がチケットのためにまったくお金を使わなかったと記述していたのだ。それはおかしな話だが、まあいい。そういうものは7000件中100件もなかったのだから。

たとえば1000万ポンドのような明らかにおかしい高額の数字を書き込んで結果をゆがめようという人も数十人かいた。そして残りのデータについては普段から使っている通常のデータに関する原則を適用することができました。例えばピボットテーブルを作ったり、平均化してみたりなどと言ったことです。

私たちはどこのプロジェクトがどれぐらい影響力を持つか想像もつかなかった。なので作業は私とスポーツブログの編集者とだけで行った。私たちは一緒に頭をつきあわせて考え、これは楽しいプロジェクトになるかもしれないと思った。私たちは最初から最後までを24時間でやった。このアイデアを思いついて、昼食の時間帯にちょっとした記事をアップして、1日中その記事をサイトのトップに掲載し続けて人々の注目を喚起した。そして最後に翌朝その結果を公表したのだ。

私たちはGoogle Docsを使うことにした。なぜならこのアンケートの結果を完璧に管理することができるからだ。他の分析ツールを使う必要はなかった。特殊な世論調査ソフトを使ってしまうと多くの場合そのソフトの機能に縛られてしまう。もし欲しい情報の取り扱いに特別細心の注意が必要ならば、グーグルを使うことに躊躇し、内製したツールを使いたいと考えることはあるかもしれない。しかし、多くのケースにおいてGoogle Formはガーディアンのページに非常に簡単に、ユーザーにわからない形で自然に埋め込むことができ流ので非常に便利なのだ。

ここでクラウドソーシングを使いたいというデータジャーナリストに幾つかアドバイスをしておこう。まず知りたいことに関して具体的な問いを持つ必要があるだろう。また、できるだけ多くの選択肢がある質問をするべきだ。他にもあなたが得たサンプルが偏っているか確認するために話を聞く対象の基本的な人口統計を手に入れておこう。もしこうした数や統計量が必要なら、例えば回答のフォームが数字はアラビア数字に、通貨は指定されたものになるようにといった風にうまく誘導しよう。また量が多くてもしっかりとその答えをつかめないのであれば、多ければ良いというわけではない。そして最後に必ずコメント欄をつけること。なぜなら多くの人は回答フォームを埋めはするけど、本当にやりたいのは消費者の体験談やその怒りについて自分の意見をぶつけることだからだ。

データジャーナリズムブログのマリアナ・ブーシャートによるガーディアンのジェームズ・ボールへのインタビュー