データの利用と共有: 法の基本原則と例外規定、そして現実
この節では、データとデータベースに関する法律の状況と、使用可能な公共ライセンスや法的な手法を使ってあなたのデータを広げて行くためにあなたができることを簡単に見て行く。データドリブンジャーナリズムへのあなたの情熱を次の述べるようなもので弱めさせてはならない。データに対する法的な規制は常にあなたを邪魔するわけではない。法的規制があなたが公開したデータを使おうとする他の人たちを邪魔しないようにすることも容易にできる。
言うまでもないことではあるが、データは未だかつてなく簡単に取得できるようになった。データがウェブ上に広く公開される以前は、あなたが必要とするデータセットを仮に特定したとしても、そのデータセットのコピーを持っている人に、論文として発表してもらったり、郵送してもらったりそして直接出向くなどしてそのデータを見せてもらえるようお願いする必要があった。それがいまや自分のコンピューターから相手のコンピューターにこちらにコピーを送ってくれるようリクエストすれば良いのだ。これは概念的には似ているが、あなたはコピーをすぐに手に入れることができるし、クリエーターや出版者は別に何もしなくても良い。そして彼らはおそらくあなたがコピーをダウンロードしたことすら知らないだろう。
さてプログラムを走らせてデータをダウンロード(スクレイピング)することや利用規約についてはどう考えれば良いだろう?前のパラグラフに立ち戻ってみるとあなたのブラウザーはちょうどその手のプログラムと言えそうだ。利用規約はもしかしてこの種のプログラムのアクセスしか許さないのだろうか?もしあなたが尋常ではない時間とお金があればそういうドキュメントを読んだり、あるいは弁護士に助言を求めれば良いだろう。しかし普通は、愚かなことさえしなければ良いだけなのだ。もし仮にあなたのプログラムがサイトにアクセスし続ければ、当然あなたのネットワークはそのサイトからブロックされてしまうだろう。そしてそのような処置はおそらく妥当なのだ。今はウェブのデータにアクセスしたり、スクレイピングしたりすることに関する実践が大量にある。もしスクレイピングを実行したいならスクレイパーウィキのようなサイトにある事例を読めば有利なスタートが切れるだろう。
いったん興味のあるデータを手にいれると、処理要求や、読み込み、ソート、ビジュアライズや、関連づけ、その他あなたがやりたい分析をデータのコピーをつかって実行できる。また自分の分析を公開できる。そしてその分析対象はどんなデータでも良いのだ。(言論の自由がそうであるように)「事実はただである」というキャッチフレーズには多くの意味がある。しかし、もしかするとこのキャッチフレーズはデータベースかまたはより広く大雑把にはデータガバナンスの合法性にばかり目を向けている人たちにしか通じないかもしれない。
もし、よいデータジャーナリスト、またはそうなろうとする人ならば、ただ事実やデータの要点を含む分析を公開しようとするだけでなく、分析を実行するためにつかったり、なにがしか付け加えたりしたデータセットやデータベースも公開しようとするだろうか。またはおそらくたんにデータをキュレートしているだけで、何の分析もしていないかもしれない(それでもいい。世界はキュレーターを必要としている)。もしあなたが誰か他の個人や団体が集めたデータをつかっているならば、問題があるかもしれない。(もしあなたのデータベースがすべてあなたによって集められたものならば、次のパラグラフを次の次のパラグラフでの実践を共有するためのモチベーションとして読んで欲しい)
例え著作権の創作活動に対する規制についてあなたがよく知っていようが、もしコピーライトの所有者があなたの活動に対してその使用の許可を出さなかった場合(またはその活動がパブリッドメインかまたはフェアユースのような使用に関する例外条項と制約条項が存在する場合)、あなたの成果物が何であれその使用、配布、実演を著作権の保有者がやめさせることができる。事実はタダであるとはいうけれど、事実を寄せ集めることは著作権と同様に制限されるのだ。確かにこの制限に関する法律については、創作活動における著作権の効力に比べて多種多様なあり方が考えられる。しかし大まかにってデータベースは創作物と同様著作権に従うと考えていいだろう。多くの司法が「額に汗」の法理の基、データベースを単に集めるだけで、たとえそそこに創造性がなくても、データベースに対して著作権が付与されると判断している。アメリカにおいては特に著作権を適用するのに最低限必要な創造性より高い創造性が求められる傾向にある。(フェイスト社とルーラル社の電話帳をめぐる裁判事例が、米国の実情を知るのに典型的な例だ。)しかしいくつかの国の司法は「データベース権」としてデータベースの利用を制限する権利を著作権とはまた別に設けている。最もこの権利は、結局のところ著作権とその有効範囲の多くは同じであり、そのことは創造性に対する基準がほとんど存在しない点によく象徴されているだろう。そのようなケースとして最も有名なのはヨーロッパの独自の( sui generis)データベース権だろう。ヨーロッパ人であるなら尚更、データベースを公表する前に関連する団体から許可を取っているか確かめた方が良いだろう。
自明なことであるが、そのような規制はデータ・ドリブン・ジャーナリズムのエコシステムの発展にとって最善の道ではない(社会全体にとっても悪影響である。社会学者らがEUに独自の権利(sui generis right)の登場前からすでにその影響を指摘しており、施行後の研究がそれを裏付けた)。しかし幸いにも、データベースの公開者として、先に許可を与えるてしまうことで、そういった規制を実質的にデータベースから排除することもできる(ただしそのデータベースがさらなる権限の拡大を制限する条項を持たないと仮定すればだが)。要はデータベースをパブリックライセンスかパブリックドメインにリリースすれば良いのだ。これは多くのプログラマーが自分たちのコードを第三者が利用できるように無料のオープンソースライセンスで提供してるのとちょうど同じだ(データドリブンジャーナリズムはしばしばデータだけでなく、コードを含むのだから、もちろんコードもリリースすべきなのだ。そうすることでデータと分析が再現可能になるのだから)。データをこのようにオープンに公開すべき理由はたくさんある。例えば、読者がリンク可能な公開されたデータを使って、新たなビジュアライズやアプリケーションを生み出すかもしれない。実際ガーディアンがフリッカーの写真ギャラリーでそうした取り組みを行った。またあなたのデータセットは他のデータセットと組み合わせることで、あなたやあなたの読者にトピックへのより深い理解をもたらすことができるだろう。そして他の人があなたのデータで何かすることであなたに新しい記事の手がかりやアイディアをもたらすかもしれない。もしくは別のデータ駆動型のプロジェクトのアイデアにつながるかもしれない。そして最後にはあなたに確実に名声をもたらすだろう。
公共性のあるライセンスでの公開が必要だと判断したなら、次は具体的にどのライセンスにしたら良いかと悩むことになる。この難しい問いの答えは、あなたが今取り組んだり貢献しようとしている仕事のコミュニティやプロジェクトによって自然と導き出されるはずだ。要は彼らが使っているライセンスをそのまま使うということだ。もう一歩踏み出したい場合には、自由でオープンなライセンスを使うと良いだろう。つまり、許可を持った人なら誰でも、どんな使用目的に対しても自由にオープンに使えるように設定しておくということだ。また、何をすればオープンで、オープンなライセンスにすると何がユーザーに許されるようになるかと言ったことは、フリーソフトウェアとオープンソースの定義や Open Knowledge Definitionに書かれているようなデータベースを含む他の全ての知識に関するオープンネスの定義によって定められている。
Open Knowledge Definition のサイトに 現在利用可能なライセンスの一覧がある。まとめると、基本的に3つのクラスのライセンスがある。
- パブリック・ドメインの献呈
-
このライセンスは最大限に寛容なライセンスとして機能する。すなわちその成果物を使用する際に一切の条件がない。
- 寛容なまたは帰属表示のあるライセンス
-
クレジットを入れることがこれらのライセンスの唯一の重要な条件である。
- 複製改変自由、二次著作物も改変可能、継承ライセンス
-
もし公開するのであれば、このライセンスでも、修正内容は同じライセンスの元で共有されなければならない。
もしあなたが第三者によって公開されたデータセットを使うことを考えているなら、上のパラグラフの内容がちょうどどうやったらオープン・ライセンスの条件を満たすかの簡単な手引きになっていることに留意しよう。クリエイティブ・コモンズ、オープン・データ・コモンズ、そして各国政府のライセンスに至るまで、あなたが一番遭遇するであろうライセンスは多くの場合、重要な遵守事項についての簡単な要約があるはずだ。通常、ライセンスは、フォーマットに応じて、データセットをダウンロードしたページ(またはスクラップしたページ)に記載されているか、データと一緒に目立つ場所に記載されているだろう。このマーキングはあなたのデータセットを公開する際にも同様に配置しなければならない。
ここで一旦話の針を最初に戻して、もしデータセットがオンライン上で利用可能でない場合、またはなんらかのアクセスコントロール下にある場合は何をすべきか考えてみよう。まず、単にアクセス権を個人的に与えてくれるようにお願いするだけでなく、データを世の中に対して広く利用できるようにするよう働きかけてみよう。またオープンにすることで起こりうる有望な可能性も示してあげると良いだろう。
データを公開すれば、いくつかのデータセットについてはプライバシーなどの配慮すべき点や著作権以外の規制について注意する必要があるかもしれない。データをオープンにすることで、たくさんの技術的なまたはコピーライトやそれに類似する障壁が単純に低減するからといって、他の抵触しうる法律を守らなくて良いことにはならないからだ。しかし、ジャーナリストの良識において調査すべき時には、昔も今もジャーナリストには多くの力が与えられ、また時には彼らの行為は大いに擁護されることとなる。
幸運を祈る!ただ、(低い)法的リスクを管理することよりも、きっとプロジェクトの他の領域にもっと配慮することになるだろう。
— クリエイティブ・コモンズのマイク・リンクスヴァイヤー