スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

「BitTorrent で共有されているファイル、合法なものは 0.3 %」というインチキ調査

以下の文章は、TorrentFreakの「Tech News Sites Tout Misleading BitTorrent Piracy Study」という記事を翻訳したものである。ちなみに、この記事のタイトルはスラッシュドットの記事から拝借した。

原典:TorrentFreak
原題:Tech News Sites Tout Misleading BitTorrent Piracy Study
著者:Ernesto
日付:July 24, 2010
ライセンス:CC by-sa

BitTorrentでダウンロードできるファイルのうちわずか0.3%が『合法』であるという研究が話題になっている。この調査結果は、アンチパイラシー団体AFACTが喧伝しており、Ars TechnicaやZDNetなどのニュースサイトでも取り上げられている。この研究がインチキであることを見抜けなかったようだ。

時折、BitTorrentシーンを記述しようとする研究が注目を集めることがある。昨日、Internet Commerce Security Laboratory (ICSL)が行った研究(pdf)が公表された。研究者は全Torrentのうち、わずか0.3%が合法なコンテンツであると確認したという。注目を集める見出しとしては申し分ない、だがこの研究はどれくらい正確なのか?

残念なことに、この手の結果はアンチパイラシー団体に喧伝され、第三者には、それもArs TechnicaZDNetといったインターネット上で一目置かれている大手ニュースサイトさえ、鵜呑みにされてしまう。今回のケースでも、記者はこの調査に完全に騙されてしまった。

この研究に目を通してわずか数分で、我らTorrentFreakチームはあきれ果ててしまった。間違いに次ぐ間違い、そしてあまりに不正確なデータと方法論をもとに導き出された結論。この研究の致命的な誤りを以下に記すことにしよう。あくまでも氷山の一角であることをお忘れなく。

この研究は、4つのリサーチ・クエスチョンについて答えを導き出そうとしている。ここでは、それぞれのクエスチョンについて、その答えがどう間違っているかを指摘していこう。

1.BitTorrentを使用してどれくらいのファイルが共有されているのか?どんなカテゴリーのファイルが共有されているのか?

ICSLは、今春、17のBitTorrentトラッカーから得たデータとして、オンライン上に100万ちょいのTorrentがあるとしている。また、カテゴリーの概要として、全Torrentのうちアプリケーションは2.3%、映画・テレビ番組は70%超であるとしている。

いずれの結論もあまりに間違っている。

この研究者らがどのようにして100万Torrentという結論に落ち着いたのか全く理解できない。たとえば、彼らの調査対象となっているOpenBitTorrentのトラッカー単独で、2,500万Torrentをトラッキングしている。さらに、isoHuntなどのサイトは500万を超えるユニークTorrentをインデックスしている。ICSLのデータ収集方法が極めて不正確であることは言うまでもない。

さらに、カテゴライズの仕方についても、さらに大きな欠陥がある。彼らのやり方は、すべてのTorrentをベースにしたものではなく、最もシードされているTorrentをベースにしており、こうした方法はデータをひどくゆがめることになる。一般に、書籍やアプリケーションは、映画・テレビ番組に比べてシードされにくく、それゆえカテゴリー概要にて過小評価されてしまったことになる。

2.任意の時点で、BitTorrentを使用したファイル共有がどの程度行われているか?

「我々の調査で使用したデータでは、現在、最低でも117,420,061のシードが記録されている。この値は、トラッカーから得られたそれぞれのTorrentで最も利用可能なシーダー数を決定することで算出された。」と研究者は述べている。

この数字も間違いであるが、こちらは上記のものとは別の誤りである。研究者たちは、嘘のシード数を報告する複数のトラッカーを対象に含めるという致命的なミスを犯した。この点については後述する。この論文にて、2年前のTorrentに100万シーダーもいるかのように書かれていることには、苦笑せざるを得ない。任意の時点でのシーダー数は、実際には1,000万から2,000万くらいだろう。

3.それぞれのTorrentが何回共有されたのか?

研究者たちが馬鹿をやらかしてしまったのはここだ。このクエスチョンへの答えとして、彼らは最もシードされているTorrentのリストを掲載している。上述したが、最もシードされているファイルはほぼ2年前にアップロードされたもの(The Incredible Hulk)で、なんと1,112,628シーダーにも上る。第10位のTorrentでも277,043シード。すべて間違ったデータだ。

フェイクTorrentトップ10?

これらの数字がどのように算出されたのかはよくわからないのだが、現時点で最もシードされているTorrentはわずか13,739シーダー、この調査が示すThe Incredible Hulkのシーダー数の1%程度である。さらに、2年前にリリースされたものという事実は、少し警戒して見なければならない。どうも研究者たちは、偽トラッカーからデータを収集したように思える。このトップ10リストのすべてのTorrentが実際にはフェイクであったとしても、何ら驚きはない。

4.全ファイルならびにダウンロード数による違法ファイル共有の数および割合はどれくらいか?

これについて、研究者らはBitTorrentにおける全ファイルのうち97.9%が著作権侵害ファイルであり、わずか0.3%が『合法』であると結論づけている。我々の以前の結論に基づいて考えると、これらの数字が正確だとは言い難く、事実、そうではない。方法論の欠陥は余りに多く、特にこの統計は、偽ファイルが多数ある中から最も人気のファイルをベースにして算出しており、極めて不正確であると言える。

少なくとも研究者たちは、(多数の偽ファイルの中で)最もシードされているTorrentではなく、(不正確とはいえ)全体のデータから著作権侵害ファイルの割合を算出すべきだった。もちろん、Torrentの大半が合法的なものだと言いたいわけではない。この研究におけるTorrentやソースの選択が、著作権侵害Torrentを発見する方向に強いバイアスがかけられていることを指摘したいのだ。

isoHuntを見るだけでも、我々の主張は裏付けられる。isoHuntによると、同サイトにて5,451,959のユニークTorrentファイルがインデックスされている。そのうち、85,457Torrentが、クリエイティブ・コモンズでライセンスされた音楽のみを提供するJamendoからのものである。つまり、Linuxディストリビューションなど(その他の合法的なTorrent)を含めずとも、1.5%のファイルが合法的なファイルであると言える。

重要な点は、この『アカデミック』な論文が、我々がこれまで目にしてきた中でも最も不正確な部類のものだということ、そして、主要テクノロジー系メディアがこの論文を精査する時間を作れなかった、またはこの結果を読み、自らの結論に至れるほどの専門知識を持ち合わせてはいなかったということだ。さらにひどいことに、オーストラリアのアンチパイラシー団体AFACTはおそらくこの『信頼できる』論文を裁判官を説得するために持ち出してくるだろう。彼らは今、豪ISP iiNetと同社加入者の著作権侵害の責任について訴訟の真っ最中である。

Arsやその他のメディアが、このレポートについてアップデートしてくれることを祈ることにしよう。

Update: Arsがやってくれた!

我々も研究者の1人、ポール・ワッタースにコメントを求めている。今のところ、彼からの返信はない。

Update2: ワッタースから返信があり、彼はこの調査結果の有効性を支持するという。こちらからの質問はすべて無視され、その代わりに彼は統計マニュアルのコピーを送ってくれた。博士課程の学生に統計と調査法を教えていた私としては、丁重にお断りさせていただいたが。

おそらく最初から煽り気味の研究なんだろうなぁとは思う。なので、こういう批判が出るのも当然かな。百歩譲って結論ありきなのはまぁわかるにしても、 調査手法としてはかなり荒いというか、意図した結果を導き出すことをクリアするだけのやり方というか。

ただし、数値はともかくとしても、実態はこれに近いパターンが見いだされるような。個人的な印象だけどね。違法流通をトラフィックから見れば、もっと顕著に出るかも。ただ、不正確な調査を見て、感覚的に理解した気になってしまうのも危険だよね。

私自身は、違法ファイル共有や違法流通なんてなくなってもいいと思っている。大事なのは、個人が自らの創作物を効果的に公表する機会とか可能性であって、だからこそ、その機会が失われる可能性に対しては抵抗する。両者を実現するためには、合法的な共有の促進しかない。

もちろん、既存のコンテンツ産業にコンテンツを差し出せというわけではなくて、自らの作品の共有を望む人たちの作品を積極的に共有し、我々にとってなくてはならない存在にしようというだけのこと。

合法的な共有の促進は望ましいこと。ただ、その道筋を作るのは我々しかいない。コンテンツ産業は違法ファイル共有の撲滅を望んでいるが、(彼らが関わるはずのない)合法ファイル共有の普及なども防ぎたい、つまり違法流通を抑えたいが、敵を増やしたくない、と考えるだろう。コンテンツ産業が否定するものを行政なり立法なりがサポートするわけもない。コンテンツ立国なんていっても、結局は金の話なんだから。

ある意味では、変化の中でビッグチャンスが回ってきたとも言える。未だ変化は続いていて、誰も先はわからない。かつては過去を踏襲するだけで良かったものが、今や暗中模索しなければならない。誰かに舵取りを期待するのか、自ら舵取りに参加するのか、それはあなた次第。

Trackback

Trackback URL
http://peer2peer.blog79.fc2.com/tb.php/1695-a7ec927e

Comment

Comment Form
公開設定

プロフィール
heatwave Author
:heatwave

RSS Jamendo twitter tumblr Creative Commons Attribution 2.1 Japan
ブログ内検索
記事リスト
最新の記事
全記事一覧
他所で書いてるブログ

P2Pとかその辺のお話@はてな

アーカイブ

カテゴリー
最近のコメント
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。