インターネット上に情報を永続させる難しさ

最近、Qiita で個人情報の取り扱いがイマイチっつーことで炎上して、退会する人が多かったらしい。

読んだ記事がプロフィール欄に表示される、という機能で、その情報は Treasure Data という別の組織が Cookie を追跡して得ているようだった。この炎上については、自分は「『アダルトサイトで同じことをやったら大問題』とかいうけど、Qiita はアダルトサイトじゃねえし」「そんなに見られてやましいモンばっか Qiita で見てんのかお前ら」ぐらいにしか思っていない。好きにしたらいいと思ってる。勿論、気にする人は気にするだろうし、もっと良いやり方があったんだろうな、とは思う。でも個人的には、どうされてもいい。

で、この炎上により Qiita を退会する人が多かったので、(ユーザの退会により) 有益な情報が失われた、という嘆きも見られた。今日の本題はココ。

目次

失われるハイパーリンク

インターネット (WWW) の当初の思想は、

  1. URI によって文書 (→ 情報) を一意に示し、
  2. それらをハイパーリンクという技術で相互にリンクできるようにし、
  3. 情報を永続させる

といったモノであった。

しかし実際は、

  1. 一つの URI が示す文書・情報は維持されない
    • SNS なんかは常に最新の投稿が見えたり
    • 静的サイトでも内容を書き換えてしまえば、同じ URL にアクセスしても得られる情報が異なってくる
  2. 「1.」により、ハイパーリンク先が消えていることが多い
    • 「参考文献」などとしてリンクを貼っても、対象がなくなっていては効果がない
  3. 情報は永続しない

のが現状である。

そもそも「Web 2.0」とかいって、動的なコンテンツが増えてきた以上、URI の思想は崩れつつあるかな、とは思うが、それにしても、情報はなかなか永続しない。

データが永続されなかった事例

ホスティングサービスの提供終了とかで、データがインターネット上から消滅した例は数え切れない。個人的にも影響が大きかったモノを軽く調べ直してみた。

…と、こんな感じで、思い出せるだけでも相当数のサービスが終了し、それに伴ってホスティングされていたデータが失われている。

一部は Archive.org などで閲覧できたり、別のサービスにデータ移行していたりするとは思うが、大半は失われてしまった。

ハイパーリンクするだけでは情報を残せない

僕が痛感するのは、「参考文献へのハイパーリンクを貼るだけでは、情報を残し続けられない」ということだ。

元のサイトが消えてしまうのは、もはや仕方がない。URI も永続させるのは難しい。

であればせめて、自分がその情報にリンクする時にできるだけ自分の記事に「引用」という形でコピーを作っておくしかないのかな、と思っている。リンクしながら併せて引用する、ということだ。引用の範疇や是非については意見があると思うが、「自分が有益だと思ったその情報を残し続けるには」を考えると、できるだけ多くのコピーを作ることしかないだろう。

リンク先のサイトがなくても完結する文書を書く

ある情報をインターネット上に維持し続けるには、引用によるコピーをとるか、自分で情報をまとめ直す必要があると考える。コレはそのドキュメント単体での質を高めることにも繋がると思う。

リンク先を見ないと完全に理解できないような記事は、リンク先が消えてしまった時に有用性が下がるワケだ。引用なりまとめ直すなりして、自分のドキュメント内にその情報があれば、そのドキュメント単独で完全な情報を得られるので、質が高まる。ウェブ上の広告収入の観点からしても、リンク先のサイトに「離脱」されることが少なくなると思われる。

個人的には Evernote などにクリップする

ココまでの話は、一度インターネット上に公開された情報を、できるだけ長くインターネット上で得られるように維持するための考え方だった。

別に自分さえ読めれば良いのであれば、Archive.org にクロールさせるでも良いが、オススメは Evernote などを使ってウェブページ全体をクリップ (ダウンロード) しておくことだ。最終的にはローカルに持っておくことで、「インターネット上から消えても取り戻せる」ようになるだろう。


雑に魚拓とったり、見たページのリンクを SNS に投稿したりするだけじゃなくて、ちゃんと本文や画像を含めて、まるっとコピーしておくしかないなぁ、と思うのであった。