[雑記] web.archive.orgを使って現在は404になっているページを発掘する

インターネットの情報はデジタル化され、世界中に拡散しているから、ずっと残り続けていつでもいつまでも取り出すことができる、と、なんとなくぼんやり思いがちです。

「消すと増える」などという言われ方もするわけですが、それはあくまでスキャンダラスな情報の場合であって、有益であっても発信者が公開を自ら辞めて(閉鎖して)しまったり、公開のまま放置しているうちにインフラ(プロバイダ)側でサービスが終了して閉鎖されてしまったり・・・たかだか10年前の情報ですら、そういった事例は枚挙にいとまがありません。
逆にデジタル情報なだけに、失われるのも早いという皮肉な状況がそこにあるわけですが、世の中にはやはりそういうことを危惧している人たちがちゃんといらっしゃるようで、web.archive.orgというサイトがとにかくものすごいレベルでインターネット上の情報をアーカイブしてくれています。

なんとなく、前からそういうサイトがあるらしい、ということはぼんやり認識していたのですが、最近PalmのPDAなんかを発作的にいじりだして、上記のツイートのような状況を目の当たりにして、ちゃんとこのサイトについて調べてみたのですが、いやあほんとこのサイトすごいですよ。ということで、当ブログが説明するまでもないと思うのですが、簡単な使い方など。

例えば、「http://www.palm.com/us/」に今現在アクセスすると、「http://mynewpalm.com」だかいうよくわからないサイト(おそらくは現在Palmブランドを所有しているTCL集団股份有限公司がPalmブランドのスマフォを投入するために用意しているんじゃないかと思いますが)にリダイレクトされてしまいます。

もちろん、懐かしのPalm社のPDAデバイスの商品情報なんて見ることはできません。

ではこれをweb.archive.orgにアーカイブされている過去のページ情報で見てみましょう。

web.archive.orgにアクセスします。


ここに見たいサイトのURLを入れます。


ん?ページの内容が出てこない?と焦ってはいけません。下に出ているグラフは、サイトの情報が収集された頻度を表したもので、逆にいうとpalm.comの場合は2002年ごろからのサイトの情報が収集されているんですね。たとえば、このグラフ中の2008年あたりをクリックします。


すると、その下にカレンダーが表示され、丸く色(水色や緑)がついた日付がでてきますね。これがサイトの情報を収集した日です。どこか適当にクリックしてみると・・・


おお!懐かしのPalm Centroが!というわけで、過去のあの日のインターネットにタイムスリップすることができてしまうわけですね。

もちろん、なんでも完璧に再現できるわけではないですが、たとえばPalmの公式サイトから配布されているファイル(アップデート用のインストーラとかダウンロードできるファイル)なども、リンクをたどっていけば、現在でもダウンロードできる場合が多いです。

もちろん、ダウンロードボタンクリックでメールが送信され、そのメールのリンクをクリックしてダウンロードページへ!みたいな凝った動作が介在する場合はさすがに無理と思われますが、とにかく一度試してみる価値はあるでしょう。

今ではダウンロードできなくなっているフリーウェアであったり、アップデート用のインストーラであったり、ライセンスは持っているものの、肝心のインストーラが手元にないシェアウェアなどの有料ソフトであったり、そういったファイルを現代に取り戻す用途にも大いに使えます。

ということで、知っている方はとっくにご存じでしょうが、私的にはちゃんと使ったことがなかったので、まとめてみましたというエントリです。

お役に立てましたら幸いです。

コメント