ウェイバックマシンを使ってウェブサイトをアーカイブする方法

私たちはインターネットとその豊富な知識を当然のこととして受け入れています。実質的にすべての情報は、ボタンをクリックするだけで24時間365日アクセス可能です。しかし、それがそうでなくなることもあります。ウェブサイトは瞬時に消えてしまうことがあり、そのコンテンツは永遠に失われてしまいます。

インターネット上に現れるコンテンツをアーカイブすることは、さまざまな理由から重要です。ウェブサイトを保存することは、人間の文化を保存する方法の一つであり、私たちが本や芸術作品を保護し、キュレーションするのと同じです。好奇心は大きな動機です。結局のところ、今日の子供たちは古いGeocitiesのウェブページを想像することすらできません。一般的な好奇心に加えて、ウェブサイトを保存することで重要な情報を再確認することができます。

ウェブ上で見つけた情報を参照するのは非常に便利です。しかし、そのリンクが404エラーメッセージを指している場合はどうなるのでしょうか?2013年のハーバード大学の研究によると、米国の最高裁判所の決定で参照されたウェブサイトの49%が現在は行き止まりになっていることがわかりました。このような重要な情報がバーチャルな空間に消えてしまうのをどう防ぐことができるのでしょうか?

wayback-machine-404

幸いなことに、インターネットアーカイブの人々はウェブサイトをインデックス化し、アーカイブするツールを開発しました。彼らはそれをウェイバックマシンと呼び、2001年からウェブサイトをアーカイブしています。現在までに、ウェイバックマシンは3040億以上のウェブページを保存しています。

ウェブサイトをアーカイブしたい理由はいくつかあります。幸いなことに、ウェイバックマシンは非常に簡単に使えます。ウェイバックマシンを使用してウェブページをアーカイブする方法は以下の通りです。

どのサイトがカタログ化されているのか?

多くの人気ウェブサイトは、ウェイバックマシンによって自動的にアーカイブされます。しかし、ウェイバックマシンを使用してほぼすべてのページを手動でアーカイブすることもできます。ウェブサイトはしばしば放棄されたり、完全に変更されたりするため、ウェイバックマシンはウェブサイトのデジタル「ハードコピー」を保持することでインターネットの文化を保存する手段として機能します。テキストや画像はそのまま残されますが、一部の外部リンクや埋め込まれたアイテム(例:動画)は保存されないことに注意してください。

ウェイバックマシンは公開サイトのみをスキャンしてアーカイブすることに注意が必要です。これは、パスワードで保護されたサイトやプライベートサーバーにあるサイトはアーカイブできないことを意味します。また、ウェブサイトが検索エンジンにインデックスを含めることを禁止している場合、ウェイバックマシンはそれをアーカイブすることができません。

ウェイバックマシンの使い方

ウェブサイトをアーカイブするために使用できる方法は2つあります。幸いなことに、どちらも非常に簡単で、特別な知識は必要ありません。まず、ブラウザのアドレスバーでURLの前にカーソルを置きます。web.archive.org/save/と入力してEnterを押します。ウェイバックマシンがページを保存していることを知らせるダイアログボックスが画面に表示されるはずです。

wayback-machine-save-now

ウェブページをアーカイブする2つ目の方法は、ウェイバックマシンのアーカイブウェブサイトを使用することです。まず、保存したいウェブページに移動し、URLをコピーします。それが完了したら、ウェイバックマシンのアーカイブウェブサイトに移動します。このページの右側には「今すぐページを保存」という見出しがあります。保存したいウェブページのURLをテキストボックスに貼り付け、「ページを保存」ボタンをクリックします。

どちらの方法を使用しても、結果は同じです。ページの保存には時間がかかることがあるので、忍耐強く待ってください。

ウェイバックマシンのブラウザ拡張機能

ウェイバックマシンには、Google Chrome用の公式ブラウザ拡張機能もあります。ウェブページをアーカイブするのは非常に簡単です。保存したいページに移動し、ツールバーのウェイバックマシンのアイコンをクリックして「今すぐページを保存」をクリックするだけです。

wayback-machine-google-chrome

ページを保存するのをさらに簡単にするだけでなく、ブラウザ拡張機能にはもう一つの便利な機能があります。リンクをクリックしたときにあいまいな404エラーメッセージに直面したことはありませんか?それが研究論文の貴重な情報源であったり、本当に良いレシピであったりすると、非常にイライラします。ウェイバックマシンの拡張機能をインストールすると、そのイライラが安堵に変わるかもしれません。ブラウザが行き止まりに遭遇したとき、拡張機能はアーカイブを検索してウェイバックマシンに保存されたコピーがあるかどうかを確認します。もしあれば、そのページに訪問するかどうかを尋ねてきます。

Chromeを使用していない場合でも心配しないでください。Firefox用のウェイバックマシン拡張機能もありますが、まだ開発中です。また、Safariユーザー向けの拡張機能も開発予定です。

Archive-It

あなたやあなたの組織には、頻繁にインデックス化され、アーカイブされる必要があるウェブサイトがありますか?もしそうであれば、上記の方法を使用して各ウェブページを手動でアーカイブするのは非常に面倒でコストがかかる場合があります。幸いなことに、インターネットアーカイブは、アーカイブプロセスを自動化できる「Archive-It」というサービスを提供しています。

wayback-machine-archiveit

このサービスは無料ではありませんが、「設定して忘れる」メンタリティでコンテンツをバックアップしたい人には理想的です。保存したいページとその頻度を指定するだけです。この有料サブスクリプションは、定期的にウェブコンテンツを保存したい人に最適です。

あなたはウェイバックマシンを使用していますか?もしそうであれば、純粋に楽しむために訪れているのか、それとも便利なツールだと感じているのか教えてください。他にウェブ上のコンテンツをバックアップする方法はありますか?コメントで教えてください!