Как использовать Wayback Machine для архивирования веб-сайтов

Мы воспринимаем Интернет и его богатство знаний как должное. Практически все доступно 24 часа в сутки, 7 дней в неделю одним нажатием кнопки. Так было — пока это не исчезнет. Веб-сайты могут исчезнуть без предупреждения, их контент навсегда потерян.
Важно архивировать контент, который появляется в Интернете, по различным причинам. Сохранение веб-сайтов — это способ сохранить человеческую культуру, так же как мы защищаем и курируем книги или произведения искусства. Любопытство — это большой стимул: в конце концов, дети сегодня не могут представить себе старую страницу Geocities в своих самых смелых мечтах. Помимо общего любопытства, сохранение веб-сайтов позволяет нам обращаться к важной информации.
Ссылаться на информацию, найденную в Интернете, очень удобно. Но что происходит, когда эта ссылка просто указывает на сообщение об ошибке 404? В 2013 году исследование Гарварда показало, что 49% веб-сайтов, на которые ссылаются в решениях Верховного суда США, теперь являются мертвыми концами. Как мы можем предотвратить исчезновение такой важной информации в виртуальном эфире?

К счастью, сотрудники Internet Archive разработали инструмент, который может индексировать и архивировать веб-сайты. Они называют его Wayback Machine, и он архивирует веб-сайты с 2001 года. На сегодняшний день Wayback Machine сохранила более 304 миллиардов веб-страниц.
Существует множество причин, по которым вы можете захотеть архивировать веб-сайт. К счастью, Wayback Machine делает это очень легко. Вот способы, которыми вы можете использовать Wayback Machine для всех ваших нужд в архивировании веб-страниц.
Какие сайты каталогизируются?
Многие популярные веб-сайты автоматически архивируются Wayback Machine. Тем не менее, вы можете использовать Wayback Machine для ручного архивирования практически любой страницы. Веб-сайты часто забрасываются или полностью изменяются, поэтому Wayback Machine служит способом сохранить культуру Интернета, сохраняя цифровую «печатную копию» веб-сайта. Имейте в виду, что текст и изображения остаются нетронутыми; однако некоторые исходящие ссылки и встроенные элементы (например, видео) могут отсутствовать.
Важно отметить, что Wayback Machine сканирует и архивирует только публичные сайты. Это означает, что защищенные паролем сайты или сайты, расположенные на частных серверах, не могут быть архивированы. Кроме того, если веб-сайт запрещает поисковым системам включать его в результаты поиска, Wayback Machine не сможет его архивировать.
Как использовать Wayback Machine
Существует два метода, которые вы можете использовать для начала архивирования веб-сайтов. К счастью, оба из них очень просты и не требуют специальных знаний. Начните с того, что поместите курсор перед URL в адресной строке вашего браузера. Введите web.archive.org/save/ и нажмите Enter. На экране должно появиться диалоговое окно, информирующее вас о том, что Wayback Machine сохраняет страницу.

Второй способ архивировать веб-страницу — использовать веб-сайт архива Wayback Machine. Сначала перейдите на веб-страницу, которую вы хотите сохранить, и скопируйте URL. После этого перейдите на веб-сайт архива Wayback Machine. Справа на этой странице вы увидите заголовок «Сохранить страницу сейчас». Вставьте URL веб-страницы, которую вы хотите сохранить, в текстовое поле и нажмите кнопку «Сохранить страницу».
Независимо от того, какой метод вы используете, результат будет одинаковым. Имейте в виду, что сохранение страницы может занять некоторое время, поэтому будьте терпеливы и дайте ей сделать свое дело.
Расширение браузера Wayback Machine
Wayback Machine также имеет официальное расширение для браузера Google Chrome. Использовать его для архивирования веб-страниц очень просто. Просто перейдите на страницу, которую вы хотите архивировать, нажмите на значок Wayback Machine на панели инструментов и нажмите «Сохранить страницу сейчас».

Кроме того, что это делает сохранение страниц еще проще, расширение браузера имеет еще один интересный трюк в рукаве. Вы когда-нибудь нажимали на ссылку и сталкивались с неопределенным сообщением об ошибке 404? Будь то ценный источник для вашей исследовательской работы или действительно хороший рецепт, это может быть невероятно разочаровывающим. С установленным расширением Wayback Machine это разочарование может превратиться в облегчение. Когда ваш браузер сталкивается с мертвым концом, расширение будет искать в архиве, есть ли сохраненная копия на Wayback Machine. Если да, оно спросит вас, хотите ли вы посетить эту страницу.
Если вы не используете Chrome, не переживайте. Существует расширение Wayback Machine для Firefox; однако оно все еще находится в процессе разработки. Кроме того, планируется разработать расширение для пользователей Safari.
Archive-It
У вас или вашей организации есть веб-сайт, который нужно индексировать и архивировать часто? Если да, то ручное архивирование каждой отдельной веб-страницы с использованием методов выше может быть невероятно утомительным и затратным. К счастью, Internet Archive предоставляет услугу под названием Archive-It, которая может автоматизировать процесс архивирования для вас.

Эта услуга не бесплатна; однако она может быть идеальной для тех, кто хочет резервировать свой контент с менталитетом «установи и забудь». Просто укажите, какие страницы вы хотите сохранить и как часто. Эта платная подписка идеально подходит для тех, кто хочет регулярно сохранять свой веб-контент.
Вы используете Wayback Machine? Если да, вы посещаете его исключительно ради удовольствия или находите его полезным инструментом? Есть ли другие способы резервного копирования контента в Интернете? Дайте нам знать в комментариях!