Интернет имеет свою историю. Это большой мир, населённый различными сайтами, которые, как и люди, рождаются, меняются в своём существовании, и умирают. Не хотелось бы называть уникальный ресурс web.archive.org кладбищем отживших своё сайтов. Назовём веб-архив хранителем истории, чем он по определению и является. Он хранит огромное число копий сайтов, когда-либо существовавших ранее. В этом его ценность и гениальность задумки.
Как попасть в веб-архив?
Любой сайт может оставить свой след на web.archive.org. Это происходит во время индексации. Поисковые боты пробегают по страницам сайта, собирая информацию о ресурсе. Степень индексации определяется главным файлом настроек сайта robot.txt. Если данный файл не содержит прямого запрета в виде «Disallow: /» на занесение данных в веб-архив, они рано или поздно туда попадут.
Возникает вопрос, для чего нужен веб архив, кроме тривиального любопытства и ностальгии. Об этом пойдёт речь в данном материале.
Ностальгия и любопытство
Не без этого. Не все сайты, ушедшие в историю, утратили свою актуальность, и не для всех. Есть множество ресурсов, попросту потерявших своих хозяев, то есть потерпевшие крах по причине прекращения финансирования и невозможности дальнейшего развития. Веб-архив хранит копии этих сайтов, позволяя просматривать их, черпая нужную информацию и получая удовольствие от привычного глазу интерфейса.
Восстановление сайта без резервного копирования
Всегда следует делать бекап своего сайта. Увы, многие забывают об этом важном правиле. Что делать, если по тем или иным причинам ресурс пришёл в негодность, не функционирует, утерян? А резервной копии попросту нет. Единственным решением станет использование веб-архива. Можно сделать перелинковку, скорректировав старые ссылки на веб-архив и создав новые для актуальности.
Уникальный контент
Веб-архив — настоящий кладезь для любителей позаимствовать информацию. Собственно, 80% интернета состоит из заимствований, если кто не знал. Главное то, что контент, хранящийся на web.archive.org, не сканируется сервисами, проверяющими уникальность. Это архивная информация, которая уже никому не принадлежит. Страницы не имеют значка копирайта ©, и не индексируются поисковыми системами. Следовательно, каждый может черпать сколь угодно информации, которая априори является уникальной.
Возвращение к жизни «мёртвых» ссылок
Большинство пользователей добавляют определённые ссылки в закладки браузера. Когда сайт прекращает существование, ссылка перестаёт работать. Исправить данное недоразумение можно при помощи веб-архива. Это особенно актуально, если искомый сайт почил уже очень давно, и ссылку нельзя вытащить через кэш поисковика.