Что такое Вебархив и Как на нем заработать

Здравствуйте, уважаемые читатели!

Наверняка вы сталкивались с такой ситуацией, когда сайт, на который вы любили заходить, вдруг пропадал из интернета. Причин тому может быть масса. Самые распространенные: забыли продлить домен, забыли продлить хостинг, просто забросили сайт. В этом случае за несколько апдейтов поисковой выдачи все статьи вылетают из индекса, и ссылки на них становятся битыми.

Казалось бы, ничего не вернешь. А вот и нет. Существует ресурс, с помощью которого можно увидеть статьи давно не существующих сайтов. А если приложить немного усилий, то и заработать на этом. Интересно? Тогда читайте дальше.

b5-5

Что такое Вебархив.  

Если мне не изменяет память, то существует он с 1996-го года. Находится по адресу http://archive.org/web/ . Создатели ресурса поставили перед собой грандиозную задачу — заносить и вечно хранить на своих серверах все сайты, которые когда-либо были в интернете.

b4-4

Казалось бы, миссия не выполнима. Но проект постепенно раскрутился. Сейчас в его базах данных хранится информация о 279 миллиардах веб-страниц. Даже не пытайтесь себе представить такой число, это очень много. А недавно Вебархив получил статус библиотеки.

Принцип работы следующий. Робот архива медленно, но верно обходит всю мировую паутину и переносит в базу архива все, куда ему удалось забрести. Копирует не только текст, но и ссылки, а так же картинки.

Понятно, что мощностей у архива мало. Его бот может успеть не везде. Бывает так, что удается ему скопировать не все. А если в robots.txt какого-либо сайта прописан запрет на посещение, то бот вообще туда не сунется.

Но при всех этих недостатках Вебархив в настоящее время лучший способ посмотреть то, чего в сети уже нет.

Как работать с Вебархивом.  

Перейти на главную страницу архива можно по адресу, указанному выше. Попадете вы сюда. 

b1-1

В строку, указанную стрелкой, надо ввести адрес того сайта, который хотите посмотреть. После этого жмем кнопку Browse History. Я для примера ввожу домен 101postel.ru, вы можете любой другой.

Внимание, это важно. Имя домена того сайта, которого в поиске уже нет, но который вы хотите найти и посмотреть в Архиве, вы должны знать заранее. Сам Архив никаких подсказок подобного рода не дает.

Далее нам открывается календарь. 

b2-2

Мы видим, что есть копии этого сайта за 13, 14 и 16-й года. Если кликнуть по году, то внизу синими кружочками будут выделены даты посещения этого сайта роботом архива. В нашем случае первый визит состоялся 16 мая 2013-го года. По идее бот должен был скопировать все, что было на сайте до этого числа.

Кликаем по синему кружочку от 16 мая 2013-го года и видим, что на этом домене в то время был интернет-магазин постельного белья в Новокузнецке. Последний визит бота был 3 мая 2016-го года. Но мы видим, что на этом домене уже висел сайт «Диеты мира».

Кстати, таким образом можно проверить историю домена.

Как заработать на Вебархиве.  

Перейдем теперь к звонкой монете. По сути мы нашли целый сайт «Диеты мира», часть статей которого полностью открывается, доступно для чтения и копирования. Эти статьи давно выпали из индекса, что легко проверяется сервисами антиплагиата.

Копируем статью, вставляем ее в ETXT-антиплагиат (можете в любой другой), проверяем на уникальность. Дело в том, что не мы одни такие умные. Большинство годных статей из вебархива давно растащено по другим сайтам. Но иногда попадаются уникальные.

Я для примера скопирую и проверю самую первую статью на сайте. 

b3-3

Как и следовало ожидать, далеко не уник. Но если степень уникальности около 50%, то текст легко переработать прямо в окошке сервиса антиплагиата, где кем-то ранее скопированные куски подсвечиваются.

При должной усидчивости, перебирая сайт за сайтом, статью за статьей, можно набрать достаточное количество качественных текстов.

Встает вопрос, что с ними делать? Есть маленькая тонкость, которую многие упускают из вида. Даже если сайт вместе со всеми статьями давно вылетел из поиска, и все сервисы антиплагиата показывают 100% уникальности, все равно поисковики помнят, что ранее эти тексты уже были проиндексированы. Более подробно я писал об этом вот в этой статье. Все эти тексты уникальные, но не оригинальные. На своем сайте, если у вас СДЛ и вы им дорожите, использование таких статей чревато санкциями.

b6-6

Но ведь у нас до сих пор пачками клепают ГС и наполняют их, покупая статьи на биржах. Вот туда и отправляйте на реализацию тексты из Вебархива. При должном упорстве на этом можно не плохо заработать.

Список доменов, которые скоро освобождаются, можно найти на биржах, торгующих сайтами и доменами, да хоть на той же Телдери. Как домены освободятся, следите за их судьбой, скорее всего большинство продлят. Но всегда будут и заброшенные. Сайты, которые на них были, ищите в Вебархиве и работайте по схеме, описанной выше.

Как вариант, ищите сайты под АГС. Статьи с таких сайтов будут быстро выпадать из индекса. Ваша задача успеть их перехватить.

Еще вариант искать в сети списки доменов, на которых когда-то были сайты. Мне повезло, подвернулся список почти из тысячи доменов. Лопатить, не перелопатить. Ковыряйте интернет, повезет и вам. Даже если на таких доменах сейчас сайты, все равно проверьте по Вебархиву. Когда-то давно на них могли быть совсем другие сайты с другими статьями.

Заключение.  

На этом заканчиваю. Не обессудьте, что не все изложил подробно. Я описал только саму идею и общие пути ее реализации. Все остальное за вами.

Желаю успехов в работе с Вебархивом.

С уважением, Владислав Заболотный.

Поделитесь статьей в соцсетях.

Комментарии (6) на “Что такое Вебархив и Как на нем заработать”

  • Владислав, я проверяла на этом сервисе свой домен. Оказалось, что уже был такой сайт зарегистрирован в 2011 и исчез из поиска в 2013. Вроде бы санкций не было, но не знаю, что делать. Уже поздно что-то менять.

    Поздравляю Вас с наступающим Новым годом! Здоровья, счастья и творческих успехов!

    • Владислав Заболотный:

      Тут трудно что-то посоветовать наверняка. Вас тоже с наступившим уже Новым Годом. Здоровья, удачи, благополучия.

  • В далеком 2011 начинала блоггинг вместе с замечательной девушкой Юлией. Её блог был посвящен психологии подростков. Тогда мой сынок был мал и я просто читала статьи, но теперь сын подрос и встали вопросы, которые Юлия освящала очень правильно. но увы, блог был заброшен в 2013, статей нет и в помине, зато на вебархиве я все нашла и смогла прочитать. Это классно очень!

    • Владислав Заболотный:

      Можно проверить. Чаще всего статьи растаскиваются по другим блогам.

  • Не знала о таком архиве,благодарю за ценные подсказки,Владислав.Тут конечно большое поле для деятельности,если есть время покопаться и отслеживать.

    • Владислав Заболотный:

      Находите в интернете какую-нибудь базу доменов с историей и прогоняете ее по вебархиву. Вполне реально найти интересные тексты, еще не растащенные по другим сайтам.

Оставить комментарий

Свежие комментарии
Хотите зарабатывать?