ЗМІСТ
Інтернет вже давно став неймовірно великим сховищем різноманітної інформації. Але він також виявився дуже мінливим середовищем, якому помітно не вистачає сталості. Саме тому було створено веб-архів.
Ресурс добре відомий як корисний інструмент, щоб переглянути, як веб-сайти виглядали в минулому. Адже так цікаво побачити зміни ваших улюблених сайтів. Але веб-архів також є досить корисним інструментом для SEO. І саме з нього розпочинається вивчення історії сайту.
Історія виникнення
Бібліотеки та архіви світу доклали великих зусиль для збирання та збереження друкованих матеріалів. Але поява Інтернету була настільки раптовою і створила новий набір проблем для каталогізації, зберігання та пошуку, що кілька бібліотек активно почали збирати копії веб-сторінок.
Alexa Internet Брюстера Кале та її дочірня компанія Internet Archive виконали величезну роботу зі збору інформації. Починаючи з 1996 року, в Інтернет-архіві зберігаються веб-сторінки, включаючи графічні файли, із загальнодоступних веб-сайтів, просканованих Alexa. Із запуском Wayback Machine у жовтні 2001 року цей величезний архів тепер перебуває у вільному доступі для громадськості.
Що таке архів веб-сайту?
Wayback Machine є найпопулярнішим і наймасштабнішим сервісом для перегляду архіву веб-сайту. Моментальні знімки можна використовувати для порівняння версій домену в різних часових рамках.
Часто веб-майстри використовують цей сервіс у таких випадках:
- перед покупкою домену, щоб переглянути тематику, наявність/відсутність реклами, вихідних посилань;
- при аналізі конкурентів, щоб переглянути історію змін на їх сайтах, помилки або навпаки фішки, які були використані;
- щоб переглянути вміст сторінки, якщо вона тимчасово недоступна;
- для пошуку унікального контенту;
- для поновлення сайту, якщо забули зробити резервну копію;
- при пошуку доменів, які можна купити.
А також, за допомогою Wayback Machine можна:
- Переглянути історію змін структури сайту – веб-архів може показати, як виглядала попередня ієрархія сайту. Якщо подивитися на те, як сайт був організований у минулому, можна буде сказати, які сторінки нещодавно були об’єднані в категорії або розширені на окремі сторінки.
- Вивчити Robots.txt – веб-архів індексує практично все, що знаходить на сайті, включаючи файли robots.txt. Це чудово, тому що, якщо сайт має технічні проблеми або проблеми зі скануванням, то можна знайти дату або діапазон, коли в robots.txt були внесені зміни, що викликали ці проблеми. Все, що потрібно зробити, це пошукати у веб-архіві файл robots.txt сайту та порівнювати моментальні знімки у момент виникнення проблеми.
- Перевірити наявність та зміни коду аналітики. Веб-архів також індексує вихідний код сторінок, тому можна переглядати та витягувати старий код з попередніх сторінок. Це зручно для перегляду минулого розміщення коду аналітики та використання на сайті, якщо помічені незвичайні дані облікового запису аналітики. Просто знайдіть URL-адресу сторінки у веб-архіві, виберіть дату і знімок, який ви шукаєте, і клацніть правою кнопкою миші, щоб переглянути джерело сторінки з цієї дати. Потім можна перевірити, де було розміщено код аналітики, щоб переконатися, що теги було реалізовано правильно.
Найкращі сервіси для перегляду історії сайтів
Ось ретельно підібраний список найкращих сервісів, здатних надати вам архів веб-сайтів. З їх допомогою можна дізнатися вміст сторінок сайтів, що вас цікавлять. У цій добірці ми вказали загальнодоступні та безкоштовні версії.
Wayback Machine
Wayback Machine – перший у своєму роді інструмент, який став еталоном для інших сервісів архівування.
Ймовірно, він буде першим, яким ви скористаєтеся для перегляду архіву веб-сайту. Він також має багато способів створювати і завантажувати архіви, і навіть є спеціальний API для розширення його функціональності. Сервіс дозволяє архівувати на стороні сервера.
Wayback Machine сканує лише загальнодоступні веб-сторінки і не може отримати доступ до контенту, захищеного паролем або на приватному сервері. Він також не сканує сайти, які забороняють пошукові системи сканувати їх.
Тому цей сервіс не зможе зберегти всі можливості вашого сайту. Однак він вважається галузевим стандартом для вебмайстрів і абсолютно безкоштовний.
Станом на квітень 2021 року в Інтернет-архіві зберігається понад 30 мільйонів книг та текстів, 8,9 мільйона фільмів, відео та телешоу, 649 000 програм, 13 225 000 аудіофайлів, 3,8 мільйона зображень та 580 мільярдів веб-сторінок у Wayback Machine.
Для того, щоб переглянути історію сайту, потрібно зайти за адресою https://web.archive.org/ і ввести у форму пошуку потрібну URL-адресу. Це можливо як на мобільних, так і версіях для ПК.
На сторінці відображатимуться графік збереження та календар із зазначеними датами сканування. За замовчуванням рік вибрано актуальний на момент пошуку.
Насамперед обираємо рік на графіку. Далі знаходимо потрібний місяць та дату в календарі.
У спливаючому вікні відображається кількість знімків, зроблених цього дня, та доступні таймкоди-гіперпосилання, натиснувши на які можна перейти на архівовані версії сторінки.
На заархівованій сторінці можна також перемикатися на інші дати, використовуючи стрілки “вправо” або “вліво”, а також графік для швидкого перемикання між роками.
Wayback Machine дозволяє переглянути відразу всі архівовані сторінки проекту. Для цього потрібно написати в адресному рядку браузера: https://web.archive.org/web/*/[domain]/*, додавши потрібний домен. Наприклад: https://web.archive.org/web/*/apollon.guru/*
Перейшовши за цим посиланням, ви побачите дані по всіх сторінках сайту або розділу, які присутні в web.archive.org.
Як заархівувати сторінки сайту у Wayback Machine
Сервіс Wayback Machine автоматично сканує сторінки в Інтернеті та додає їх до свого архіву. Однак, існує кілька способів, які дозволяють гарантовано зберегти окремі сторінки або цілі веб-сайти.
1. Зберегти окрему сторінку
Поміщаємо URL у форму “Save Page Now” та зберігаємо сторінку. Відразу буде доступна постійна URL-адреса архіву для сторінки. Однак варто звернути увагу на те, що цей метод зберігає лише одну сторінку, а не весь сайт.
2. Збереження за допомогою розширення у браузері
Встановити розширення Wayback Machine Chrome у свій браузер. Перейти на сторінку, яку потрібно заархівувати, клацнути значок на панелі інструментів і вибрати Save Page Now. Сторінка збережеться та сервіс видасть постійну URL-адресу.
3. Букмарклет Wikipedia JavaScript
Букмарклет – це кнопка в один клік у браузері, який зберігається як закладки, але використовує Javascript для виконання певних дій. Збережіть наступний код у закладці на панелі інструментів вашого браузера з таким ім’ям, як: Wayback Save. Він дозволить заархівувати сторінку вручну.
javascript : void ( window . open ( ‘https://web.archive.org/save/’ + location . href ));
4. Стати волонтером у команді Archive Team
Archive Team – це команда однодумців, які створили сайт для використання як пункт розвантаження та сховища інформації для низки архівних проектів, пов’язаних із збереженням веб-сайтів або даних, які можуть бути втрачені.
5. Зареєструвати обліковий запис Archive-It
Цей сервіс передплати надається Internet Archive і дозволяє архівувати власні проекти без будь-яких технічних знань.
Як виключити свій сайт з Wayback Machine
Причин цього може бути кілька:
- продаж або купівля домену;
- на сайті є приватна інформація, яку ви хочете приховати від інших;
- просто не бажаєте, щоб хтось бачив попередні версії вашого сайту.
У такому разі потрібно виконати одну основну дію:
Написати листа з темою: “DMCA takedown notice”, на пошту info@archive.org. Воно має бути написане у ввічливій формі з проханням видалити історію вашого домену. Також у ньому потрібно вказати посилання на часові рамки у веб-архіві, точну адресу домену, номер телефону та адресу електронної пошти.
Для правильного заповнення форми ви можете скористатися спеціальним генератором: https://iphqs.com/dmca-takedown-notice-generator/.
Archive.ph
Archive.ph багато в чому схожий на Wayback Machine – аж до дуже схожого дизайну. Його сервери даних розташовані у Європі.
Archive.ph підходить до архівування інакше, ніж Wayback Machine, оскільки не базується на роботі пошукових роботів в Інтернеті. Натомість вебмайстра відправляють URL-адреси та погоджується на включення їх до архіву. Крім того, його список функцій більш простий, ніж інші рішення. Наприклад, немає надійної політики видалення, а процес архівування виключає певні типи мультимедіа та файлів.
На відміну від Wayback Machine, Archive.ph підтримує сайти з великою кількістю Javascript, сайти з візуальним оформленням та навіть веб-програми. Це означає, що у вас буде вся інформація практично про будь-який веб-сайт, для якого ви її використовуєте.
На сайті https://archive.ph знаходимо поле “Шукати збережені сторінки” та вводимо в ньому адресу веб-сайту, історію якого потрібно переглянути. На екрані видачі буде розміщено всі версії сторінки, які були збережені раніше.
Memento Time Travel
Інструмент архіву Time Travel дозволяє вам “подорожувати в часі”, щоб побачити, як веб-сайт виглядав у певний час. Це рішення створене за допомогою API Archive.ph, просте, функціональне і може використовуватися як удосконалений продукт для архівування в Інтернеті.
На відміну від Wayback Machine, Time Travel дозволяє переглядати веб-сторінки зі складною візуалізацією. Таким чином, якщо ви шукаєте рішення для отримання доступу до заархівованих сайтів з компонентами таблиць стилів та зображень, Time Travel буде хорошим вибором.
На головній сторінці http://timetravel.mementoweb.org потрібно вставити адресу веб-сайту у відповідне поле. Далі вибрати потрібну дату і натиснути кнопку “Find”. Memento Time Travel просканує та видасть вам усі можливі варіанти веб-архівів, які були зроблені якомога ближче до потрібної дати
Аналіз посилкової маси
Ще одним способом визначення історії сайту є аналіз зворотних посилань.
Аналіз зворотних посилань – це ретельна оцінка кількості та якості веб-сайтів, які посилаються на ваш домен. При аналізі враховується не тільки кількість зворотних посилань, що ведуть на вашу сторінку, але й анкорний текст та їх релевантність. Завдяки анкорам можна припустити вміст сторінок сайту, що аналізується.
Google використовує анкорні тексти, щоб визначити, з якою темою пов’язана веб-сторінка. Аналіз анкорів може бути виконаний для веб-сайту перед його покупкою для того, щоб визначити яку тематику він відповідав раніше.
На щастя вам не потрібно шукати їх вручну. Є безліч інструментів, орієнтованих виконання цього завдання.
Представляємо вам деякі з найпопулярніших на ринку:
Ahrefs
На головній сторінці сервісу вибираємо пункт меню = Site Explorer (Сайт Експлорер), вводимо адресу сайту у відповідне поле та натискаємо кнопку пошуку.
Після того, як Ahrefs просканував URL, на боковій панелі зліва потрібно вибрати пункт “Анкори”. Ви можете скористатися різними варіантами сортування.
SEMrush
На головній сторінці сервісу вводимо адресу домену та натискаємо “Почати”. Потрапляємо на сторінку Domain Overview Tool.
Тут вибираємо пункт меню Backlinks, де представлені різні показники сайту, у тому числі і список Top Anchors. Далі потрібно перейти кнопкою View Details.
Під нею знаходиться розширене вікно Backlink Analytics з повним списком анкорних текстів та сортуванням за різними фільтрами.
Serpstat
Для того, щоб переглянути список анкорів у цьому сервісі, потрібно перейти на сторінку: https://serpstat.com/ та ввести адресу домену або URL конкретної сторінки у відповідному полі.
Далі переходимо у вікно Backlink Dashboard і вибираємо пункт Anchors у лівому сайдбарі, де будуть представлені 20 анкорних текстів у сортуванні: від найменш популярних.
Проаналізувавши анкорні тексти, ви зможете ухвалити остаточне рішення про доцільність покупки сайту та цінність цих посилань для вашого проекту.
Аналіз змін DNS
За допомогою сервісу CompleteDNS можна відстежити детальну історію домену. Перейшовши у відповідний розділ і слідуючи підказкам на сайті, можна простежити випадання доменів і зміну dns. Сервіс зберігає докладну інформацію про кожну зміну протягом більше 14 років, що дозволяє розуміти, коли аналізувати ті чи інші зміни.
FAQ
Як переглянути архів сайту в Google?
Перед тим як показувати веб-сторінку в результатах пошуку, пошукові системи потрібно її проіндексувати. Google Cache містить знімок HTML-коду, який було отримано від вашого сервера за допомогою Googlebot. Потім цей код обробляється вашим браузером. То як же подивитися стару версію сайту в Google?Все дуже просто. Беремо адресу сайту, який вас цікавить та вставляємо в поле пошуку Google. Прогортаємо до потрібного результату пошуку та натискаємо на стрілку “вниз” поруч із URL сторінки. Далі натискаємо “Збережена копія” у контекстному меню.
Після того, як сторінка завантажиться, ви побачите на екрані дату та час кешування, а також нагадування про те, що поточна сторінка могла бути змінена за цей час. Ви можете скористатися копією з кеша Google, якщо потрібна сторінка завантажується надто довго або взагалі не завантажується.
Існує інший зручний спосіб перегляду кешованої копії веб-сторінки.
Відкрийте браузер. Напишіть “cache:” в адресному рядку, а потім введіть потрібну адресу веб-сайту. Результат пошуку буде схожий на кешовану версію, яку ви могли побачити в описаному нижче методі.
Як перевірити історію домену Whois?
Веб-сайт Whois допоможе вам отримати цінну інформацію про власника веб-сайту. Там ви зможете дізнатися дату реєстрації домену, відомості про хостинг та історію IP-адрес.
Переваги сервісу Whois виявляються в інших випадках, під які не підходить Wayback Machine. Наприклад, він робить точний знімок того, як саме виглядає головна сторінка сайту безпосередньо перед виконанням оновлень. Wayback Machine навряд чи може показати це відвідувачам, натомість він представляє фактичний зміст веб-сторінки.
Як заархівувати свій сайт?
Як відновити сайт із веб-архіву?
На завершення
Щоб визначити всі зміни, що відбувалися з сайтом у минулому, необхідно опрацювати наступні напрямки:
- перегляд вмісту сторінок сайту сервісами Wayback Machine або подібними системами;
- аналіз анкорів зовнішніх посилань;
- аудит змін DNS.
Використовуючи ці напрямки, можна дізнатися всю історію сайту з моменту його створення до поточного дня. З огляду на ці дані можна вибудовувати подальшу стратегію роботи з сайтом.