Як дізнатися історію сайту?

Як дізнатися історію сайту?

Інтернет вже давно став неймовірно великим сховищем різноманітної інформації. Але він також виявився дуже мінливим середовищем, якому помітно не вистачає сталості. Саме тому було створено веб-архів.

Ресурс добре відомий як корисний інструмент, щоб переглянути, як веб-сайти виглядали в минулому. Адже так цікаво побачити зміни ваших улюблених сайтів. Але веб-архів також є досить корисним інструментом для SEO. І саме з нього розпочинається вивчення історії сайту.

Історія виникнення

Бібліотеки та архіви світу доклали великих зусиль для збирання та збереження друкованих матеріалів. Але поява Інтернету була настільки раптовою і створила новий набір проблем для каталогізації, зберігання та пошуку, що кілька бібліотек активно почали збирати копії веб-сторінок.

Alexa Internet Брюстера Кале та її дочірня компанія Internet Archive виконали величезну роботу зі збору інформації. Починаючи з 1996 року, в Інтернет-архіві зберігаються веб-сторінки, включаючи графічні файли, із загальнодоступних веб-сайтів, просканованих Alexa. Із запуском Wayback Machine у жовтні 2001 року цей величезний архів тепер перебуває у вільному доступі для громадськості.

Що таке архів веб-сайту?

Wayback Machine є найпопулярнішим і наймасштабнішим сервісом для перегляду архіву веб-сайту. Моментальні знімки можна використовувати для порівняння версій домену в різних часових рамках.

Календар веб-архіву

Календар веб-архіву

Часто веб-майстри використовують цей сервіс у таких випадках:

  • перед покупкою домену, щоб переглянути тематику, наявність/відсутність реклами, вихідних посилань;
  • при аналізі конкурентів, щоб переглянути історію змін на їх сайтах, помилки або навпаки фішки, які були використані;
  • щоб переглянути вміст сторінки, якщо вона тимчасово недоступна;
  • для пошуку унікального контенту;
  • для поновлення сайту, якщо забули зробити резервну копію;
  • при пошуку доменів, які можна купити.

А також, за допомогою Wayback Machine можна:

  1. Переглянути історію змін структури сайту – веб-архів може показати, як виглядала попередня ієрархія сайту. Якщо подивитися на те, як сайт був організований у минулому, можна буде сказати, які сторінки нещодавно були об’єднані в категорії або розширені на окремі сторінки.

Версія сайту від 9 січня 2016 року

Версія сайту від 9 січня 2016 року

Версія сайту від 6 липня 2017 року

Версія сайту від 6 липня 2017 року
  1. Вивчити Robots.txt – веб-архів індексує практично все, що знаходить на сайті, включаючи файли robots.txt. Це чудово, тому що, якщо сайт має технічні проблеми або проблеми зі скануванням, то можна знайти дату або діапазон, коли в robots.txt були внесені зміни, що викликали ці проблеми. Все, що потрібно зробити, це пошукати у веб-архіві файл robots.txt сайту та порівнювати моментальні знімки у момент виникнення проблеми.

Robots.txt у веб-архіві

Robots.txt у веб-архіві
  1. Перевірити наявність та зміни коду аналітики. Веб-архів також індексує вихідний код сторінок, тому можна переглядати та витягувати старий код з попередніх сторінок. Це зручно для перегляду минулого розміщення коду аналітики та використання на сайті, якщо помічені незвичайні дані облікового запису аналітики. Просто знайдіть URL-адресу сторінки у веб-архіві, виберіть дату і знімок, який ви шукаєте, і клацніть правою кнопкою миші, щоб переглянути джерело сторінки з цієї дати. Потім можна перевірити, де було розміщено код аналітики, щоб переконатися, що теги було реалізовано правильно.

Код сторінки у веб-архіві

Код сторінки у веб-архіві

Найкращі сервіси для перегляду історії сайтів

Ось ретельно підібраний список найкращих сервісів, здатних надати вам архів веб-сайтів. З їх допомогою можна дізнатися вміст сторінок сайтів, що вас цікавлять. У цій добірці ми вказали загальнодоступні та безкоштовні версії.

Wayback Machine

Головна сторінка сайту веб-архіву

Головна сторінка сайту веб-архіву

Wayback Machine – перший у своєму роді інструмент, який став еталоном для інших сервісів архівування.

Ймовірно, він буде першим, яким ви скористаєтеся для перегляду архіву веб-сайту. Він також має багато способів створювати і завантажувати архіви, і навіть є спеціальний API для розширення його функціональності. Сервіс дозволяє архівувати на стороні сервера.

Wayback Machine сканує лише загальнодоступні веб-сторінки і не може отримати доступ до контенту, захищеного паролем або на приватному сервері. Він також не сканує сайти, які забороняють пошукові системи сканувати їх.

Тому цей сервіс не зможе зберегти всі можливості вашого сайту. Однак він вважається галузевим стандартом для вебмайстрів і абсолютно безкоштовний.

Станом на квітень 2021 року в Інтернет-архіві зберігається понад 30 мільйонів книг та текстів, 8,9 мільйона фільмів, відео та телешоу, 649 000 програм, 13 225 000 аудіофайлів, 3,8 мільйона зображень та 580 мільярдів веб-сторінок у Wayback Machine.

Для того, щоб переглянути історію сайту, потрібно зайти за адресою https://web.archive.org/ і ввести у форму пошуку потрібну URL-адресу. Це можливо як на мобільних, так і версіях для ПК.

Поле пошуку на сайті веб-архіву

Поле пошуку на сайті веб-архіву

На сторінці відображатимуться графік збереження та календар із зазначеними датами сканування. За замовчуванням рік вибрано актуальний на момент пошуку.

Графік та календар на сайті веб-архіву

Графік та календар на сайті веб-архіву

Насамперед обираємо рік на графіку. Далі знаходимо потрібний місяць та дату в календарі.

Вибір дати на сайті веб-архіву

Вибір дати на сайті веб-архіву

У спливаючому вікні відображається кількість знімків, зроблених цього дня, та доступні таймкоди-гіперпосилання, натиснувши на які можна перейти на архівовані версії сторінки.

Таймкоди на календарі веб-архіву

Таймкоди на календарі веб-архіву

На заархівованій сторінці можна також перемикатися на інші дати, використовуючи стрілки “вправо” або “вліво”, а також графік для швидкого перемикання між роками.

Переключення між роками у веб-архіві

Переключення між роками у веб-архіві

Wayback Machine дозволяє переглянути відразу всі архівовані сторінки проекту. Для цього потрібно написати в адресному рядку браузера: https://web.archive.org/web/*/[domain]/*, додавши потрібний домен. Наприклад: https://web.archive.org/web/*/apollon.guru/*

Перейшовши за цим посиланням, ви побачите дані по всіх сторінках сайту або розділу, які присутні в web.archive.org.

Список посилань на сайті веб-архіву

Список посилань на сайті веб-архіву

Як заархівувати сторінки сайту у Wayback Machine

Сервіс Wayback Machine автоматично сканує сторінки в Інтернеті та додає їх до свого архіву. Однак, існує кілька способів, які дозволяють гарантовано зберегти окремі сторінки або цілі веб-сайти.

1. Зберегти окрему сторінку

Поміщаємо URL у форму “Save Page Now” та зберігаємо сторінку. Відразу буде доступна постійна URL-адреса архіву для сторінки. Однак варто звернути увагу на те, що цей метод зберігає лише одну сторінку, а не весь сайт.

Вікно Save Page Now

Вікно Save Page Now
2. Збереження за допомогою розширення у браузері

Встановити розширення Wayback Machine Chrome у свій браузер. Перейти на сторінку, яку потрібно заархівувати, клацнути значок на панелі інструментів і вибрати Save Page Now. Сторінка збережеться та сервіс видасть постійну URL-адресу.

Розширення Wayback Machine Chrome

Розширення Wayback Machine Chrome
3. Букмарклет Wikipedia JavaScript

Букмарклет – це кнопка в один клік у браузері, який зберігається як закладки, але використовує Javascript для виконання певних дій. Збережіть наступний код у закладці на панелі інструментів вашого браузера з таким ім’ям, як: Wayback Save. Він дозволить заархівувати сторінку вручну.

javascript : void ( window . open ( ‘https://web.archive.org/save/’ + location . href ));

Букмарклет Wikipedia JavaScript

Букмарклет Wikipedia JavaScript
4. Стати волонтером у команді Archive Team

Archive Team – це команда однодумців, які створили сайт для використання як пункт розвантаження та сховища інформації для низки архівних проектів, пов’язаних із збереженням веб-сайтів або даних, які можуть бути втрачені.

Сайт команди Archive Team

Сайт команди Archive Team
5. Зареєструвати обліковий запис Archive-It

Цей сервіс передплати надається Internet Archive і дозволяє архівувати власні проекти без будь-яких технічних знань.

Головна сторінка сайту Archive-It

Головна сторінка сайту Archive-It

Як виключити свій сайт з Wayback Machine

Причин цього може бути кілька:

  • продаж або купівля домену;
  • на сайті є приватна інформація, яку ви хочете приховати від інших;
  • просто не бажаєте, щоб хтось бачив попередні версії вашого сайту.

У такому разі потрібно виконати одну основну дію:

Написати листа з темою: “DMCA takedown notice”, на пошту info@archive.org. Воно має бути написане у ввічливій формі з проханням видалити історію вашого домену. Також у ньому потрібно вказати посилання на часові рамки у веб-архіві, точну адресу домену, номер телефону та адресу електронної пошти.

Для правильного заповнення форми ви можете скористатися спеціальним генератором: https://iphqs.com/dmca-takedown-notice-generator/.

Головна сторінка сайту з генератором листів

Головна сторінка сайту з генератором листів

Archive.ph

Archive.ph багато в чому схожий на Wayback Machine – аж до дуже схожого дизайну. Його сервери даних розташовані у Європі.

Archive.ph підходить до архівування інакше, ніж Wayback Machine, оскільки не базується на роботі пошукових роботів в Інтернеті. Натомість вебмайстра відправляють URL-адреси та погоджується на включення їх до архіву. Крім того, його список функцій більш простий, ніж інші рішення. Наприклад, немає надійної політики видалення, а процес архівування виключає певні типи мультимедіа та файлів.

На відміну від Wayback Machine, Archive.ph підтримує сайти з великою кількістю Javascript, сайти з візуальним оформленням та навіть веб-програми. Це означає, що у вас буде вся інформація практично про будь-який веб-сайт, для якого ви її використовуєте.

Головна сторінка сайту Archive.ph

Головна сторінка сайту Archive.ph

На сайті https://archive.ph знаходимо поле “Шукати збережені сторінки” та вводимо в ньому адресу веб-сайту, історію якого потрібно переглянути. На екрані видачі буде розміщено всі версії сторінки, які були збережені раніше.

Memento Time Travel

Головна сторінка сайту Time Travel

Головна сторінка сайту Time Travel

Інструмент архіву Time Travel дозволяє вам “подорожувати в часі”, щоб побачити, як веб-сайт виглядав у певний час. Це рішення створене за допомогою API Archive.ph, просте, функціональне і може використовуватися як удосконалений продукт для архівування в Інтернеті.

На відміну від Wayback Machine, Time Travel дозволяє переглядати веб-сторінки зі складною візуалізацією. Таким чином, якщо ви шукаєте рішення для отримання доступу до заархівованих сайтів з компонентами таблиць стилів та зображень, Time Travel буде хорошим вибором.

Видача результатів на сайті Time Travel

Видача результатів на сайті Time Travel

На головній сторінці http://timetravel.mementoweb.org потрібно вставити адресу веб-сайту у відповідне поле. Далі вибрати потрібну дату і натиснути кнопку “Find”. Memento Time Travel просканує та видасть вам усі можливі варіанти веб-архівів, які були зроблені якомога ближче до потрібної дати

Аналіз посилкової маси

Ще одним способом визначення історії сайту є аналіз зворотних посилань.

Аналіз зворотних посилань – це ретельна оцінка кількості та якості веб-сайтів, які посилаються на ваш домен. При аналізі враховується не тільки кількість зворотних посилань, що ведуть на вашу сторінку, але й анкорний текст та їх релевантність. Завдяки анкорам можна припустити вміст сторінок сайту, що аналізується.

Аналіз зворотних посилань

Аналіз зворотних посилань

Google використовує анкорні тексти, щоб визначити, з якою темою пов’язана веб-сторінка. Аналіз анкорів може бути виконаний для веб-сайту перед його покупкою для того, щоб визначити яку тематику він відповідав раніше.

На щастя вам не потрібно шукати їх вручну. Є безліч інструментів, орієнтованих виконання цього завдання.

Представляємо вам деякі з найпопулярніших на ринку:

Ahrefs

На головній сторінці сервісу вибираємо пункт меню = Site Explorer (Сайт Експлорер), вводимо адресу сайту у відповідне поле та натискаємо кнопку пошуку.

Головна сторінка сайту Ahrefs

Головна сторінка сайту Ahrefs

Після того, як Ahrefs просканував URL, на боковій панелі зліва потрібно вибрати пункт “Анкори”. Ви можете скористатися різними варіантами сортування.

Вікно з анкорами на сайті Ahrefs

Вікно з анкорами на сайті Ahrefs

SEMrush

Головна сторінка сайту SEMrush

Головна сторінка сайту SEMrush

На головній сторінці сервісу вводимо адресу домену та натискаємо “Почати”. Потрапляємо на сторінку Domain Overview Tool.

Domain Overview Tool на сайті SEMrush

Domain Overview Tool на сайті SEMrush

Тут вибираємо пункт меню Backlinks, де представлені різні показники сайту, у тому числі і список Top Anchors. Далі потрібно перейти кнопкою View Details.

Вікно Backlink Analytics на сайті SEMrush

Вікно Backlink Analytics на сайті SEMrush

Під нею знаходиться розширене вікно Backlink Analytics з повним списком анкорних текстів та сортуванням за різними фільтрами.

Serpstat

Для того, щоб переглянути список анкорів у цьому сервісі, потрібно перейти на сторінку: https://serpstat.com/ та ввести адресу домену або URL конкретної сторінки у відповідному полі.

Головна сторінка на сайті Serpstat

Головна сторінка на сайті Serpstat

Далі переходимо у вікно Backlink Dashboard і вибираємо пункт Anchors у лівому сайдбарі, де будуть представлені 20 анкорних текстів у сортуванні: від найменш популярних.

Вікно Backlink Anchors на сайті Serpstat

Вікно Backlink Anchors на сайті Serpstat

Проаналізувавши анкорні тексти, ви зможете ухвалити остаточне рішення про доцільність покупки сайту та цінність цих посилань для вашого проекту.

Аналіз змін DNS

За допомогою сервісу CompleteDNS можна відстежити детальну історію домену. Перейшовши у відповідний розділ і слідуючи підказкам на сайті, можна простежити випадання доменів і зміну dns. Сервіс зберігає докладну інформацію про кожну зміну протягом більше 14 років, що дозволяє розуміти, коли аналізувати ті чи інші зміни.

Вікно Domain History на сайті CompleteDNS

Вікно Domain History на сайті CompleteDNS

FAQ

Як переглянути архів сайту в Google?

Перед тим як показувати веб-сторінку в результатах пошуку, пошукові системи потрібно її проіндексувати. Google Cache містить знімок HTML-коду, який було отримано від вашого сервера за допомогою Googlebot. Потім цей код обробляється вашим браузером. То як же подивитися стару версію сайту в Google?Все дуже просто. Беремо адресу сайту, який вас цікавить та вставляємо в поле пошуку Google. Прогортаємо до потрібного результату пошуку та натискаємо на стрілку “вниз” поруч із URL сторінки. Далі натискаємо “Збережена копія” у контекстному меню.

Вікно пошуку в Google

Вікно пошуку в Google

Після того, як сторінка завантажиться, ви побачите на екрані дату та час кешування, а також нагадування про те, що поточна сторінка могла бути змінена за цей час. Ви можете скористатися копією з кеша Google, якщо потрібна сторінка завантажується надто довго або взагалі не завантажується.

Копія веб-сайту з кешу Google

Копія веб-сайту з кешу Google

Існує інший зручний спосіб перегляду кешованої копії веб-сторінки.

Відкрийте браузер. Напишіть “cache:” в адресному рядку, а потім введіть потрібну адресу веб-сайту. Результат пошуку буде схожий на кешовану версію, яку ви могли побачити в описаному нижче методі.

Оператор cache: у Google

Оператор cache: у Google

Як перевірити історію домену Whois?

Головна сторінка сайту Whois

Головна сторінка сайту Whois

Веб-сайт Whois допоможе вам отримати цінну інформацію про власника веб-сайту. Там ви зможете дізнатися дату реєстрації домену, відомості про хостинг та історію IP-адрес.

Переваги сервісу Whois виявляються в інших випадках, під які не підходить Wayback Machine. Наприклад, він робить точний знімок того, як саме виглядає головна сторінка сайту безпосередньо перед виконанням оновлень. Wayback Machine навряд чи може показати це відвідувачам, натомість він представляє фактичний зміст веб-сторінки.

Як заархівувати свій сайт?

Головна сторінка сайту HTTrack

Головна сторінка сайту HTTrack

Є кілька способів заархівувати сайт. Окрему веб-сторінку можна просто зберегти на жорсткий диск або використовувати безкоштовні онлайн-інструменти архівування, такі як HTTrack та Wayback Machine, або ви можете покластися на резервну копію CMS.

Як відновити сайт із веб-архіву?

Головна сторінка сайту Archivarix

Головна сторінка сайту Archivarix

Archivarix – онлайн-завантажувач веб-сайтів, який дозволяє легко оживити веб-сайт. Також цей сервіс дозволяє повністю відновити доменні імена зі строком дії, що минув. Відновлюючи віддалений домен, ви отримуєте все, що було заархівовано його колишніми власниками.

На завершення

Щоб визначити всі зміни, що відбувалися з сайтом у минулому, необхідно опрацювати наступні напрямки:

  • перегляд вмісту сторінок сайту сервісами Wayback Machine або подібними системами;
  • аналіз анкорів зовнішніх посилань;
  • аудит змін DNS.

Використовуючи ці напрямки, можна дізнатися всю історію сайту з моменту його створення до поточного дня. З огляду на ці дані можна вибудовувати подальшу стратегію роботи з сайтом.


Будемо вдячні за кожен лайк:

Залишіть коментар, Ваша думка дуже важлива для нас!
Введений e-mail не буде видно іншим користувачам:

Просимо ознайомитись з політикою конфіденційності и угодою про використання файлів cookie перед початком використання сайту.

Back to Top

Telegram

Подписывайтесь на наш канал в Telegram, будьте лучше ваших конкурентов

Подпишитесь на наш канал

You have Successfully Subscribed!