Сторінка виявлена, але не проіндексована

“Вибачте, але не зараз.. або виявлена, але не проіндексована”. У Google консолі є 2 чудових статуси індексації сторінок (опис з довідки Google):

  1. Сторінка просканована, але поки не проіндексована. Надалі вона може бути проіндексована, а може і залишитися в поточному стані.
  2. Виявлена, не проіндексована. Це повідомлення означає, що ми знайшли сторінку, але поки не додали її в індекс Google. Зазвичай це пояснюється тим, що роботу Google не вдалося просканувати сайт, оскільки це могло привести до надмірного завантаження ресурсу, і сканування було перенесено на більш пізній термін.

З яким масово стикаються, більшою мірою:

  • Нові сайти, які вперше заходять в індекс і мають складнощі з унікальністю контенту на сторінках.
  • Габаритні сайти з великою кількістю сторінок, частіше однотипних (наприклад, сторінки карток товарів).
  • Після масової зміни URL адрес (ситуація, в якій ще вчора сторінки були в індексі, після зміни Гугл порахував інакше).
  • Сайти з великою кількістю товарів “немає в наявності”, Google також може відправляти їх в цей статус.
  • Сайти з дублюючим контентом (не завжди в консолі дублікати потрапляють саме в статус дублюючий контент).

Ближче до суті

У 2019 році Джон Мюллер з Гугл залишив такий 👉коментар (https://support.google.com/webmasters/forum/AAAA2Jdx3sUxAVgZFhR8YQ/?hl=en&gpf=%23!topic%2Fwebmasters%2FxAVgZFhR8YQ) по темі:

Ми не обіцяємо обхід і індексацію всього контенту. В інтернеті купа всього, і було б непрактично включати все, ми повинні розставити пріоритети. Це не означає, що зі сторінками щось не те, наші алгоритми не бачать сенсу включати всі сторінки з вашого сайту. Це нормально, пізніше можливі зміни, це не є ознакою технічної проблеми. Одним з виходів, в таких випадках, це зосередити свої зусилля на змісті проіндексованих, об’єднати схожі сторінки, видалити непотрібні сторінки, робити більш унікальний і цікавий контент на сторінках вашого сайту (або всі ці кроки).

Так який склад таблетки?

Перед тим, як прописувати рецепт, потрібно:

  1. Проаналізувати консоль, по суті, потрібно знайти закономірності у виключених сторінках і зрозуміти, який саме тип(и) сторінок йдуть в цей статус.
  2. Вибірково перевірити сторінки через оператор site:, може бути помилкова тривога і сторінки будуть в індексі.
  3. Після чого, спробувати розгледіти, чим вони відрізняються від тих, які зайшли в індекс (і це може бути не так очевидно і просто).
  4. Подивитися, як виглядають такі ж сторінки у ваших конкурентів.

Звичайно ж, в плані потенційного рішення, мова йде саме про ситуацію, в якій в цей статус потрапляють потрібні вам сторінки, а не сміття, яке досить просто закрити або не виконувати ніяких дій. Наприклад, якщо це сторінки товарів, за якими є мікро НЧ запити по артикулам і т. д. – проект може недоотримувати органіку.

Рішення складається з 4 частин (на прикладі сторінок товарів):

  1. Унікалізуємо контент сторінок шляхом шаблонізації та унік контенту:
  2. Унікалізувати URL (коментар Джона Мюллера: Google може “загубитися” у великій кількості згенерованих сторінок зі схожими URL, наприклад, що розрізняються регістром або атрибутами. Якщо на сайті дійсно багато дубльованих URL, їх індексація не потрібна, переходьте до наступного пункту.)
    1. Унікалізувати заголовок H1, мета опис і title.
    2. Наявність конкретики (ціни та ін. інформації).
    3. Наявність повних технічних характеристик.
    4. Наявність фотографій продукту.
    5. Які інфоблоки дублюються на всіх сторінках (що потрібно прибрати/що потрібно додати).
    6. Які блоки перелінковки розміщені (наприклад, чи є блок інші товари).
  3. Скоротити кількість однотипних товарів, якщо це можливо.
  4. Час на переіндексацію.
Оцініть статтю
Додати коментар