Rozdíl počtu výsledků index vs. sitemapa v GSC

Pokud optimalizujete web, neměli byste zapomínat na techničtejší záležitosti, jako je například správné nastavení souboru sitemap.xml. Tento soubor procházejí roboti vyhledávačů a my bychom v něm měli mít jen adresy, které indexovat chceme.

Jak by to mělo vypadat?

V ideálním případě by měl být poměr odeslaných URL (adres v sitemapě) stejný, jako počet indexovaných stránek. Stane se, že se v sitemapě propisuje URL s parametry filtrace – ne vždy to Google zaindexuje ihned.

Indexované URL v GSC - správně

A jak je to špatně?

Robot může indexovat chybné stránky, smazané stránky nebo procházet stránky, na kterých máme nastavený meta tag noindex, follow. Pokud se v sitemapě objevuje tisíce nechtěných URL, robot nemusí projít ty důležité stránky. A to je škoda.

Indexované URL v GSC - špatně

V Google Search Console (GSC) najdete v sekci Procházení -> Soubory Sitemap nejen graf s počtem odeslaných a indexovaných URL, ale v případě zásadních chyb i jejich ohlášení.

Chyby v indexaci - sitemapa

Za ohlašované chyby se v tomto případě řadí pouze stránky 404 a serverové chyby 500. Nesouměrný graf (viz druhý obrázek) by vám měl prozradit, že něco není správě. Měli byste si otevřít sitemapu a projít všechny URL, zda-li mezi nimi není:

  • stránka 404
  • chyba 500
  • meta tag noindex (zakazujeme robotovi procházet danou stránku)
  • žádný obsah (prázdná stránka, kterou nepotřebujeme indexovat)
  • duplicitní obsah (duplicity lze najít v přehledu v GSC – Vzhled vyhledávání -> Vylepšení kódu HTML)

404 v sitemapě

Co by vás mohlo zajímat?

Mohlo by se vám líbit...