O možnosti omezení indexování stránek ví v podstatě každý webmaster. I v nápovědách vyhledávačů nalezneme větu typu "Indexaci zvolených stránek můžete zakázat tak a tak". Stačí na stránku jednoduše přidat příslušný meta tag, nebo vytvořit pravidlo v robots.txt, a vyhledávače budou danou stránku ignorovat.
Mnoho lidí si však klade otázku, proč by měli dobrovolně zmenšovat rozsah indexovaných stránek ve vyhledávači? Důvodů může být více, z hlediska SEO je zřejmě nejdůležitější podobný obsah.
Duplicitní a podobný obsah je častou chybou, která může negativně ovlivňovat hodnocení webu vyhledávači.
Duplicitní obsah vzniká v případě, kdy je identická stránka dostupná pod více URL adresami. Podrobněji je problematika vysvětlena například v poradně vyhledávače.info. Duplicitní obsah je většinou nutné řešit na straně serveru, zde zakázání indexace příliš nepomůže. Výjimkou mohou být například samostatné tiskové stránky, které mají stejný obsah, jako původní stránka a jsou jen jinak nastylované.
Podobný obsah tvoří, jak už napovídá samotný název, podobné stránky. Co si pod tím ale představit?
Dejme tomu, že na stránkách elektronického obchodu je kontaktní formulář pro dotazy ke každému výrobku. Uživateli stačí zadat pouze svůj email a vzkaz a odeslat. Porovnat takové 2 stránky můžeme například tady a tady. Sami vidíte, že oba dokumenty se liší jen velmi málo - titulkem a nadpisem. Nejedná se tedy o duplicitní, ale o podobný obsah. Takovýchto stránek bude na serveru tolik, jako samotných produktů a pro uživatele (a samozřejmě i vyhledávače) nepřinášejí žádný unikátní obsah.
Jaký smysl by mělo, kdyby se uživatel dostal z vyhledávače na tento typ stránky? Ať už by hledal jakoukoli frázi, daleko lepší vstupní stránka bude přímo konkrétní produkt. Tyto stránky se tak nemusí v databázi vyhledávače vůbec nacházet a je proto výhodné jim zakázat indexaci. Zbavíme se tak problémů s podobným obsahem a zvýšíme šance na správné vstupní stránky ve výsledcích hledání. Vedlejším efektem bude také to, že vyhledávací robot bude indexovat pouze důležité stránky a nebude plýtvat časem na nedůležité dokumenty.
Existuje samozřejmě více druhů obsahu, který nechceme vyhledávači předkládat. Na tomto blogu jsou to například RSS exporty komentářů (Google indexuje i XML obsah), stránky pro odeslání článku emailem apod. Dalším dobrým příkladem můžou být barevné varianty zboží (případně velikosti atp.) - pokud má každá varianta vlastní stránku, jedná se opět o problém podobného obsahu.
V dnešní době se používají 2 způsoby pro omezení indexování - meta tag robots a soubor robots.txt. Podrobný článek o této problematice lze nalézt na serveru jakpsatweb, zde zmíním krátké ukázky.
Použití meta tagu je jednoduché - do hlavičky stránky (sekce <head>) se vloží <meta name="robots" content="noindex"> a práce je hotova.
Robots.txt umožňuje specifikovat oblasti, které mají být robotům nepřístupné. Ve výše zmíněném příkladu podobného obsahu vypadala adresa takto: http://www.detskydum.cz/zeptejte-se-nas-na-vyrobek/aerosleep-unikatni-podlozka-112301/. Pro zakázání indexace stránek tohoto typu stačí vložit do robots.txt následující kód:
User-agent: *
Disallow: /zeptejte-se-nas-na-vyrobek/
Zakázat indexaci je dobré především v případě, kdy by mohl hrozit problém s podobným obsahem. Dále se často používá u stránek, které nemají zajímavý a unikátní obsah, nebo jednoduše nemají obsah vhodný pro vyhledávače.
Důležité je samozřejmě vše pečlivě rozmyslet, než se tomto směru udělají nějaké úpravy. Pokud se omezení nadefinují špatně, mohou vzniknout velké problémy.
08.09.08 - SEO - 2980x -
Karma: 30.
