Zakázání indexace stránek

O možnosti omezení indexování stránek ví v podstatě každý webmaster. I v nápovědách vyhledávačů nalezneme větu typu "Indexaci zvolených stránek můžete zakázat tak a tak". Stačí na stránku jednoduše přidat příslušný meta tag, nebo vytvořit pravidlo v robots.txt, a vyhledávače budou danou stránku ignorovat.

Mnoho lidí si však klade otázku, proč by měli dobrovolně zmenšovat rozsah indexovaných stránek ve vyhledávači? Důvodů může být více, z hlediska SEO je zřejmě nejdůležitější podobný obsah.

Podobný a duplicitní obsah

Duplicitní a podobný obsah je častou chybou, která může negativně ovlivňovat hodnocení webu vyhledávači.

Duplicitní obsah vzniká v případě, kdy je identická stránka dostupná pod více URL adresami. Podrobněji je problematika vysvětlena například v poradně vyhledávače.info. Duplicitní obsah je většinou nutné řešit na straně serveru, zde zakázání indexace příliš nepomůže. Výjimkou mohou být například samostatné tiskové stránky, které mají stejný obsah, jako původní stránka a jsou jen jinak nastylované.

Podobný obsah tvoří, jak už napovídá samotný název, podobné stránky. Co si pod tím ale představit?
Dejme tomu, že na stránkách elektronického obchodu je kontaktní formulář pro dotazy ke každému výrobku. Uživateli stačí zadat pouze svůj email a vzkaz a odeslat. Porovnat takové 2 stránky můžeme například tady a tady. Sami vidíte, že oba dokumenty se liší jen velmi málo - titulkem a nadpisem. Nejedná se tedy o duplicitní, ale o podobný obsah. Takovýchto stránek bude na serveru tolik, jako samotných produktů a pro uživatele (a samozřejmě i vyhledávače) nepřinášejí žádný unikátní obsah.

Jaký smysl by mělo, kdyby se uživatel dostal z vyhledávače na tento typ stránky? Ať už by hledal jakoukoli frázi, daleko lepší vstupní stránka bude přímo konkrétní produkt. Tyto stránky se tak nemusí v databázi vyhledávače vůbec nacházet a je proto výhodné jim zakázat indexaci. Zbavíme se tak problémů s podobným obsahem a zvýšíme šance na správné vstupní stránky ve výsledcích hledání. Vedlejším efektem bude také to, že vyhledávací robot bude indexovat pouze důležité stránky a nebude plýtvat časem na nedůležité dokumenty.

Příklady neindexovatelého obsahu

Existuje samozřejmě více druhů obsahu, který nechceme vyhledávači předkládat. Na tomto blogu jsou to například RSS exporty komentářů (Google indexuje i XML obsah), stránky pro odeslání článku emailem apod. Dalším dobrým příkladem můžou být barevné varianty zboží (případně velikosti atp.) - pokud má každá varianta vlastní stránku, jedná se opět o problém podobného obsahu.

Zákaz indexace prakticky

V dnešní době se používají 2 způsoby pro omezení indexování - meta tag robots a soubor robots.txt. Podrobný článek o této problematice lze nalézt na serveru jakpsatweb, zde zmíním krátké ukázky.

Použití meta tagu je jednoduché - do hlavičky stránky (sekce <head>) se vloží <meta name="robots" content="noindex"> a práce je hotova.

Robots.txt umožňuje specifikovat oblasti, které mají být robotům nepřístupné. Ve výše zmíněném příkladu podobného obsahu vypadala adresa takto: http://www.detskydum.cz/zeptejte-se-nas-na-vyrobek/aerosleep-unikatni-podlozka-112301/. Pro zakázání indexace stránek tohoto typu stačí vložit do robots.txt následující kód:
User-agent: *
Disallow: /zeptejte-se-nas-na-vyrobek/

Závěr

Zakázat indexaci je dobré především v případě, kdy by mohl hrozit problém s podobným obsahem. Dále se často používá u stránek, které nemají zajímavý a unikátní obsah, nebo jednoduše nemají obsah vhodný pro vyhledávače.

Důležité je samozřejmě vše pečlivě rozmyslet, než se tomto směru udělají nějaké úpravy. Pokud se omezení nadefinují špatně, mohou vzniknout velké problémy.

vydáno 08.09.08 - SEO - 4756x - trvalý odkaz trvalý odkaz
Karma: 33. Líbil se vám článek? [ano/ne]
RSS komentářů článku - vytisknout - Odeslat emailem

Nový komentář:

Komentář čeká na schválení.

Tento článek byl uzavřen. Už není možné k němu přidávat komentáře ani hlasovat


Nejoblíbenější články

Poslední komentáře

  • Maxell: [3] Značku base určitě není dobré používat, například některé vyhledávače s tím mohou mít problém. Pokud vím, důležité vyhledávače to podporují, ale rozhodně bych se na ni nespoléhal....
  • I.C.: Není mnohem jednodušší využívat standartního <base href="http: domena.cz " > a pak všude používat jen relativní cesty vzhledem k výše uvedenému? ;-)...
  • gmo: Cau, ja tenhle problem resil pomoci direktivy VirtualHost v nastaveni Apache, viz google...
  • Maxell: [1] Ano, zkoušel jsem to na více místech a chová se to všude stejně. Vyřešil jsem to tak, že jsem zobrazil pouze Nejbližší shodu, která by měla fungovat....
  • Maxell: [3] České vyhledávače description opravdu zatím nevyužívají. U Seznamu o tom již delší dobu uvažují, nicméně k realizaci je stále ještě daleko. Jak je psáno v článku, description by vždy mělo shrnovat obsah dané stránky. Každá kategorie a podkategorie by tak ideálně měla mít vlastní popisek, stejně tak např. každý výrobek. Vámi navrhované texty jsou také poměrně krátké, rozhodně bych je prodloužil na cca 100 - 150 znaků....

Poslední články

Nejlépe hodnocené

Nejčtenější

Copyright © Maxell | Maxell-cz | Design
Web-Design Blog - Blog nejen o webdesignu