Vyhledávače vás vyřadí z indexu i pokud je noindex v těle dokumentu

Tak o tento článek se s vámi musím podělit. Marie Haynes řešila s jedním klientem problém s indexací webu, který se mu nedařilo dostat do Google. Po letmém prozkoumání zjistila, že chyba je v meta noindex, který však není umístěný někde v hlavičce, ale těle dokumentu. Dokonce byl zapomenutý v jednom z formulářů.

Tato chyba je prezentována Google jako feature :), tedy že klasickou značku:

<meta name="robots" content="noindex">

bude respektovat ať se nachází v kterékoliv části dokumentu. Oficiálně to potvrdil na Google plus i Gary Illyes, který pracuje pro pobočku Google ve Švýcarsku (můžete jej sledovat i na Twitter).

Ok tím by to celé asi mohlo i skončit. Dozvěděli jsme se něco nového ze zákulisí GoogleBota a můžeme jít dát. Jenomže co kdyby někdo takto protlačit noindex na vaší stránku záměrně. Například přes nezabezpečený formulář, kteří slouží ke komentování. Dokázal by jediným komentářem vyřadit konkrétní stránku z indexu. Což by třeba u eshopu v období vánočních nákupů rozhodně nepotěšilo.

U moderních CMS to není nic jednoduchého, ale o bezpečnostních dírách, které jsou zneužitelné pro XSS útoku slýcháváme pravidelně. Navíc často jsou uživatelé leniví něco aktualizovat, když s tím je hodně práce.

Takže pokud vaše stránka zmizí z indexu určitě se vyplatí otestovat zdali tam náhodou nepřibyl i meta tak s noindex :)


Jak bude reklama vypadat?
-
Kup si reklamu navždy pod tímto článkem jen za 100 Kč
Zobrazit formulář pro nákup

6 komentářů u „Vyhledávače vás vyřadí z indexu i pokud je noindex v těle dokumentu“

  1. Myslím, že když se na web dá vložit vlastní kód, tak zabránění indexace je to poslední, co by útočník udělal… když si může třeba stránku rovnou přesměrovat k sobě a podobně.

  2. O tejto chybyčke sa na blackhat forach píše už dlhšie. A noindex na celý web sa tak dá dosiahnuť .. len zas nie je také ľahké ten kod nejako tam prepašovať.

Komentáře nejsou povoleny.