Tak o tento článek se s vámi musím podělit. Marie Haynes řešila s jedním klientem problém s indexací webu, který se mu nedařilo dostat do Google. Po letmém prozkoumání zjistila, že chyba je v meta noindex, který však není umístěný někde v hlavičce, ale těle dokumentu. Dokonce byl zapomenutý v jednom z formulářů.
Tato chyba je prezentována Google jako feature :), tedy že klasickou značku:
<meta name="robots" content="noindex">
bude respektovat ať se nachází v kterékoliv části dokumentu. Oficiálně to potvrdil na Google plus i Gary Illyes, který pracuje pro pobočku Google ve Švýcarsku (můžete jej sledovat i na Twitter).
Ok tím by to celé asi mohlo i skončit. Dozvěděli jsme se něco nového ze zákulisí GoogleBota a můžeme jít dát. Jenomže co kdyby někdo takto protlačit noindex na vaší stránku záměrně. Například přes nezabezpečený formulář, kteří slouží ke komentování. Dokázal by jediným komentářem vyřadit konkrétní stránku z indexu. Což by třeba u eshopu v období vánočních nákupů rozhodně nepotěšilo.
U moderních CMS to není nic jednoduchého, ale o bezpečnostních dírách, které jsou zneužitelné pro XSS útoku slýcháváme pravidelně. Navíc často jsou uživatelé leniví něco aktualizovat, když s tím je hodně práce.
Takže pokud vaše stránka zmizí z indexu určitě se vyplatí otestovat zdali tam náhodou nepřibyl i meta tak s noindex :)
Myslím, že když se na web dá vložit vlastní kód, tak zabránění indexace je to poslední, co by útočník udělal… když si může třeba stránku rovnou přesměrovat k sobě a podobně.
myslíš že to funguje i takhle v plain textu v komentáři ? :D
To se musíš víc snažit. WP takovéto jednoduchosti nepustí :)
Koukni na profíky: https://twitter.com/404m_com/status/552864562283024384
O tejto chybyčke sa na blackhat forach píše už dlhšie. A noindex na celý web sa tak dá dosiahnuť .. len zas nie je také ľahké ten kod nejako tam prepašovať.
http://404m.com/godaddy-promo-kupony/
Jak tam přidat komentář :-) Nicméně ani jeden kod nejede…
To je stará stránka, budu jí muset zrušit.