Na seomoz.org se rozhodli podrobit Canonical tag poměrně extrémním testům, které měli simulovat situace, které se mohou přihodit každému z nás. Canonical se vkládá mezi tagy <head> a má pomoct při indexaci obsahu. Dokáže zabránit neúmyslné dvojité indexaci (duplicitnímu obsahu) způsobené například atributy v URL. Používají jej dnes prakticky všechny moderní CMS. Krom google s ním umí pracovat i seznam.cz.
Obsah
Odkazování na jinou doménu přes canonical
Představte si situaci, kdy publikujete článek na svém blogu a ten bude natolik úspěšný, že jej chtějí přebrat i některé portály. Váš blog má v porovnání s nimi nesrovnatelně nižší autoritu. Pokud jej přeberou pravděpodobně skončíte ve vyhledávání někde hodně hluboko. Co se ale stane pokud je donutíte aby použili právě canonical tag?
Podle výsledků testování půjde všechna sláva vám. Budete na prvním místě ve vyhledávačích. Kolik se toho přesune je však už sporná záležitost. Všechen link juice? Ranky? Pravděpodobně naprosto vše až na návštěvnost :)
V původním testu se publikoval na dvou webech v jeden okamžik stejný článek. Autoritativní web odkazoval přes canonical na neautoritativní. Druhý den se oba objevili v indexu google se stejným titulkem. Třetí den autoritativní zmizel a zůstal jen druhý.
Závěrem tedy je, že canonical může odkazovat z jedné domény na druhou.
Canonical mezi tagy BODY
Tato otázka trápila hlavy mnoha lidem, kteří se pohybují v oblasti bezpečnosti stránek. Co když někdo propašuje do stránky, třeba přes komentáře právě canonical? Je to v podstatě jako SEO obdoba přesměrování.
Tento test se neprováděl jen na seomoz.org. Byl proveden už několikrát předtím. Všechno testování ale dopadlo naprosto stejně. Canonical mimo tagy <head> nemá naprosto žádný vliv. Potvrdil to i Matt Cutss na svém blogu v článku A rel=canonical corner case.
Canonical mezi falešnými tagy <head>
Jak by řekl Ga’s al Rhul: “To že něco nefunguje, neznamená že nenajdeme nějaký způsob jak to obejít, aby to fungovalo”. Co kdyby byl SEO zloděj dostatečně chytrý a vložil by canonical mezi tagy head a ty pak mezi tagy body.
Příklad:
- <head>
- <title>Stránka, která si neumí ohlídat vstupní komentáře</title>
- </head>
- <body>
- <head>
- <LINK REL=”canonical” HREF=”http://LegieStinu.secret”>
- </head>
- </body>
Jak se z testování ukázala Google podchytil i tuto variantu. Jestli ale náhodou neexistují i další těžko říci. Je ale dobré si připomenout, že v Black Hat SEO se používají i velice důmyslné taktiky jak oklamat roboty vyhledávačů a použít proti nim i jejich vlastní nástroje.
Canonical a neexistující stránka
Stránky se mění a to i včetně jejich struktury. Před pár lety to byly friendly SEO URL, za rok může přijít někdo s něčím dalším. Co ale staré canonical odkazy, anebo zapomenuté stránky? Co se s nimi stane?
Podle výsledků testování má v tomto případě poslední slovo google. Cílovou stránku může, ale i nemusí schválit jako legitimní cíl. Pokud stránka vrací chybu 404, prakticky vždy je ignorována a přednost má stránka na které se tag canonical nachází. Zřejmě zde budou hrát roli nějaká zabezpečení proti zneužívání canonical tagu.
Matt Cutts k tomuto tématu napsal:
“For example, if we think you’re shooting yourself in the foot by accident (pointing a rel=canonical toward a non-existent/404 page), we’d reserve the right not to use the destination url you specify with rel=canonical.”
Pokud tedy bude tag canonical zlobit zkuste se ujistit jestli není na stránce nějaké přesměrování, anebo ochranné opatření na úrovni serveru.
Ty na bráchu a brácha na tebe
Představte si situaci, kdy vytvoříte stránku s duplicitním obsahem odkážete na ní přes tag canonical a druhá stránka odkáže zase na vás. Prostě jeden odkazuje na toho druhého. Co se stane?
Při tomto testu došlo k zmatečnému indexování, které se protáhlo. Po deseti dnech se stránky zařadili za sebe a to v pořadí v jakém je navštívil Googlebot. Po dalších dnech došlo k podivnostem, které poukazují na to, že se s tímto paradoxem nedokáže google tak úplně vypořádat. Jedné ze stránek byl přepsaný titulek. Google se začal zřejmě chovat jako při redirektu.
Sociální sítě a canonical
V článku je ještě zmíněné zvláštní chování skritpů sociálních sítí (FB a Twitter tlačítka). Pokud několik stránek s tlačítky odkazuje na jednu stránku, pak jsou “likeři” a “twíty” započítávání pro tu jednu stránku na kterou se odkazuje.
Závěr
Je vidět, že google to má celkem dobře ošéfované a celý koncept canonical je promyšlený. Celkem by mě zajímalo jestli to takto dobře zvládá i seznam.cz. Poradil by si s canonical mezi tagy body? Jak bude rozeznávat neexistující stránky? Těžko říct, dokud to někdo neotestuje a nepodělí se o výsledky. Nevím jestli ale někdo na tyto testy obětuje nějaký autoritativní projekt. U nového na rychle splácaného webu by se muselo čekat poměrně dlouho na indexaci a několik reindexací.
canonical tagu využívám hodně, spíš pro stránky kde mám /clanek/nazev-clanku&msg=komentar_byl_pridan.. Jinak pro seo ani ne.
Díky moc za článek. Vždycky jsem si myslel, že rel=canonical je spíš taková z nouze ctnost a ono to vypadá, že je to docela mocný nástroj.
použití canonical je rozšířené (podle mě) spíše pro jinou situaci, udělám si v eshopu s koly kategorii “červené kola” a “kola se zvonkem”, mám produkt “červené kolo se zvonkem” a zařadím ho do dvou kategorií, vzniknou tak dvě duplicitní stránky (cervene-kola/cervene-kolo-se-zvonkem) a (kola-se-zvonkem/cervene-kolo-se-zvonkem) ==>> zde přichází na scénu canonical a jednu ze stránek udělám hlavní, druhou přesměruji jako duplicitní
Prodlém je v tom, že ten, kdo si obsah “půjčí” asi těžko uvede zdroj, natož tak Canonical, takže nástroj mocný, ale na h…o.
souhlas s WebExSys kdyz si berou obsah tak napisou maximalne zdroj ale canonical proc by to nekdo delal?
Mně by zajímalo, kde je vlastně hranice duplicity dvou téměř stejných stránek.
Jak se píše na blogu H1, canonical má sloužit pro vyřešení duplicitního obsahu v rámci jednoho webu. Takže souhlas s meisy.
Svym testem si dokázal, že to funguje i napříč více webama. Je to zajímavý, ale nedokážu si představit, že někdo, kdo zkopíruje můj článek a dá ho na svoje stránky, ochotně přidá canonical mezi tagy head. Takže v tomhle směru mi to taky přijde nepraktický a pro SEO nepoužitelný.
Btw: Je fajn vědět, že to neni zneužitelný.