Canonical tag v extrémním testu

Na seomoz.org se rozhodli podrobit Canonical tag poměrně extrémním testům, které měli simulovat situace, které se mohou přihodit každému z nás. Canonical se vkládá mezi tagy <head> a má pomoct při indexaci obsahu. Dokáže zabránit neúmyslné dvojité indexaci (duplicitnímu obsahu) způsobené například atributy v URL. Používají jej dnes prakticky všechny moderní CMS. Krom google s ním umí pracovat i seznam.cz.

Obsah

Odkazování na jinou doménu přes canonical

Představte si situaci, kdy publikujete článek na svém blogu a ten bude natolik úspěšný, že jej chtějí přebrat i některé portály. Váš blog má v porovnání s nimi nesrovnatelně nižší autoritu. Pokud jej přeberou pravděpodobně skončíte ve vyhledávání někde hodně hluboko. Co se ale stane pokud je donutíte aby použili právě canonical tag?

Podle výsledků testování půjde všechna sláva vám. Budete na prvním místě ve vyhledávačích. Kolik se toho přesune je však už sporná záležitost. Všechen link juice? Ranky? Pravděpodobně naprosto vše až na návštěvnost :)

V původním testu se publikoval na dvou webech v jeden okamžik stejný článek. Autoritativní web odkazoval přes canonical na neautoritativní. Druhý den se oba objevili v indexu google se stejným titulkem. Třetí den autoritativní zmizel a zůstal jen druhý.

Závěrem tedy je, že canonical může odkazovat z jedné domény na druhou.

Canonical mezi tagy BODY

Tato otázka trápila hlavy mnoha lidem, kteří se pohybují v oblasti bezpečnosti stránek. Co když někdo propašuje do stránky, třeba přes komentáře právě canonical? Je to v podstatě jako SEO obdoba přesměrování.

Tento test se neprováděl jen na seomoz.org. Byl proveden už několikrát předtím. Všechno testování ale dopadlo naprosto stejně. Canonical mimo tagy <head> nemá naprosto žádný vliv. Potvrdil to i Matt Cutss na svém blogu v článku A rel=canonical corner case.

Canonical mezi falešnými tagy <head>

Jak by řekl Ga’s al Rhul: “To že něco nefunguje, neznamená že nenajdeme nějaký způsob jak to obejít, aby to fungovalo”. Co kdyby byl SEO zloděj dostatečně chytrý a vložil by canonical mezi tagy head a ty pak mezi tagy body.

Příklad:

<head>
<title>Stránka, která si neumí ohlídat vstupní komentáře</title>
</head>
<body>
<head>
<LINK REL=”canonical” HREF=”http://LegieStinu.secret”>
</head>
</body>

Jak se z testování ukázala Google podchytil i tuto variantu. Jestli ale náhodou neexistují i další těžko říci. Je ale dobré si připomenout, že v Black Hat SEO se používají i velice důmyslné taktiky jak oklamat roboty vyhledávačů a použít proti nim i jejich vlastní nástroje.

Canonical a neexistující stránka

Stránky se mění a to i včetně jejich struktury. Před pár lety to byly friendly SEO URL, za rok může přijít někdo s něčím dalším. Co ale staré canonical odkazy, anebo zapomenuté stránky? Co se s nimi stane?

Podle výsledků testování má v tomto případě poslední slovo google. Cílovou stránku může, ale i nemusí schválit jako legitimní cíl. Pokud stránka vrací chybu 404, prakticky vždy je ignorována a přednost má stránka na které se tag canonical nachází. Zřejmě zde budou hrát roli nějaká zabezpečení proti zneužívání canonical tagu.

Matt Cutts k tomuto tématu napsal:

“For example, if we think you’re shooting yourself in the foot by accident (pointing a rel=canonical toward a non-existent/404 page), we’d reserve the right not to use the destination url you specify with rel=canonical.”

Pokud tedy bude tag canonical zlobit zkuste se ujistit jestli není na stránce nějaké přesměrování, anebo ochranné opatření na úrovni serveru.

Ty na bráchu a brácha na tebe

Představte si situaci, kdy vytvoříte stránku s duplicitním obsahem odkážete na ní přes tag canonical a druhá stránka odkáže zase na vás. Prostě jeden odkazuje na toho druhého. Co se stane?

Při tomto testu došlo k zmatečnému indexování, které se protáhlo. Po deseti dnech se stránky zařadili za sebe a to v pořadí v jakém je navštívil Googlebot. Po dalších dnech došlo k podivnostem, které poukazují na to, že se s tímto paradoxem nedokáže google tak úplně vypořádat. Jedné ze stránek byl přepsaný titulek. Google se začal zřejmě chovat jako při redirektu.

Sociální sítě a canonical

V článku je ještě zmíněné zvláštní chování skritpů sociálních sítí (FB a Twitter tlačítka). Pokud několik stránek s tlačítky odkazuje na jednu stránku, pak jsou “likeři” a “twíty” započítávání pro tu jednu stránku na kterou se odkazuje.

Závěr

Je vidět, že google to má celkem dobře ošéfované a celý koncept canonical je promyšlený. Celkem by mě zajímalo jestli to takto dobře zvládá i seznam.cz. Poradil by si s canonical mezi tagy body? Jak bude rozeznávat neexistující stránky? Těžko říct, dokud to někdo neotestuje a nepodělí se o výsledky. Nevím jestli ale někdo na tyto testy obětuje nějaký autoritativní projekt. U nového na rychle splácaného webu by se muselo čekat poměrně dlouho na indexaci a několik reindexací.

Jak bude reklama vypadat?

Kup si reklamu navždy pod tímto článkem jen za 100 Kč

Zobrazit formulář pro nákup

7 Replies to “Canonical tag v extrémním testu”

Olda Šálek napsal:

16.6.2011 (15:40)

canonical tagu využívám hodně, spíš pro stránky kde mám /clanek/nazev-clanku&msg=komentar_byl_pridan.. Jinak pro seo ani ne.
Robert napsal:

16.6.2011 (20:04)

Díky moc za článek. Vždycky jsem si myslel, že rel=canonical je spíš taková z nouze ctnost a ono to vypadá, že je to docela mocný nástroj.
meisy napsal:

16.6.2011 (22:45)

použití canonical je rozšířené (podle mě) spíše pro jinou situaci, udělám si v eshopu s koly kategorii “červené kola” a “kola se zvonkem”, mám produkt “červené kolo se zvonkem” a zařadím ho do dvou kategorií, vzniknou tak dvě duplicitní stránky (cervene-kola/cervene-kolo-se-zvonkem) a (kola-se-zvonkem/cervene-kolo-se-zvonkem) ==>> zde přichází na scénu canonical a jednu ze stránek udělám hlavní, druhou přesměruji jako duplicitní
WebExSys napsal:

17.6.2011 (10:11)

Prodlém je v tom, že ten, kdo si obsah “půjčí” asi těžko uvede zdroj, natož tak Canonical, takže nástroj mocný, ale na h…o.
Bertrand napsal:

17.6.2011 (14:04)

souhlas s WebExSys kdyz si berou obsah tak napisou maximalne zdroj ale canonical proc by to nekdo delal?
Palm Pre napsal:

3.7.2011 (11:34)

Mně by zajímalo, kde je vlastně hranice duplicity dvou téměř stejných stránek.
PeteP napsal:

17.7.2011 (11:05)

Jak se píše na blogu H1, canonical má sloužit pro vyřešení duplicitního obsahu v rámci jednoho webu. Takže souhlas s meisy.
Svym testem si dokázal, že to funguje i napříč více webama. Je to zajímavý, ale nedokážu si představit, že někdo, kdo zkopíruje můj článek a dá ho na svoje stránky, ochotně přidá canonical mezi tagy head. Takže v tomhle směru mi to taky přijde nepraktický a pro SEO nepoužitelný.
Btw: Je fajn vědět, že to neni zneužitelný.