Včera se objevil na Twitter zajímavý příspěvek od Johna Muellera (Webmaster Trend analytika ze švýcarské pobočky Google). Zabývá se problémem lomítka v URL, jehož nesprávné umístění může způsobit v Google duplicitu.
I noticed there was some confusion around trailing slashes on URLs, so I hope this helps. tl;dr: slash on root/hostname=doesn't matter; slash elsewhere=does matter (they're different URLs) pic.twitter.com/qjKebMa8V8
— 🧀 John 🧀 (@JohnMu) December 19, 2017
V krátkosti – lomítko hned za doménou je chápáno jako ekvivalent domény bez lomítka. Nezpůsobuje duplicitu a Google si s tímto poradí po svém. Problém ale nastává pokud je lomítko na konci URL (adresáře). Zde si Googlebot není jistý zdali se jedná o soubor bez koncovky anebo adresář.
Tedy doména.tld/adresar a domena.tld/adresar/ bere jako dvě odlišené stránky. Při absenci přesměrování tak vznikají duplicitní stránky.
Tohle je poměrně zásadní, protože duplicity byste se měli pokud je to možné vyhnout. Obecně velké množství duplicitního obsahu může způsobit technické problémy (problém s indexací, ředění linkjuice atd.) V tomto případě si nemyslím, že by za to mohla být nějaká penalizace, prostě to máte jen blbě a Google se s tím popere.
Obsah
Jak to vyřešit
Na férovku doporučuji použít canonical. To je tag, který dáte do hlavičky dokumentu a řeknete vyhledávači kde je originál:
<link rel="canonical" href="http://404m.com/2017/12/21/pozor-lomitka-url-mohou-zpusobit-duplicitu/" />
Ačkoliv se na tento obsah dá dostat přes různé URL jako třeba:
- http://404m.com/?p=16651
V případě, že by bylo rozbité přesměrování, tak vždy bude Google brát jako jedinou stránku tu, která je v canonical. Mimochodem canonical byste měli používat i u stránek, které jsou i obsahově podobné.
Pozor na chyby 404
Ještě jsem si vzpomněl na jeden častý problém. Lidé ne vždy umí dobře kopírovat URL, takže si třeba vezmou doména.tld/adresar1/adresar2 (zapomenou na poslední lomítko). Webu chybí vhodné přesměrování a webserver vrátí 404 (stránka nenalezena). Tohle je poměrně velký problém, který může vyústit ve varování v Google Search Console.
Možná si říkáte, že to máte ošetřené, ale existují případy kdy například přesměrování fungovalo pro http verzi ovšem u přechodu na https se na to jaksi pozapomnělo.
Závěr
Přiznám se že pro mě je to novinka. Myslel jsem že domena.tld/adresar a domena.tld/adresar/ je jedno a to samé. Každý den se člověk dozví něco nového :)
to mi pripomnelo jeden projekt, ktery jsem delal zhruba pred 15 lety
vyuzili jsme toho pro rozliseni “dynamickych” (lomitko na konci) a “statickych” (bez lomitka na konci)
samozrejme pri spatnem kopirovani to muze mit vedlejsi efekt ;] ale ten projekt bezi stale a zatim si nikdo nestezoval
Zdravím, zajímá mě názor na tento příklad:
Ve zdrojovém kódu máme
<a href="/odkaz-na-stranku" rel="nofollow">Odkaz</a>
v případě kliknutí na odkaz dojde k přesměrování 301 a uživatel je na stránce domena.cz/odkaz-na-stranku/
Nyní již URL s lomítkem na konci.
Je to i v tomto případě problém (jak S nebo bez HTTPS) a do jaké míry je to problém, když takhle fungují všechny odkazy na webu v podobě přesměrování 301 “bez lomítka na s lomítkem”? Děkuji.
– Tag nofollow říká Google, že nemá následovat odkaz. Tento odkaz nepřenáší linkjuice a měl by být ignorován. V rámci interního prolinkování není dobré jej používat. Výjimkou je třeba přihlašovací formulář.
– 301 si Google přebere jako přesměrování, tam nic dalšího neřeší. Původní URL (bez lomítka) bude po čase úplně ignorována. Obecně přesměrování zdržuje – prodlužuje načítání stránky a pokud se přesměrovává třeba přes nějaký plugin v CMS tak také žere serverové zdroje.
– Vše řeší tag canonical, kde je jasně uvedeno jaká stránka je hlavní a důležitá.
– Google automaticky preferuje HTTPS nad HTTP a bude jí nabízet návštěvníkům.