Pozor na lomítka v URL, mohou způsobit duplicitu

Včera se objevil na Twitter zajímavý příspěvek od Johna Muellera (Webmaster Trend analytika ze švýcarské pobočky Google). Zabývá se problémem lomítka v URL, jehož nesprávné umístění může způsobit v Google duplicitu.

V krátkosti – lomítko hned za doménou je chápáno jako ekvivalent domény bez lomítka. Nezpůsobuje duplicitu a Google si s tímto poradí po svém. Problém ale nastává pokud je lomítko na konci URL (adresáře). Zde si Googlebot není jistý zdali se jedná o soubor bez koncovky anebo adresář.

Tedy doména.tld/adresar a domena.tld/adresar/ bere jako dvě odlišené stránky. Při absenci přesměrování tak vznikají duplicitní stránky.

Tohle je poměrně zásadní, protože duplicity byste se měli pokud je to možné vyhnout. Obecně velké množství duplicitního obsahu může způsobit technické problémy (problém s indexací, ředění linkjuice atd.) V tomto případě si nemyslím, že by za to mohla být nějaká penalizace, prostě to máte jen blbě a Google se s tím popere.

Jak to vyřešit

Na férovku doporučuji použít canonical. To je tag, který dáte do hlavičky dokumentu a řeknete vyhledávači kde je originál:

<link rel="canonical" href="http://404m.com/2017/12/21/pozor-lomitka-url-mohou-zpusobit-duplicitu/" />

Ačkoliv se na tento obsah dá dostat přes různé URL jako třeba:

  • http://404m.com/?p=16651

V případě, že by bylo rozbité přesměrování, tak vždy bude Google brát jako jedinou stránku tu, která je v canonical. Mimochodem canonical byste měli používat i u stránek, které jsou i obsahově podobné.

Pozor na chyby 404

Ještě jsem si vzpomněl na jeden častý problém. Lidé ne vždy umí dobře kopírovat URL, takže si třeba vezmou doména.tld/adresar1/adresar2 (zapomenou na poslední lomítko). Webu chybí vhodné přesměrování a webserver vrátí 404 (stránka nenalezena). Tohle je poměrně velký problém, který může vyústit ve varování v Google Search Console.

Možná si říkáte, že to máte ošetřené, ale existují případy kdy například přesměrování fungovalo pro http verzi ovšem u přechodu na https se na to jaksi pozapomnělo.

Závěr

Přiznám se že pro mě je to novinka. Myslel jsem že domena.tld/adresar a domena.tld/adresar/ je jedno a to samé. Každý den se člověk dozví něco nového :)


Jak bude reklama vypadat?
-
Kup si reklamu navždy pod tímto článkem jen za 100 Kč
Zobrazit formulář pro nákup

3 Replies to “Pozor na lomítka v URL, mohou způsobit duplicitu”

  1. to mi pripomnelo jeden projekt, ktery jsem delal zhruba pred 15 lety
    vyuzili jsme toho pro rozliseni “dynamickych” (lomitko na konci) a “statickych” (bez lomitka na konci)
    samozrejme pri spatnem kopirovani to muze mit vedlejsi efekt ;] ale ten projekt bezi stale a zatim si nikdo nestezoval

  2. Zdravím, zajímá mě názor na tento příklad:
    Ve zdrojovém kódu máme
    <a href="/odkaz-na-stranku" rel="nofollow">Odkaz</a>
    v případě kliknutí na odkaz dojde k přesměrování 301 a uživatel je na stránce domena.cz/odkaz-na-stranku/
    Nyní již URL s lomítkem na konci.
    Je to i v tomto případě problém (jak S nebo bez HTTPS) a do jaké míry je to problém, když takhle fungují všechny odkazy na webu v podobě přesměrování 301 “bez lomítka na s lomítkem”? Děkuji.

    1. – Tag nofollow říká Google, že nemá následovat odkaz. Tento odkaz nepřenáší linkjuice a měl by být ignorován. V rámci interního prolinkování není dobré jej používat. Výjimkou je třeba přihlašovací formulář.
      – 301 si Google přebere jako přesměrování, tam nic dalšího neřeší. Původní URL (bez lomítka) bude po čase úplně ignorována. Obecně přesměrování zdržuje – prodlužuje načítání stránky a pokud se přesměrovává třeba přes nějaký plugin v CMS tak také žere serverové zdroje.
      – Vše řeší tag canonical, kde je jasně uvedeno jaká stránka je hlavní a důležitá.
      – Google automaticky preferuje HTTPS nad HTTP a bude jí nabízet návštěvníkům.

Comments are closed.