Dilema s mediawiki a červenými odkazy

neutral-poker-face-2Když jsem dával dohromady Seopedii nenapadlo mě, že po 30 heslech budu muset řešit SEO dilema. Vždyť jede na mediawiki, CMS které používá Wikipedia. Ta v podstatě vládne na všech vyhledávačích a nejen linkbuilder se musí zapotit, aby z ní získat trvalý nofollow odkaz pro svého klienta.

Problém je v červených odkazech, tedy těch které vedou na ještě nevytvořené stránky. S tím jak přidávám postupně hesla, vznikají i odkazy na nové ještě neexistující hesla. Jenomže právě ty neexistující logicky vrací stránku 404. No a když se podíváte do Google Webmaster Tools, tak vás pak překvapí 183 chyb kvůli odkazům na neexistujíc stránky a to je oproti 30 heslům už pěkný problém.

Při nadměrném množství chybných může dojít k penalizaci. Ostatně, co asi může nabídnout web plný nefunkčních stránek. Párkrát jsem s tímto experimentoval a zhruba při 10% vám přijde v Google Webmaster Tools dokonce upozornění (viz. článek Zlobivej WordPress a podivné chování Google). Jenomže to jsou 503ky u 404 se mi penalizaci nepodařilo jasně prokázat. Mimochodem žádné upozornění zatím nepřišlo.

Situace

Všechny červené odkazy vedou na:

index.php?title=keyword&action=edit&redlink=1

Takže je zde několik technických řešení jak to řešit.

  1. Dát na odkaz nofollow
  2. Dát na stránku noindex
  3. Zakázat přes robots.txt indexaci souboru index.php
  4. Upravit hlavičku stránky z 404 na 200
  5. Nevytvářet červené odkazy a doplnit je až když bude heslo hotové
  6. Udělat červené odkazy neklikatelné

Takže si to projdeme

Dát na odkaz nofollow

Zdá se to jako dobré řešení, které se dá navíc nakombinovat s ostatními. Teoreticky nám alespoň nebude umírat link juice a page rank. Chyby možná zmizí, ale nevyřeší to problém, že máme na stránce velké množství odkazů vedoucích na mrtvé stránky. Teoreticky nám tak může hrozit penalizace za polomrtvý web.

Dát na stránku noindex

Tohle je zajímavé řešení v kombinaci s ostatními. Samo o sobě by nic nevyřešilo. Většina vyhledávačů stránky 404 neindexuje.

Zakázat přes robots.txt indexaci souboru index.php

Opět zajímavé řešení, ovšem s podobným efektem jako noindex.

Upravit hlavičku stránky z 404 na 200

Tohle řešení problém vyřeší. Chyby 404 zmizí, odkazy už povedou na funkční stránku. Pro naše účely by to asi stačilo. Jenomže když se nad tím zamyslíme, tak je to z deště pod okap. Místo houfu nefunkčních stránek se objeví zástup duplicitního obsahu. A pokud je ho moc, můžeme potkat třeba Pandu.

Ano jak správně tušíte můžeme to nakombinovat. Hlavičku chybových stránek přepíšeme na 200 a stránky necháme bez indexace. Otázkou je jestli by web se 180 stránkami, které si webmáster nepřeje indexovat a 30, které ano tak trochu nevybočoval z řady. Google nemá rád weby co vybočují z řady.

Nevytvářet červené odkazy a doplnit je až když bude heslo hotové

Od technických řešení přecházíme k těm tak trochu nepohodlným až zoufalým. Ano tohle by zřejmě všechno vyřešilo, ale přiznejme si to. Mediawiki je tu kvůli velkému množství obsahu, který zřejmě plánujeme vybudovat a systém červených odkazů myslí právě na ně. Navíc podle počtu červených odkazů napříč hesly si můžeme udělat představu, co jsme měli vytvořit.

Samozřejmě toto je řešení, které by fungovalo.

Udělat červené odkazy neklikatelné

Extrémní úvahy nás přivedly až sem. Jednoduché řešení, které v případě jednoho redaktora je doslova ideální. Stačí upravit zdrojové kódy, anebo napsat rozšíření a vše se vyřeší. Mediawiki si ponechá všechny své červené odkazy a nadále s nimi pracuje. Jsou však neklikatelné, anebo povedou všechny na jednu stránku. V obou případech by měly být vyhledávače spokojené.

Teď to ještě napsat :)

Úvaha

Je dost možné, že Google identifikoval projekt postavený na mediawiki a proto se nic neděje. Nepřijde žádné upozornění ani penalizace. Dávalo by to celkem i smysl. Google poměrně slušně rozeznává CMSka a to i ty méně používané. Ulehčuje mu to indexaci, ví jak k informacím na takovýchto stránkách přistupovat a jak je hodnotit.

Share Button
(0)(0)

Jak bude reklama vypadat?
-
Kup si reklamu navždy pod tímto článkem jen za 100 Kč
Zobrazit formulář pro nákup

Další články k tématu

7 komentářů

  1. George napsal:

    Pokud je chybová stránka dynamická, nepomohlo by k zabránění duplicity na červené odkazy aplikovat atribut canonical a kód 200?

    (0)
  2. Gransy napsal:

    Kod 200 na chybejici stranku je prasarna. Html specifikace v tomhle mluvi jasne.

    (0)
  3. Libje napsal:

    Neklikatelne odkazy jsou zase trochu matouci pro ctenare, uvidi cerveny text zvyrazneny, ale k nicemu v podstate.

    (0)
  4. Radek napsal:

    A on už ti na ten web někdo chodí? Já když tvořím nový web a dělám tam nové podstránky, tak každou publikuji až poté, co na ní dám nějaký obsah.
    Jednou jsem to tak neudělal, bylo to na webu s recenzemi, kde jsem čekal, že budou lidi přidávat vlastní obsah, takže byli stránky prázdné. Seznam je dost často v pohodě indexoval a dokonce se chytali v SERP :)

    (0)
  5. Nezapominejme na fake 404 ktere google rád vytvari pokud mu stránka vraci 200 a nezdá se mu

    (0)
  6. petr napsal:

    George:
    "na červené odkazy aplikovat atribut canonical a kód 200"
    A ten canonical bude směřovat na co? 200 hlavička na co?
    ---
    Gransy:
    "Kod 200 na chybejici stranku je prasarna. Html specifikace v tomhle mluvi jasne."
    Kde je prosím v "Html specifikaci" (http://www.w3.org/TR/REC-html40/) toto přesně uvedeno?

    (0)