Zlobivej WordPress a podivné chování Google

Google Webmaster Tools mi začalo hlásit 9.12.2012 větší nárůst chyb 404 (stránka nenalezena) u jednoho webu jedoucího na WordPress. Nějak jsem tomu nevěnoval pozornost, protože web šlapal v pohodě. Jedná se o projekt na testování všeho možného, nacházející se na neprodejné doméně. Není tam žádná reklama a v podstatě ani nic užitečného. Dneska jsem se rozhodl dát to dohromady s využitím Google Webmaster Tools a našel jsem něco zajímavého.

Když jsem si porovnal grafy s nárůstem chyb a množství vyhledávacích dotazů, tak mě to přišlo podezřelé. Přidal jsem k tomu ještě graf z Google Analytics a výsledkem je zajímavá teorie, že by počet nestandardních chyb 404 (vysvětlím později) mohl mít vliv na pozice Google.

mnozstvi-chyb-vs-google

V grafech je zelenou barvou zobrazené naléhavé upozornění z Google Webmaster Tools, které mi přišlo tuším i emailem. První graf je množství zobrazení ve vyhledávání, druhý počet detekovaných chyb a třetí úpadek návštěvnosti z Google v Google Analytics.

Fakta

  • Web obsahoval chyby už dříve, ovšem jejich množství nijak výrazně nevzrůstalo. Drželo se pod 1% indexovaných stránek. Tato hodnota byla postupně překročena koncem listopadu a pak začala růst.
  • Chybová stránka nebyla klasická 404 na WordPressu, ale Fatal error s nedostatkem paměti pro neexistující stránky. Jinak vše fungovalo.
  • Na doménu existují zpětné odkazy, které směřují na mrtvé stránky.
  • V tomto období byly Vánoční svátky, pokles množství vyhledávání by se dal chápat, ovšem markantní propad návštěvností z Google už ne. Navíc leden nepřinesl zlepšení.
  • Web má stále GPR 3.

Co víme o Google

Množství chyb 503 na webu může vést k dočasné penalizaci webu na Google. Nemůžu teď dohledat zdroj, ale někde to bylo zmíněno smrtelně vážně :)

Pokud by to obdobně platilo pro chybu 404 nebylo by to zřejmě žádné velké překvapení.

Kde byla chyba

V rámci testování jsem se hrabal přímo v databází a promazal posty z tabulky posts. Ovšem ostatní tabulky zůstaly nedotčeny. To nepobral některý z pluginů a způsoboval na neexistujících stránkách chybu s nedostatkem paměti i když jsem limit navýšil na 256MB. Řešením bylo všechny pluginy vypnout a zase zapnout. Jak originální že? Mohl jsem to zkusit hned na začátku a ne po hodině a půl :)

Závěr

Momentálně vše funguje a žádné chyby by se neměly už objevit. Jestli se webu vrátí návštěvnost můžu z vlastní zkušenosti konstatovat, že množství chyb 404 může vést k “penalizaci” webu na Google. Pokud se tak nestane chyba bude zřejmě někde jinde. To ovšem nic nemění na faktu, že vám všem doporučuji v Google Webmaster Tools sledovat chyby v procházení, protože mohou být i tam, kde je prostě nebudete hledat. V mém případě to jsou neexistující stránky, které neměly potřebnou hlavičku 404.

 


Jak bude reklama vypadat?
-
Kup si reklamu navždy pod tímto článkem jen za 100 Kč
Zobrazit formulář pro nákup

17 Replies to “Zlobivej WordPress a podivné chování Google”

  1. Mám web, ktorý má neskutočné množstvo chýb, pretože som na ňom po dlhej dobe menil obsah, návštevnosť z google je takmer nulová. Skúsim tieto chyby kompletne presmerovať na úvodnú stránku, uvidíme čo to spraví

  2. Osobne s tim mam take problemy. Co jsem postrehl Google, tak nejakym zpusobem nachazi nesmyslne URL a pak mi je vypisuje bud jako duplicity nebo jako 404. Jakykoliv krok (at uz hlavicka 301) nebo vymazani odkazu k nicemu nevede a vzdy se obejvi dalsi nesmyslnosti. Tak jsem to prestal resit.

  3. Stejny problem uz resim delsi dobu u vetsiho webu, google si pamatuje desetitisice starych url, ktere uz nefunguji pres rok, o odmita je zacit ignorovat. A novych stranek si moc nevsima :-(

  4. Podle grafů to zatím úplně jistě nevypadá. Napadá mě, jestli to spíš není jen tím, že lidé chodili na stránky, které byli předtím funkční. Když se na ně nedostali, Google je přestal indexovat nebo je posunul dolů a tak návštěvnost klesla. Vliv na celý web by to imho moc mít nemělo.

    1. Radek: jedná se o stránky na které směřují mrtvé odkazy už dlouhou dobu (vracely v hlavičce 404). V podstatě co jsem koupil doménu před pár lety kvůli rankům. V každém případě chyba byla opravena uvidíme jestli se vše vrátí do normálu.

  5. A když jich bude na webu příliš, přijde mi nějaký mail? Jelikož já tam koukám jen na odkazy na články a mno… to je tak vše :D.

  6. Docela náhoda, v rámci pročištění webu sem odstranil jednu část, na kterou už nejméně rok nevedly žádné odkazy a webmasterstools mi začalo hlásit x tisíc 404ek.

    Doufal sem, že si po čase uvědomí, že o nic nejde a odstraní je z přehledu samo .-/

    Jako ručně jedno po jednom se mi to vymazávat nechce, takže zřejmě zbejvá to jen ignorovat, nebo máte nějakou jinou radu?

    Spíš by mě drago zajímalo jaký je vztah mezi pozicemi ve vyhledávání a velikostí nezobrazeného duplicitního “indexu” (jaký je doporučený poměr – 0%, 10%, 30%, 50?.

    Věc se má tak, na stránce mám třeba odkaz, který po kliku rozjede na té samé stránce kompletní hodnocení uživatelů, jenže pro google je to duplicita a rázem si nějak vyhodnotí, že 1/3 “celého indexu” mých stránek je duplicita.

    Trochu mě to znepokojuje, ale zase nechci aby stránky na neregistrované působily polofunkčně když ten odkaz odstraním.

    Je vůbec nějaké čisté řešení jak googlu vysvětlit, že by stránku neměl indexovat? Na nofollow nevěřím a nějaké vypisování jednotlivých stránek je vzhledem k rozsahu nesmysl .-/ Javascript taky asi? nic neřeší, protože Gčko co vím prolejzá i tyhle odkazy…

    Dík za nějaký postřeh.

    1. Razer: Jde o to jestli chceš indexovat i to hodnocení. Počítám že budeš mít něco jako profil.php a profil.php?hodnoceni. Máš dvě možnosti. Na stránku profil.php dát noindex, follow či canonical s odkazem na profil.php?hodnoceni (popřípadě obráceně). Anebo to hodnocení odkrýt například přes javascript (vše bude na jedné stránce). Osobně si ale nemyslím, že by s tím Google nadělal až takové problémy aby z toho byl ban či penalizace. Jednu stránku vyhodnotí jako důležitější a druhou odsune do supplementu, kdyby se ta první stala nefunkční.

      Pokud Google zlobí tak místo 404ky udělej natvrdo redirekt přes 301 na hlavní stránku :)

  7. Taky mne nasere, kdyz resim nejakou zahadu proc to neslape a po hodine si vzpomenu na zlate pravidlo kteremu se linuxaci smeji, ale my odkojeni woknama zkusime vystoupit a nastoupit!!!!

  8. Je vůbec nějaké čisté řešení jak googlu vysvětlit, že by stránku neměl indexovat?

    Ano, co treba robots.txt ?

  9. Nekde nějak google pinknout, že má indexovat jen to co najde na webu?

  10. Drago: To s redirectem je dobrý nápad. A noindex přímo na stránce zní taky docela rozumně. Možnost nějakého blbého vyložení dle třeba parametru v url je zde asi malá.

    Ale jak koukám nějaké hard řešení, které by uživateli na odkaz umožnilo vlízt, ale gbota odradilo asi z principu není.

    Rammi: To je nepoužitelné, aktuálně mám okolo 370.000 indexovaných stránek, + dalších asi 130.000 nezaindexovaných, kdybych to měl vše cpát do robots.txt a aktualizovat v reálném čase moc dobře by to prostě nefungovalo ani z pohledu G, kterej by musel tohohle “obra” vždy celého proskenovat.

  11. google webmaster tools je výborný nástroj, mne už veľa krát nahlásil rôzne druhy chýb, ktoré sa vyskytli na stránkach

  12. Mně emaily posílá přímo redakční systém, když se vyskytne error 500. 404 tedy ne, to by mi jich chodilo až příliš.

    Na vše mám vlastní RS, který se snažím stále vylepšovat, protože k WP nemám důvěru (neznám kód).

Comments are closed.