Panda vám s kradeným obsahem nepomůže

Už je to nějaký ten měsíc co Google spustil nový algoritmus na odstraňovaní duplicity, obsahového spamu a stránek s nízkou úrovní obsahu, který získal přezdívku Panda, Farmer či moje oblíbena varianta prostě Panda Farmer. Původní předpoklady ovlivnit až 5% výsledků SERP se proměnily v děsivou skutečnost 12 – 16%. Bez milosti byly zasažené malé stránky, které nikoho nezajímají, ale i části velkých webů čítající deseti tisíce stránek.

Na začátku byl Panda Farmer přijat s poměrně velkým nadšením, protože postupně čistil výsledky vyhledávání od odpadu. Při hledání hlavně long tailu se už nezobrazovala v SERP stránka blogera a pod ní desítky MFAček, které prostě zkopírovaly texty. Zasaženy byly i různé RSS agregátory.

Poslední dobou se  začaly objevovat na fórech posty nespokojených webmástrů, z velké části blogerů, že Panda Farmer nějak nefunguje. Jejich weby jsou penalizované za duplicitu, protože jejich těžce vytvořený obsah kopírují autoritativní weby. Právě Panda Farmer tomu, ale měl zabránit. Místo toho však trpí tvůrci obsahu. Případům se ale nevěnoval moc velký zájem ze strany odborníků. Tedy až doposud.

Outranked

Právě slovo Outranked použil včera Bryan Crow na stránkách SeoMoz ve svém článku Post-Panda, Your Original Content is Being Outranked by Scrapers & Partners. Princip tohoto efektu je jednoduchý. Pokud v krátké době po sobě vydají dvě stránky stejný obsah nahoře bude ta s větší autoritou. U nás je to celkem běžná praxe. Například některé moje články bývaly převálcovávány RSS čtečkami s větším množstvím autority. Takže na specifické dotazy jsem byl až na druhém místě, zatímco můj článek v nich na prvním. Jednoduše řečeno prostě jsem byl přerankován :)

Na druhou stranu SERP stránek není brutálně “Pandován”. Zůstanou na titulní stránce většinou oba články. Jen ten s lepší autoritou nahoře. Co ale pokud jedna stránka bude zaindexována rychleji než ta druha. Oficiálně google přiznal, že věk stránky neurčuje podle data jejího založení, ale podle data, kdy jí navštívil googlebot. A všichni moc dobře víme jaký velký rozdíl je v procrawlování stránky, která se aktualizuje párkrát do měsíce a stránky, kde dochází k denní aktualizaci. Pokud tedy jednou za měsíc napíšete článek, přes RSS to zaznamená robot, okamžitě vše okopíruje a vystaví na stránky Ukradneme.ted. Následně to procrawluje googlebot, protože stránky Ukradneme.ted přidává nový obsah frekvencí 20 článk/den. Okamžitě zařadí do indexu jako hot news. Po týdnu se googlebot jen tak ze zvědavosti rozhodne navštívit originální stránku a najde tam článek co už týden visí na Ukradneme.ted. Mno nevím jestli Panda Farmer vytáhne motyčku a odplevelí index google od kopie na Ukradneme.ted.

Nejhorší na tom je, že by takhle mohly utrpět stránky kvalitních autorů, kteří něco umí a rádi se jednou za čas podělí o své zkušenosti.

Jak se bránit

Předně je třeba říct, že Panda Farmer zatím na české zahrádce neřádí. Algoritmus je cílen pouze na anglicky psanou část internet, takže u nás vás za duplicitu nikdo nevyhodí ze SERP. Na druhou stranu různé RSS čtečky s nadpisem vašeho článku váš určitě předběhnout můžou. To není sice zas takový problém, protože přebírají většinou jen perex a návštěvníka vám nakonec stejně vrátí. Na druhou stranu robotem se kopíruje i u nás. Často i s odkazy a obrázky.

Bojovat budete muset na dvou frontách. První je zařídit, aby google dostal zprávu o tom, že jste něco nového napsali. K tomu slouží například nalinkování RSS feedu do Google Webmaster Tools. Anebo využití externí služby jako feedburner.com (vlastní jí google) a linkovat RSS přes ní. WordPress navíc má zabudovanou službu na “pingnutí” určitých služeb, které google sleduje, aby něco zajímavého nezaspal. Najdete to v Nastavení -> Aktualizační služby. Asi tam máte jen jednu položku, takže pokud chcete zburcovat polovinu internetu připravil jsem menší “pinglist“. Dále neuškodí hodit váš nový post na twitter a facebook. Ideálně použijte zkracovač goo.gl. Nebojte on už si to ten google nějak dá dohromady.

Další frontou je do svého článku dát nějaké selfpromo. Například pod článek odkaz na autora, odkaz na článek ve zkrácené verzi, popřípadě slovní spojení “Tento článek byl publikován na stránkách 404m.com”. Pokud používáte své vlastní ilustrační obrázky, není problém do nich nenásilným způsobem umístit adresu domény. Teď mě napadá, když jsem vydělával na adultu, tak se dalo nastavit, že obrázky se nezobrazí, pokud na ně není linkováno přímo z domény, kde jsou. Už si to sice nepamatuju, ale neměl by to být problém dohledat.

Závěr

Asi největší obrannou je mít dobrou čtenářskou základnu a spoléhat se na SEO co možná nejméně. Na druhou stranu s narůstajícím obsahem po kterém je poptávka bude přicházet z vyhledávačů stále více a více návštěvníků. Stačí se kouknout na webtrh. Velké množství odpovědi v kombinaci s dobrou optimalizací a rostoucí autoritou jej neustále posilují. Čím více tam bude obsahu, tím více lidí tam bude chodit z vyhledávačů.

Další zdroje informací

 


Jak bude reklama vypadat?
-
Kup si reklamu navždy pod tímto článkem jen za 100 Kč
Zobrazit formulář pro nákup

4 Replies to “Panda vám s kradeným obsahem nepomůže”

  1. Zajímavé a nebylo by jednoduší udělat nějakou funkci, aby novej článek šel přes RSS až třeba za hoďinu ?

  2. Dobré je mít i RSS přidané do Google Reader. Tak se mě stává, že minutu (sic!) po dopsání článku je už v indexu.

  3. Linkovani obrazku z cizich webu se da zamezit par radky v .htaccess. Idealne zamenit za obrazek obsahujici upozorneni, ze obrazek je z te a te domeny.

Comments are closed.