Jeden nepovedený test

Párkrát jsem v příspěvcích zmínil, že mám web, který čeká na Panda Farmera. Chtěl jsem si otestovat jak v praxi vypadá taková penalizace, důkladně jí zaznamenat a popsat. Včera to bylo přesně půlroku od založení a stále nic. Vlastně z pohledu toho co jsem se snažil udělat to dopadlo doslova katastrofálně.

Takže co jsem se to vlastně snažil udělat. Před půl rokem jsem byl přesvědčený, že Panda Farmer má chránit kvalitní obsah a likvidovat weby s velkým podílem duplicity. Vzhledem k tomu, že v ČR jsem se s žádným jasným případem nesetkal rozhodl jsem se, že web bude anglicky. Koncept byl ideální. Autoblog postavený na kopírování obsahu s autoritativních zdrojů, které mají spoustu zpětných odkazů a rychlou indexaci.

Vzhledem k tomu, že jsem nic podobného nedělal část jsem přebral z různých návodů, nějaké know how z diskuzních fór a zbytek musel domyslet, jak to zhruba chodí. Základem byl WordPress a plugin Syndicate. Free šablona twenty eleven, All in One SEO Pack, Google XML Sitemaps, PHP Text Widget, WP Super Cache a Raven’s Antispam. Poslední zmiňovaný nebyl potřeba, protože komentáře byly stejně vypnuté. Nedával jsem tam žádnou reklamu. Ostatně mělo to být město duchů.

Celkem jsem tam nacpal něco přes 42 RSS kanálů. Podle výše zmíněných kritérií. Dbal jsem na to, aby každý zdroj měl GPR minimálně dva, historii a slušné odkazové portfólio. Bez toho by se mohl ten můj experiment dostat v některých vyhledávačích nad originál a  to rozhodně nebyl můj úmysl.

Do deníku jsem si nezaznamenal všechny kroky offpage optimalizace, mám tu jen vytvoření a propojení twitter účtů, využití like služeb (like, share, tweet, retweet, +1). Vím že na to padlo celkem dost kredit a bylo to rozdělené zhruba na dva měsíce. Určitě jsem to ale v té době ještě někam nacpal – zpětné odkazy z různých seomatů, automatické registrování do zahraničních katalogů a podobný humus. Ale nic velkého protože jsem měl políčeno na Pandu ne Tučňáka.

Aby jsme nezapomněl. Skript na kontrolu RSS nebyl napojený na cron. Aktualizoval se pomocí návštěv. V pravidelných intervalech jsem tam pouštěl lidi z takového toho automatického surfu. Dá se nastavit příděl kreditů, třeba každou hodinu. Používám to na suplování crona :)

Po dvou dnech měl autoblog 534 blogpostů a sledoval jsem aktivitu v Google Webmaster Tools.

Za zhruba dvanáct dní už 907 blogpostů. Některé se začali objevovat ve vyhledávači a zaznamenal jsem i příchody z nově vzniklých zpětných odkazů. Na doménu už dříve vedly zpětné odkazy, dokonce měla GPR 2. Objevilo se několik reálných twitter followerů. Celkem bylo publikováno 205 tweetů.

Měsíc na to se něco začalo dít špatně. GWT sice hlásil že z 1759 blogpostů je pouze 322 indexovaných, ale začali přibývat zpětné odkazy. Nevím kolik jich bylo na začátku ale 860 rozhodně ne. Vzhledem k počtu indexovaných souborů jsem byl přesvědčen, že Google rozeznal duplicitu a bude to řešit tvrdě.

Další dva měsíce se penalizace nekonala. Záznam z 8.11 mluví o poskočení GPR z 2 na 3.

Poslední oficiální záznam je z 5.12. 1328 odkazů z 98 domén podle GWT. Další přibývají. Návštěvnost se vyškrábala na cca 1800 lidí/měsíc. Na grafech z Google Analytics se začínají objevovat hrboly, po bližším zkoumání zjistím, že na to lidé odkazují z diskuzních fór a blogů, místo originálního článku. 1180 lidí chodí z Google, 140 baidu, 58 bing, 22 facebook, 10 yahoo, 5 babylon, 4 ask, 4 yandex a dokonce 3 seznam. Je jasné, že se experiment nedaří. Odkazy začínají vznikat naprosto přirozeně.

V prosinci mi také píše jeden z webmástrů ať stáhnu jeho RSS export. Omluvím se mu a vysvětlím, že jde o test, kdy chci dostat ban a všechny posty od něj smažu. Odpověď je, že mi to moc nejde protože jsem ho “outrankoval”. Tady už mi to začíná vadit. Říkám si, že pokud se Panda neobjeví do půl roku tak to mažu.

13.1.2013 jsem vypnul aktualizaci. Nechám tam dojet jen aktuální obsah.

Takže je to půl roku. Web se má k světu. Počet návštěv z vyhledávačů narůstá (Krom Google, tam mi to rozbila ta 404ka. Po opravě se to teprve vrací do normálu.). Počet indexovaných souborů v GWT ze sitemap je 3850/4304. GPR je stále na 3. Návštěvy z vyhledávačů mají podíl 68%. Počet odkazů je teď 1432 ze 100 domén.

Závěr

Chyba byla zřejmě v doméně, kterou jsem projektu přidělil. Její historie se datuje do roku 2004. Do začátku měl tak projekt autoritu i ranky (v té době 2, v době odchytu domény měla 4). Odchytl jsem jí kvůli parkování. Zpětných odkazů bylo na začátku možná pár stovek. Měla to být ochrana před tučňákem a ulehčit rozjezd.

No co dodat. Na celém tom autoblogu byl originální jen nadpis a upozornění v spodní straně, jak zažádat o odstranění. Jinak nic. Takovýchto projektů by se dalo provozovat stovky a jediný problém je automatická aktualizace WordPressu. Popravdě pokud by to Google zaplácl, stále tam bude dost návštěvnosti z ostatních vyhledávačů a přirozeně vytvářených odkazů. Dokonce i sociálních sítí.

Web ještě pár dní pojede, kvůli ověření teorie s opravou chyb 404. Pak na ní dám buď nějaké minisite anebo rovnou zaparkuju.

Věnováno Panda Update #24, který vyšel 22.1.2013, snad už konečně k něčemu budeš.

 


Jak bude reklama vypadat?
-
Kup si reklamu navždy pod tímto článkem jen za 100 Kč
Zobrazit formulář pro nákup

31 Replies to “Jeden nepovedený test”

  1. Drago super článok práve pre takéto veci chodím na tvoj blog a už som bol vcelku zúfali lebo v posledných dňoch nikto nič zaujímave nepíše.

    1. bobo: ono se toho teď moc nového neděje. Zahraniční SEO zdroje stále “ujíždějí” na tom samém. Tuzemské řeší víc konference a přednášky. Snad se to v únoru zlepší a bude o čem psát :)

  2. Zajímavé. Takže to s Pandou asi nebude tak žhavé, jak by si někteří přáli :)

  3. Dobre si zrobil, dobrá analýza, škoda toho, že si to robil na doméne s históriou. Myslím, že by boli iné výsledky, ak by to bola nová zaregistrovaná doménka.
    “Tuzemské řeší víc konference a přednášky” a na tom sa tiež zhodneme :D

  4. A ešte otázočka, keď to už malo takú vcelku slušnú návštevnosť 2k UIP/mesiac skúšal si ten web aj nejak monetizovať ?

  5. Rozumim dobre, ze si z RSS stahoval pouze nadpis a prvnich par desitek/stovek znaku? Pokud by to tak bylo, tak je to hukot. Polozit zdrojovy web diky prekopirovani prvniho odstavce… :)

    1. bobo: Dal jsem tam jeden automatický systém na prodej zpětných odkazů, ať si na sebe vydělá doména. Prodal se tuším jeden odkaz v patičce.
      Unreal][: Kdepak komplet články se vším všudy, včetně obrázků a dokonce jsem tam zahlédl i nějaký PPC systém. Pod každým článkem byl odkaz na zdroj.

  6. To bohužel jenom dokazuje, že Google je nadále debilní a nedokáže poznat originální post od kopií a dokonce je schopen plagiátora pozvednout nad původní zdroj. O to horší je, že i u zjevně masivně kopírovaných RSS agregátorů není schopen zasáhnout a tím pádem bude pořád hejno zmetků vykrádat lidem blogy a weby a ještě na tom profitovat.

    1. Petr: Úplně všichni ne, ale velká většina.

      basti: přemýšlel jsem nad tím proč se to rozjelo, když na začátku to bylo všechno dole. Domnívám se, že Google to hodně kazí i konkurence. Na ní se článek dostane někam nahoru, pak vzniknou zpětné odkazy a ty tlačí na Google. To je ale jen spekulace.

  7. V únoru taky něco podobného chci vyzkoušet, ale na nových doménách, takže spíš počítám, že mě to ani nepustí do vyhledávání… Ale nebude to agregátor jako u tebe.

  8. To že tě Panda nenavštívila není v tom, že jsi měl doménu s historií. Nejmenovaný web je postavený taky na Rss čtečkách a má PGR4. Doména syrová bez historie. Asi to bude o tom, že se vždy agreguje tématicky shodný obsah a je na jednom místě z různých zdrojů, což je pro běžné uživatele přínosné, nemusí překlikávat a hledat to co je zajímá na více webech. A protože to Google vyhodnotí jako přínosné, tak proč by tě penalizoval?

  9. už vidím decká z webtrhu ako práve teraz inštalujú WP a pridávajú RSS s vidinou zaručeného úspechu. Myslím že si viacerých motivoval :-)

  10. To Prague: možná máš pravdu, že to může být přínosné pro běžné uživatele, ale zcela jistě to poškozuje původní zdroj. Tím, že kradený obsah seskupím s dalším kradeným obsahem přece krádež toho obsahu nelegalizuju. Možná Google potřebuje ještě nějaké další zvířátko, aby tento problém vyřešil, pokud by toto nebylo cílem pandy.

  11. No pred x-lety jsem spustil nejakej youtube script a po x-mesisich, mozna.po roce jsem tu penalizaci chytil. Projevovala se tak, ze navstevnost z googlu byla jen do 100uip/den, predtim byla x-tisic uip/den. Pokud chcete zkouset podobny veci, tak doporucuju natahnout data do databaze a na web je tahat pres vyhledavani/slovni spojeni. Takze bud ten youtube web, predpripravit nekam na podstranku par desitek slovnich spojeni a o zbytek se postaraji tagy z youtube api pres ktere budete generovat dalsi stranky. Dalsi reseni je vzit seznam klicovejch slov/slovnich spojeni z nekolika udelat menu a stranky generovat/hledat dle tech slovnich spojeni, obsah jde brat treba z tech rss nebo z api vyhledavacu (vlastne to je vyhledavac s prepripravenejma vysledkama a povolenym indexovanim). Pri dobrym nastaveni (ani malo ani moc int/ext odkazu, vhodne namixovanej obsah a vhodna volba slov (mala konkurence + vysoka hledanost) se da pres longtail dosahnout nekolik stovek az tisic uip/den. Ale casem dosanete ban.

    Nejlepsi vybrat malo konkurencni drahy slovo, na nej udelat 20 str. web s vlastnim obsahem a pokud tam zacnou chodit lidi, tak podle spojeni na ktery chodej dal budovat obsah…

  12. Zkoušel jsi svůj web napráskat na Googlu? Jinak osobně si myslím, že to chtělo ještě alespoň půl roku. Ono webů je hodně a tak chvíli trvá, než Panda okouše špatné listy z celého internetového stromu ;-) Jeden můj web jel taky hodně dlouho, než na něho Panda přišla.

  13. No pěkně
    Test se ti sice nepovedl, ale něco se ti povedlo hodně dobře
    A to nastartovat éru tématických agregátorů článků v anglickém jazyce běžících na WP :D
    To se ti fakt povedlo

    1. Petr Jeník: Těch pár nových už se v té haldě existujících ztratí.
      Bjoe: To jsem nezkoušel. Chtěl jsem zaznamenat přirozený proces ne nějakou ruční penalizaci. Půl roku stačilo, teď půjdu testovat něco jiného :)

    1. Angeloo123: to jsem neuváděl schválně. Když by jsem to prozradil, přišlo by tam spousta lidí a rozhodili výsledky. Potřebuju to nechat v přirozeném prostředí :)
      Opravdu není o co stát, klasický WP + předinstalovaná šablona 2011, pluginy jsem vypsal v článku. Na stránce je vždy 5 nezkrácených postů. V pravém sloupci nejnovější posty a dole pro webmástry návod na vyřazení rss z indexu. Nic víc.

  14. Tak ono bude stačit, až ty agregátory začne AdSense, Sklik a podobné systémy vyhazovat a bude klid. 90% agregátorů natlačí k těm agregovaným článkům reklamu a hotovo, sám vidím, kolik mých webů je v agregátorech. Ano jsou tu i agregátory, kde to problém není, je jich ale jen pár.

  15. Velmi zajímavý test, ještě zajímavější výsledky a perfektní článek! :-)

  16. Možná je půl roku u zdroje, který se masivně updatuje a navíc kopíruje zdroje rychle, málo. Navíc pokud články získají odkazy a ohlasy ze sociálních sítí, tak to vyřazení zabrání. Mně se pravidelně zdá, že pokud hledám programátoskou dokumentaci, nacházím stránky, poskytující prakticky shodné informace (výpisy dokumentace).

  17. Drago je to sice hezký test, ale, co se týče agregátorů rozhodně to není nová věc. Léta chodím nakupovat různé weby na Flippu a po affilech na Amazon jsou agregátory druhou nejčastější položkou na prodej. Jelikož jsem jich též x měl mohu sem napsat i své zkušenosti.

    1, Krátkodobě jde skutečně návštěvnost nahoru
    2, Jde to sice problematicky monetizovat (uživatelé fakt narozdíl od běžných webů na reklamu na agregátorech neklikaji), ale pár dolarů měsíčně to bez problému vydělá.
    3, Po čase přijde jak já to nazývám “plíživý ban”. Prostě návštěvnost začně klesat až na jednotky denně.
    4, Není tak až tak nízkonákladová záležitost jak se zdá. Tahání RSS feedu je relativně výkonově náročná záležitost a jakmile máte vícero RSS webu (v jednom to nemá smysl, bez pomocné synergie ostatních ta návštěvnost prostě není) tak těch dotazů je festově a na nějaký základní tarif od wedosu můžete zapomenout.
    5. No a nakonec když už chcete dělat RSS agregátory tak je lepší je tvořit na prodej, za hezky udělaný agregátor se dá utržit 50-80 dolarů což je obvykle více než stihne vydělat než dostane “plíživý ban”.

  18. Dokud Google nezasáhne proti agregátorům sám, tak prostě agregátory budou, o tom žádná.

    Práskání funguje ale pouze u prodeje odkazů.

  19. Nebylo to tu nikde zmíněno, ale v jakém jazyce byly-jsou ty RSS kanály? Je všeobecně známo, že mimo EN a ES ještě ostatní jazyky nepoznaly středověk….

  20. Domdigger: Drago píše v článku, že je web anglicky, takže i zdroje předpokládám budou v EN.

    Asi by to chtělo zkusit znovu na nové doméně.

    Jinak automatická aktualizace WordPressu je možná, nabízí jí některé zahraniční hostingy, jako například Dreamhost nebo Hostgator.

  21. Článek mě opravdu hodně zaujal, protože sám provozuju agregátor zpráv z českých herních webů. Problém je v tom, že návštěvnost mého webu je na rozdíl od toho Dragova od počátku dost mizerná – max. desítky lidí denně. Web jsem vytvořil jako takový svůj “pet” projekt, ale to že o něj není zájem mě samozřejmě mrzí, obzvlášť proto že jsem si s ním docela vyhrál – custom web s vlastní šablonou, odstraňování duplicit, fulltext vyhledávání v archívu, kde je už přes 40 000 článků. Na rozdíl od Draga zobrazuju jen abstrakty článků – celé články nejsou u zdrojů které používám k dispozici.

    Zajímaly by mě vaše názory a rady, jak bych mohl svůj web oživit. Doménu jsem registroval jako novou – žádná historie předchozích projektů a GPR 0. Dnes je GPR 2.

    Chtěl jsem tímhle příspěvkem mimo jiné ukázat, že nestačí jen vzít kopu RSS feedů, nasadit je na WP a pak už jen spokojeně sledovat Google Analytics.

Comments are closed.