Měření návštěvnosti vs duplicitní obsah

Google adsense pravidla Duplicitní obsah může nadělat celkem slušnou paseku v SERP. Stále je totiž velká váha kladena na odkazy. Pokud je tedy stránka rozdělena například na článek a perex + komentáře snadno může jeden vtipný komentář přitáhnout větší množství kvalitních odkazů než čistě samotný článek. Moderní trendy u vyhledávačů se naproti tomu snaží ve výpisu výsledků vybírat z více zdrojů. To pak vede k nechtěné situaci, kdy perex + komentáře je preferován nad samotným článkem ve výsledku vyhledávání.

Podobnou situaci může přinést i měření efektivnosti reklamních kampaní, které se objevují v offline světe. Často se používá za doménou například specifické slovo (domena.tld/zima, domena.tld/akce) anebo sleva (domena.tld/sleva, domena.tld/vyprodej). Tady by měl SEM konzultant (search engine marketing) zvednout varovně ukazovaček a doporučit úpravu stránky. I offline reklama totiž má tendence se virálně šířit.

A jak postupovat?

Samotný google tento vývoj předpokládal. Proto prosazuje takzvaný canonical link element. Díky němu se dá specifikovat, která stránka je tou hlavní i když na ní vede větší množství odkazů. Zvláště je užitečný u stránek, kde je větší množství proměnných předávání předáváno přes URL (řazení tabulek, zvýraznění textu na stránce atd.). Seznam také vyzývá tvůrce stránek k používání canonical link elementu.
Lze použít i tag noindex u konkrétní stránky. Primárně však noindex nebyl k tomuto účelu vytvořen. Uvádím to jen jako krajní variantu.
Přeměřování přes 301čku je další z řešení, které se dá použít. V případě odkazů se všechna váha přes ně přenese a nedojde k duplicitní újmě.

Všechny výše zmíněné metody mají za úkol zabránit penalizaci za duplicitu. Zároveň by měli vyřadí z případného SERP všechny neoriginální stránky. Pokud chcete mít na 2 rozdílných URL stejný obsah tak to bez duplicity nejde.

Ještě přidám jeden odstaveček ohledně duplicity. Co je a co není duplicita je občas pro vyhledávače problém. Často se informace šíří internetem tak rychle, že se těžko určuje kdo byl dřív. Někdy je jen mírně pozměněna konkurentem a hned zveřejněna s tím, že se očekává brzká aktualizace. Do toho všeho jsou tu pak různé parserovací servery, které dokonale všechno ještě zamotají. Google se většinou přiklání na stranu toho důvěryhodnějšího hráče. Pokud publikujete jednou za týden nesmíte se divit, že parserovací server je z vašim nadpisem před vámi. Pak nezbývá než si pohrát s RSS a posílat dál jen perex. Ohledně CTRL+C, CTRL+V kopírování to může být problém.

Jednoduchý příklad. Před nějakou dobou jsem psal článek o .free doménách. Když zadáte do vyhledávání na google “Už je to tak. Od 1.11.2010 je možné na adrese dotfree.com v rámci Pre-registration period” uvidíte nejdříve výsledky na webtrh.cz, kam to nakopíroval jeden z webtržníků jako citaci a pak teprve můj blog, kde je originální věta. Důvodem je, že webtrh je daleko důvěryhodnější než 404m.com. Proto stačí, aby se tam objevil kopírovaný text, klidně i s odkazem na originál, a google jej bude upřednostňovat.

Ok teď fakta

Podle českého práva je to naprosto v pořádku. Jedná se o citaci s uvedením odkazu na originál.
Google tu není od toho, aby vaše články byly na prvním místě jen proto, že jsou originální. Podle svého algoritmu usoudil, že přínosnější je debata na webtrhu.

Samozřejmě jednalo se jen o jeden článek. Diskuzní fóra jsou tu od toho, aby se šířily informace dál. Existují však i weby, které stahují velké množství obsahu, které jim nepatří a bez patřičného uvedení zdroje jej pak vydávají za svůj obsah. To je problém, protože chvilku trvá než na to vyhledávače přijdou a hromadně pak tyto weby penalizují (nikoliv jednotlivé stránky, ale rovnou weby). Například na seznamu je možné tyto weby hlásit, ten reaguje většinou rychleji než google, kde pokud se nejedná o přečin ve větším rozsahu tak až moc váhá.

No už s článkem končím, na to že jej píšu s přestávkami od 6ti odpoledne jsem se dostal někam úplně jinam.

Jak bude reklama vypadat?

Kup si reklamu navždy pod tímto článkem jen za 100 Kč

Zobrazit formulář pro nákup

5 Replies to “Měření návštěvnosti vs duplicitní obsah”

Podnikatel napsal:

18.1.2011 (4:36)

Pěkný článek!

Taky jsi mohl uvést odkaz na Parser.cz a ne o něm jen vykládat ;-)
Jan Zaškolný napsal:

18.1.2011 (9:17)

Doplnil bych, že problém nemusí být jen kvůli offline kampaním, ale taky kvůli různým trackovacím kódům (např. WebTrends) nebo přesunům obsahu v rámci webu.
Deny napsal:

18.1.2011 (13:09)

Tak tohle jsou moc zajímavá data. Díky
Turek napsal:

18.1.2011 (22:41)

Já si nedokáži představit jak by mohl nějaký algoritmus porovnávat duplicitní obsah. U nějakých okrajových témat ještě dejme tomu, ale když si představím nějaké hlavní témata a třeba anglický jazyk, tak si to porovnávani nedokáži představit. Když nevím proti které stránce porovnávat, do jaké minulosti, to by bylo asi an hardware dosti náročné.
MzK napsal:

22.1.2011 (12:43)

takže duplicita nevadí, jen se to s ní musí umět. mno já se přiznám, že jsem dříve měl s duplicitou problémy, různé rss parsery měly lepší pozice. Tak jsem jim IP zablokoval…