Po mnoha útrapách, chybách v propočtech a 2x opravované databázy se mi konečně podařilo dokončit dseznam10. Sice se spožděním asi 12 dnů, ale je tady. Co vám tedy nová verze přináší. Pomocí slovníků z domainwalkera a náhodněho generátoru se mi podařilo získat z několika zdrojů celkem 821,714 slovních spojení, které lidé používají při hledání na interentu. Nakonec se ukázalo, že přes 90% se kryje s našeptávačem seznamu.Takže z tohoto neuvěřitelného množství slovních spojení jsem pomocí nástrojů google vybral 63,291 výsledků do nového dseznamu. V seznamu najdete 24,618 výsledků s rozšířenou shodou a 7,275 s přesnou shodou. Ostatní výsledky jsou fráze, které mají více jak 35000 google výsledků pokud je dáte do úvozovek na google.cz. Celkové statistiky: Položek: 63291 Položek s…
Pokračovat ve čtení dseznam10 dokončenRubrika: Deníček
Filozofie MFA webu
Následující článek je brán velice filozoficky, proto pokud nemáte náladu tak jej radši přeskočte. Nic nového se nedozvíte, jenom se budete muset zamýšlet nad neřešitelnými otázkami.
Pokračovat ve čtení Filozofie MFA webuDirecto Extreme edition
Systém directo.cz už všichni znáte, takže není nutné snad nic dodávat. Snad jen, že poslední problém s přesluhováním reklam už dořešili a teď už by vše mělo fungovat jak má. Pokud vím, tak je directo.cz druhým pokusem v dějnách ČR/SR o přímí prodej reklamy přes katalog. Většinou se říká že až ten třetí je opravdu úspěšný. Zkusil jsem si teda představit jak by mohla vypadat třetí generace tohoto systému. Na svou stránku si dáte kód, který bude zároveň zjišťovat informace o návštěvnících podobně jako google analytics. Podíl cz/sk, kolik přichází z vyhledávačů, regionální zastoupení atd. Prostě si vezmeme že google analytics pracuje pro Directo Extreme edition. Kromě toho že poslouží jako kvalitní informace o návštěvách navíc všechny data může poskytnout…
Pokračovat ve čtení Directo Extreme editionNěkde se stala chyba, aneb nedomyšlenost…
Dneska se jako obvykle probudím (ještě se mi nestalo že by ne) a jdu zkouknout emaily. A hle vidím tam úžasnou reklamu od amazonu. —- Dear Customer, As you’ve bought World of Warcraft products before, we thought you might like to know that the new expansion Wrath of The Lich King is available for pre-order here at Amazon.co.uk. As the wait for the icy domain of Arthas to open shortens, we’ve timecards and other essentials to help you prepare for the next step in your adventure. — Což říkáte si perfektně načasovaná reklama pro někoho kdo už nakoupil. Krásný příklad vedení záznamu o klientovi a podstrčení vhodného lákadla. Jenomže ono to má jedno krásné ale. Firma amazon nezasílá počítačové hry,…
Pokračovat ve čtení Někde se stala chyba, aneb nedomyšlenost…Zveřejnení seznamu se protáhne
Pro všechny kdo mi píšou jak to vypadá se seznamem dseznam10: Protahuje se to z důvodu roizsahu. Nečekal jsem, že skenovaní bude tak dlouho trvat. Z celkem 821,655 slovních spojení, které lidé hledají na internetu už prošlo výběrem vhodných slov na otestování hledanosti 389,203, což je cca 43%. Tyto vybrané slova jsou pak testována na hledanost. Zatím statistiky ukazují na 11,886 rozšířené shody a 4,324 přesné shody. Odhaduju že v konečné verzi bude tak 2x tolik u obou položek. Rozsahem by pak měl seznam být daleko lepší než jeho předchozí verze. Odhad kdy bude dokončen teď nedokážu říct, skenování je poslední dobou pomalejší. Určitě ale dám ještě vědět.
Pokračovat ve čtení Zveřejnení seznamu se protáhneVtipný SEO efekt
Teď koukám na statistiky návštěvnosti na google analytics. Prohlížím keywordy přes které se lidi na 404m.com dostali a nestačím se divit. Vlastně jsem to i tak trochu čekal. Vzpomínáte si na článek Z dragovi kuchyně? Trochu jsem se tam chlubil těmi nashromážděnými daty. Jako příklad rozsahu jsem uvedl i jaké kombinace slov se vážou ke keywordu bradavky. No a teď mi chodí lidi z vyhledávačů a hledají tady „bradavky bartošové“, „citlivé bradavky“ popřípadě „bradavky tmavé“. Jedná se o pár přístupů, překvapivě ze seznamu, kde jsem na uctihodném 5tém místě. Doufám že tady nebude hledat něco jako poloha 404. To by jsem už fakt dal redirekt na stránku nástroj nenalezen :)
Pokračovat ve čtení Vtipný SEO efektVelké projekty
Vím, že asi budu denska trochu „ukecanější“ než obvykle, ale je to protože nemůžu dělat nic jiného. Právě teď na pozadí apache a přechroustává hromadu dat. Při sběru to bylo v pohodě, člověk mohl dělat na nějakém projektu popřípadě hrát World of Warcraft, bouhžel teď jedou 2 programy. Jeden tak trochu zněužívá google aby označil vhodné kandidáty na test hledanosti. Ověření už je pak právě na tom druhém. Jenomže tahle sranda přináší latency nad 1500 a to toho moc nenahraju. Naštěstí psát stále můžu. Sice by asi bylo zajímavé procházet už konkrétní výsledky co z toho lezou, ale už mám toho harvestování a práci se seznami za celý týden plné zuby a tak se od toho chci držet dál. Určitě…
Pokračovat ve čtení Velké projektyShromažďování dat bylo dokončeno
Tak konečně se mi podařilo dokončit proces sběru dat. Délka byla podle průměrných čísel cca 112 hodin. Za tuto dobu jsem získal 821,655 položek do databáze, které lidé používají ve vyhledávačích. Je nutno dodat, že průřezem napříč spekterm různých našeptávačů jasně vyhrál seznam, který obsahoval cca 99,98% všech položek. Ostatní vyhledávače obsahovali to samé až na pár technických výjimek. Tak teď mám databázy o velikosti 58,583KB a jdu se dát do analýzy pro následující dseznam10. Co se dá z těchto dat ukuchtit se můžete kouknout v předchozím postu. Nepočítám, ale že by jsem se do některého z těchto projektů pouštěl protože, protože by to bylo technicky náročné. I když nutno dodat, že by to určitě pár seo expertům pomohlo. Napříiklad…
Pokračovat ve čtení Shromažďování dat bylo dokončenoDragův tajný SEO projekt
Poslední dobou toho o SEO slyším tolik v teoretické rovině, že mám pocit že snad ani v praktické neexistuje. Už jsem dělal pár pokusů na doménách, které jsem nevyužíval, tentokrát jsem se ale zaměřil pouze na google a seznam. Nejsem žádný seo guru, a proto to co zkouším je spíše na úrovni něco udělám a jak na to zareagují vyhledaváče. Pro svůj projekt jsem potřeboval vysoce konkurenční slovo, které však v kombinací slov musí mít prakticky neomezené množství kombinací. Bouhžel vám nemůžu říct o co jde, protože by jste se tam pak šli určiě podívat a statistiky by byly pak nepoužitelné. Nebojte se až s tím skončím tak sem dám hrdě odkaz. Zároveň mi šlo o to ověřit si pár…
Pokračovat ve čtení Dragův tajný SEO projektHarvestování dat je nuda
Už ani nevím kolikátý den to vlastně můj komp jede v kuse a shání surová data pro nadcházející projekty. Na kontrolce mi hlásí Session 110900 což odpovídá zhruba 55% pokroku. Bouhžel dneska v sedm ráno nám vypnou poud takže budu muset kompa na noc vypnout. Konečně si alespoň odpočine. Zatím jakýkoliv pokus o urychlení scanu měl negativní dopad, takže jedu standatně přes 3 proxy servry. Pokud někdo plánujete, že budete nějakým způsobem shromaždovat slovní spojení tak vás od toho musím odradit – je to vážně nuda. Takže co si od toho ultra zdlouhavého projektu vlastně slibuju? Jakmile budou data stažena (počítám tak 70MB MySQL) začnu jejich analýzu. Pomocí několika algoritmů je postupně vytřídím na ty použitelné a zbytečné. Vyberu z…
Pokračovat ve čtení Harvestování dat je nuda