Shromažďování dat bylo dokončeno

harvest.jpgTak konečně se mi podařilo dokončit proces sběru dat. Délka byla podle průměrných čísel cca 112 hodin. Za tuto dobu jsem získal 821,655 položek do databáze, které lidé používají ve vyhledávačích. Je nutno dodat, že průřezem napříč spekterm různých našeptávačů jasně vyhrál seznam, který obsahoval cca 99,98% všech položek. Ostatní vyhledávače obsahovali to samé až na pár technických výjimek. Tak teď mám databázy o velikosti 58,583KB a jdu se dát do analýzy pro následující dseznam10. Co se dá z těchto dat ukuchtit se můžete kouknout v předchozím postu. Nepočítám, ale že by jsem se do některého z těchto projektů pouštěl protože, protože by to bylo technicky náročné. I když nutno dodat, že by to určitě pár seo expertům pomohlo. Napříiklad na LIKE %notebook% to najde 467 možných kombinací. No nic jdu se dát do práce už tak mám skluz. Letošní úroda bude ale skvělá :)

Share Button
(0)(0)

Jak bude reklama vypadat?
-
Nechceš zde reklamu napořád jen za 121 Kč?
Zobrazit formulář pro nákup

Další články k tématu

9 komentářů

  1. Lení obuv napsal:

    Budeš tento seznam potom zase prodávat?

    (0)
  2. Lení obuv napsal:

    A tyto holá data ne?

    (0)
  3. admin napsal:

    Musím dát do kupy algoritmus ktery vybere vhodné data pro hledanost na seznamu. Současný stav by trval přes 40 dní na všechny testy :)

    Ano plánuju vydat další seznam podobný tomu předchozímu. Rozsah bude zhruba stejný.

    (0)
  4. pepperos napsal:

    Už se těším na výsledky.

    (0)
  5. jirka napsal:

    a celá 58MB databáze k prodeji nebude?

    (0)
  6. admin napsal:

    Upřimně uvažoval jsem o prodeji i těch surovích dat. Dokonce už i přišla konkrétní nabídka od společnosti co dělá SEO. Mají vlastní systém, který jen potřebují nakrmit daty.

    Zatím to zvažuju. Pokud by ale byla nějaká hezká nabídka zrčitě by jsem se nebránil prodeji :)

    (0)
  7. networ napsal:

    covece nekdy zasnu co vymyslis:) ja jsem ted dal scanovani vyhledavacich frazi na jednom ceskem pocitadle a po 100 hodinach to porad pocita. Ale aspon vidim kolik domen uz nefakci (lze pouzit data na MFA ;), kolik frazi je aktualnich a kolik lidi nechce statistiky pro ostatni. v kazdem pripade se ted chystam na mining dat z naseptavace seznamu, ale asi jinou cestou nez mas ty, protoze chci porovnavat i relevanci...

    (0)
  8. M.K. napsal:

    Drago, pokud budeš prodávat seznam opět jako minule na Webtrhu, kdy tak cca předpokládáš datum prodeje?

    (0)
  9. admin napsal:

    Analyza ještě chvilku potrvá, určitě se ale pochlubím jak to probíhá, výsledky jsou zajímavé až "vtipné". Plánuju že vše bude probíhat jako posledně.

    (0)