dseznam10 dokončen

Po mnoha útrapách, chybách v propočtech a 2x opravované databázy se mi konečně podařilo dokončit dseznam10. Sice se spožděním asi 12 dnů, ale je tady. Co vám tedy nová verze přináší.

Pomocí slovníků z domainwalkera a náhodněho generátoru se mi podařilo získat z několika zdrojů celkem 821,714 slovních spojení, které lidé používají při hledání na interentu. Nakonec se ukázalo, že přes 90% se kryje s našeptávačem seznamu.Takže z tohoto neuvěřitelného množství slovních spojení jsem pomocí nástrojů google vybral 63,291 výsledků do nového dseznamu. V seznamu najdete 24,618 výsledků s rozšířenou shodou a 7,275 s přesnou shodou. Ostatní výsledky jsou fráze, které mají více jak 35000 google výsledků pokud je dáte do úvozovek na google.cz.

Celkové statistiky:

Položek: 63291

Položek s přesnou shodou: 7275

Položek s rozšířenou shodou: 24618

Položek s google hits: cca 63000

O shánění dat i metodice jsem toho tady napsal už hodně.

Z Dragovi kuchyně

Harvestování dat je nuda

Shromažďování dat bylo dokončeno

Zveřejnení seznamu se protáhne

Teď máte šanci si tento seznam koupit na webtrh.cz


Jak bude reklama vypadat?
-
Kup si reklamu navždy pod tímto článkem jen za 100 Kč
Zobrazit formulář pro nákup

5 Replies to “dseznam10 dokončen”

  1. super:)

    prave dokoncuji taky svuj scan, pac jsem nemohl tveho dockat ;) dseznam9 uz neni moc aktualni…

  2. Diky, diky, minulej seznam jsem nestihl, dal sem si te do RSS a desitkou jsem prave zaplatil :) Delas vybornou praci ;-)

Comments are closed.