Po mnoha útrapách, chybách v propočtech a 2x opravované databázy se mi konečně podařilo dokončit dseznam10. Sice se spožděním asi 12 dnů, ale je tady. Co vám tedy nová verze přináší.
Pomocí slovníků z domainwalkera a náhodněho generátoru se mi podařilo získat z několika zdrojů celkem 821,714 slovních spojení, které lidé používají při hledání na interentu. Nakonec se ukázalo, že přes 90% se kryje s našeptávačem seznamu.Takže z tohoto neuvěřitelného množství slovních spojení jsem pomocí nástrojů google vybral 63,291 výsledků do nového dseznamu. V seznamu najdete 24,618 výsledků s rozšířenou shodou a 7,275 s přesnou shodou. Ostatní výsledky jsou fráze, které mají více jak 35000 google výsledků pokud je dáte do úvozovek na google.cz.
Celkové statistiky:
Položek: 63291
Položek s přesnou shodou: 7275
Položek s rozšířenou shodou: 24618
Položek s google hits: cca 63000
O shánění dat i metodice jsem toho tady napsal už hodně.
Teď máte šanci si tento seznam koupit na webtrh.cz
Teda Hujere, co ta hrubka? To jsou chyby…
super:)
prave dokoncuji taky svuj scan, pac jsem nemohl tveho dockat ;) dseznam9 uz neni moc aktualni…
Super
Zajímalo by mne kolik lidí si to už koupilo?
Diky, diky, minulej seznam jsem nestihl, dal sem si te do RSS a desitkou jsem prave zaplatil :) Delas vybornou praci ;-)