V rámci dalších pracovních povinností jsem úplně zapomněl na můj projekt Aldnoah, který využívá databáze SC8. Poslední export jsem narychlo dokončil ještě 30.9.2015 a pak rychle spěchal balit se na DoD WEDOS 2015 (viz. články čtvrtek/pátek a sobota). Pak už se mi to úplně vykouřilo z hlavy :)
Obsah
Co je Aldnoah
Jedná se o provizorní pojmenování skriptu, který skládá dohromady data z databáze SC8. V podstatě mě jednoho dne napadlo, že bych si mohl udělat vlastní obdobu Google webmaster tools pro Seznam. No a přesně to vlastně Aldnoah vlastně umí. Tedy pracuje jen z daty, které momentálně v SC8 jsou. Poslední relase má 2.868.268 záznamů (URL). Ty jsou kombinací přes 2,5 milionů výsledků ze Seznamu a přes 400K výsledků z Google. Momentálně se jedná už o něco víc, než jen testovací vzorek.
Co je SC8
V podstatě se jedná o soubor tabulek obsahující zajímavá data z vyhledávačů, která jsou přístupná pro člověka. Původně byla určená ke studijním účelům… no a pak, však znáte to. Staré dobré časy na webtrhu, kde se obchodovalo se vším možným.
Pro Aldnoah jsem potřeboval data a k SC7 už jsem měl hotové roboty. Ačkoliv pro mé potřeby nestačily, tak se mi stejně nechtělo je psát od začátku. Prostě jsem vzal to co bylo použitelného a posunul je na vyšší úroveň, aby mohli fungovat na samostatných virtuálech a posílat data do mého počítače domů. Tento projekt už si nevystačí s jedním desktopem :)
Pokrok
Od poslední verze přibylo něco přes 1,2 milionů URL. Jeho výstup je tak opět o něco užitečný. To je tak pokrok pro vás :)
Co se týká mě, tak jsem musel zabojovat se SQL, trochu pokročit v konfiguraci SQL server a Apache a co považuji za největší osobní úspěch je vymyslet cachování pro DAS filtr. Vzhledem k tomu, že je počet zobrazených výsledků omezený, je třeba to trochu profiltrovat u těch úspěšnějších na Seznamu. Jenomže toto filtrování je poměrně náročné na výkon, protože se nepracuje s 30 výsledky, ale se všemi, které se k dané URL vyskytují. Naštěstí to je problém jen pro několik stovek domén. No měl jsem ze sebe dobrý pocit a to mě potěšilo :D
Závěr
Výsledek mého snažení si můžete vyzkoušet na http://cybersquatting.cz/sc8/ data jsou aktuální k poslednímu týdnu září.
Co se týká samotné užitečnosti nástroje, tak obecně by se dalo říct, že pokud tam nejste, tak:
- optimalizujete na špatná klíčová slova, která nemají význam (nemají návštěvnost)
- prozatím daná klíčová slova v SC8 nejsou
Google má jen velmi omezený vzorek, protože u všech IP adres workerů, odkud probíhá testování je ban (ne mojí vinnou). Takže jej neřešte. Navíc pro něj máte k dispozici Search Console.
A áno už jsem opravdu dostal vynadáno několikrát, opravdu se tím dají zjistit “tajná” klíčová slova, na která se vyplatí cílit v eshopech.
- Parkování u letiště Praha - nebylo nikdy výhodnější. Chystate se na dovolenou s odletem Václava Havla v Praze? Využijte výhodné parkoviště u letiště Fajn
Veľmi pekný projekt, divím sa že ste to nechali za free
asi to funguje jen na malých stránkách, protože to jinak vyhodí typy kw “ulož.to, google obrázky§, youtube)” což opravdu za zajímavá kw nepovažuju :), pozice 15-92… ;)
Řádí to podle hledanosti a limit je 30 výsledků. Použij DAS filtr.