SEO experiment č.2
ÚVOD
Rony v svojich komentároch, kde sme sa bavili o tom, že google nemá ako rozpoznať spam ma inšpiroval k ďalšiemu experimentu. Vychádzajúc z predchádzajúcej skúsenosti v experimente č.1 som predpokladal, že sa to googlu nepodarí.
Upozornenie
Autor článku neprevádza mimo experimentov žiadne BHS techniky!
Som si vedomý, že článok by potreboval doplniť a rozpísať metódy, techniky a časový plán avšak z dôvodu časovej zaneprázdnenosti článok doplním priebežne. V prípade, že Vás budú zaujímať detaily napíšte to do komentára.
Ciele experimentu
Rozhodol som sa zistiť, či google rozpozná spam pokiaľ do spamu zapojím aj služby Google. Jednalo sa o vloženie Adsense do webu s obsahom automaticky generovaným zo SERP yahoo a MSN feed.
Hlavným cieľom bolo zistiť schopnosť Google rozpoznať spam web.
H1: Predpokladám, že google nerozpozná BS web s automaticky generovaným obsahom s imlementovaným Adsense.
H2: Predpokladám, že mi na základe použitia zakázaných techník nebude zrušené konto v adsense.
Metódy a metodika
Ústrednou metódou overenia vyslovenej hypotézy bol SEO experiment.
V experimente som použil tieto metódy:
1. vytvorenie webu cez nástroj MyGen (generujúci web z YahooSERP
MSN_NewsFeed, dopĺňanými textami - RSSGM project Markov script)
2. Experiment prebiehal v čase august-október na webe Slovakia-guide.org
Premenné pod kontrolou
Počet podstránok 3000
Spätné odkazy (počas písania tohto článku zostalo na index cca 10 podľa backlinkchecker-seomoz pôvodne 30)
Sitemap xml
Web bol indexovaný v podstate okamžite keďže pred zahájením experimentu bol obsah webu Slovakia-guide.org a bol už googlom indexovaný.
Postup dosahovania cieľov
Implementovanie MyGen s maximálnym prelinkovaním (každá stránka odkazovala na cca 100 ďalších stránok v rámci webu)
Vloženie 3 000 key
Prejdenie webu vlastným robotom z dôvodu overenia bezchybnosti prelinkovania a uloženia generovaného obsahu do cache.
Vytvorenie sitemap.xml a vloženie do googlesitemap
Vytvorenia spätných odkazov na vnorené stránky
Kontroly indexácie
Po kompletnej indexácii (prebehla do dvoch týždňov) bol implementovaný adsense na každú stránku
Výsledok experimentu
Popis testovania:
Web Slovakia-guide.org bežal cca. Dva mesiace s tým, že google nerozpoznal aj napriek vloženiu adsense že ide o spam web. Následne bol ale kompletne vymazaný z indexu a bolo mu zrušené GPR hodnotenie. Rozpoznanie teda nastalo po dlhšom časovom intervale.
Overenie H1:
„Predpokladám, že google nerozpozná BS web s automaticky generovaným obsahom“
Popis výsledku:
Zamietam H1, keďže google rozpoznal že ide o spam web.
Záver:
Keďže google rozpoznal že ide o spam, až po určitom čase od kompletného zaindexovania (2 mesiace) je možné že tak došlo, až po udaní skz spam report. Nepredpokladám, že sa tak mohlo stať pri priebežnej kontrole pracovníka adsense. Keďže účet adsense mi zrušený nebol.
Overenie H2:
„Predpokladám, že mi na základe použitia zakázaných techník nebude zrušené konto v adsense.“
Popis výsledku: Prijímam H2, keďže mi konto zrušené nebolo.
Záver:
Google adsense nerozpoznal, že užívam pre službu adsense automaticky generovaný web. priemerné CTR webu bolo 8.
Vyhodnotenie
Google rozpozná spam, aj keď je otázne či to dokáže googlebot alebo až ľudský faktor skrz spamreport. To že sa jedná o 100% ban dosvedčuje ako vymazanie z indexu, zrušenie GPR tak aj to, že pri následnom vymazaní BS obsahu a jeho nahradením iným obsahom sa web slovakia-guide už do indexu nevrátil.
Obsah webu časovo rozdelený si môžete prehliadnuť vo Wayback Machine, aj keď pri MyGen nenačíta css.
November 7th, 2007 at 3:03 pm
Rozhodne si myslim, ze k vyradeniu prispel ludsky faktor.
November 7th, 2007 at 6:56 pm
Ľudský faktor v tom určite bol, bez zhliadnutia by si Google nedovolil vymazať celú stránku z indexu. Ale stavím sa, že si ako suspected bol označený algoritmom. S Adsense (ako aj sám hovoríš) to nemá nič spoločné.
November 8th, 2007 at 2:05 am
tybi: neviem ako by sa to dalo overit, ze robot dokáže označiť nejak rozumne podozrivu stránku, aby admini nemuseli kontrolovat 1000000 stranok denne. Ked poznas markov script dokáže generovať pomerne solídne texty. Navyše na mojom projekte bol upravený, aby nezaradzoval len vety po bodku, ale aby texty kombinoval. Na vyber article som si dal tiez zalezat. Web mal pomerne vysoky traffic a zobrazoval sa na prvych poziciach na key SAD v kombinacii s akymkolvek mestom na Slovensku a ine key. Ide o to ze ten web si priam pýtal o bonz. Vies ak by to robot dokazal, tak preco to nedokazal za dlhsi casovy usek v mojom prvom experimente? Verim ze googlebot je skvely a samozrejme som si vedomy toho, ze nie je problem doprogramovat zname algoritmy auto. generatorov webov do bootu. Ale jestvuje mnoho webov ktore si stahuju msn feeds, article rozpoznat nemoze, IA je relativne standardna, jedine mozno ten yahoo serp. Ked tak premyslam, v prvom experimente som prave vystup z yahoo serp obmedzil len na 2 vystupy pricom v druhom experimente to bolo plnych 9.
November 12th, 2007 at 3:21 pm
Google dokaze zistit auto. generovane stranky podla footprints generatora a takisto podla opakovania urciteho poctu slov za sebou..staci 12 a vyssie… ale vzdy je tam cca 1-2 mesacne okno kedy stranku delistuje z indexu.. ciz stale dost casu na vyuzitie a rychly zisk a generovanie dalsich domen.. ale nie v mygen…
Január 5th, 2008 at 2:30 am
Mygen si mozes upravit ako chces- je to len jednoduchy php. Jasne mozes uzit cokolvek rssg yaag cokolvek ale kazdy jeden sa da uplne jednoducho upravit. Odstranis import s MSN alebo ho nahradis inym rss a je to. Navyse Mygen nerobi haluze typu opakovania key do sibnutia. Dokonca generator si dokazes upravit tak, aby bolo generovane spravne title vo vztahu k nadpisom a textu,….