Posted: 09.07.2005 15:21 Post subject: google rank = none (iliti kick/ban)
Temu ću početi sa jednim tužnim smajlijem
Prije mjesec-dva sam počeo raditi kao developer na jednom malo većem sajtu koji je tada bio prvi na Googlu. Site je, kako to biva, bio napravljen tablicama, bez URL rewritinga, sa JS linkovima (pop-upsima) svuda, minimalnim CSS-om, slabim keyword density-em itd. Kako sam programirao tako sam postepeno micao site prema standardima: zamijenjivao tablice CSS-om, počeo pametnije koristiti headinge (posljednji developer je u h1 stavio broj posjeta ), napravio samodeskriptivne URL-ove mod_rewrite-om, maknuo pop-upove, poboljšao naslove u TITLE elementu i drugo. A kako sam postepeno micao site prema standardima tako nam je Google rank polako, ali sigurno padao, sve dok nije prevršio svaku mjeru prije nekoliko dana kad sam otkrio da nas više opće nema u indeksu (prefiksom 'site:').
Da razjasnim, nije da nas potpuno nema u indeksu, već ima indeksirano oko 800 stranica isključivo sa prve verzije sajta starog dvije godine. Stari URL-ovi (naravno) više ne vrijede, pa sam napravio regexp koji ih redirecta u nove, ali ih google i dalje uporno pamti. Tek prije par dana sam vidio da sam zaboravio HTTP code 301 (budala), pa sam stavio da se šalje, te očekujem da će google s vremenom skužiti da toga već nema godinama.
Kad smo razgovarali o problemu, glavni čovjek projekta mi je rekao da se čuo sa starim developerom oko toga i da je ovaj rekao nešto poput toga da je stavljao skrivene keywordse (relevantne, nadam se ) bijelom bojom na site. Ja sam tvrdio da iz sto izvora znam da Google radi kick/ban zbog toga, ali nakon svega više ne znam što da mislim
Jedino što mi pada na pamet, a da je moglo utjecati na stravičan pad na googlu, su moje eksperimentalne statistike. Naime, napravio sam ekstenziju Shaunovog Shortstata (shauninman.com) koja prvi hit sa nekog IP-a u određenom broju sati (konkretno, 3) smatra početkom posjeta, te useru javascriptom pokupi rezoluciju i flash plugin pa redirecta na php skriptu koja to spremi u bazu, nakon čega se useru prikaže normalan sadržaj sajta. Sve se desi tako brzo da se ni ne primijeti. Za one koji imaju isključen JS (a tu spadaju i spideri) sam na tu početnu stranicu za statistike stavio 'refresh' META tag (kao i 'robots: noindex, follow'), a i tekst 'Ako niste automatski preusmjereni, kliknite na link ... bla bla' za svaki slučaj. Nakon refresha (ili klika na link) URI se ponovno učita, ali ovaj put sa normalnim sadržajem (zato što to više nije prvi hit na sajt).
Ako netko ima ideju o tome što se moglo desiti da izbaci cijeli sajt iz indeksa, neka me brzo prosvijetli. Varao nisam, cijelo sam vrijeme slijedio one smjernice koje su kao dobar SEO, a zauzvrat sam dobio da me nema na prvih 500 rezultata, a ni nakon toga Da li je zaista moguće da google ne indeksira site zato što na stranici koja pokupi statistike stoji 'noindex'? Jer nakon refresha, meta tag-a više nema i spider je slobodan da indeksira što god hoće...
Uhm, i ja muku mučim s googleom. Iz nekog razloga, ni mog sajta nema na rezultatima pretrage (ban)...
Nakon par neuspješnih eksperimenata (sumnjao sam na image replacement tehniku) sam slao mejl, pa sam se sad počeo vrlo sporo dopisivati sa likom iz supporta. Za sad, nema konkretnih odgovora... It'll take a while...
_________________ Get busy living, or get busy dying.
meni smrdi ovo sta si radio sa shortstatom, ako sam dobro shvatio sto si napisao
jel'da? ispričavam se, malo sam nerazumljivo opisao... meni se shortstat nije sviđao po tome što za svaki hit sprema kompletne statistike u bazu... znači dođe jedan lik sa Explorerom i napravi 20 hitova, dođe drugi sa FF i napravi 10, pa odmah ispadne da dvostruko više ljudi koristi IE nego Firefox. To nije dobra statistika, a još je i sporo budući da snifa brauzer na svaki hit i to pomalo nespretno (puno sam to poboljšao).
Ja sam razbio stvar na dvije tablice, jedna su hitovi (ip, vrijeme, referer, URI), a u drugoj su kompletne statistike koje referencijau prvi hit (jednog posjeta). Nakon toga mi je falila reza od ljudi i podatak imaju li Flash i koju verziju, pa sam složio JS koji to pohvata i preda GET-om skripti koja spremi podatke. Prvo sam to napravio tako da stavim 1x1 pixel IMG u dokument i pustim browser da ga zatraži, a SRC bi zapravo bio PHP koji nakon spremanja napravi output transparentnog gifa. Nakon toga sam skužio sve mane tog postupka (npr. images off ) i odlučio se za fantomsku 'međustranicu' koja ima taj isti JS u sebi. Radilo je dosta dobro, moram priznati, osim za spidere.
maratz wrote:
meta redirect je no-no za Google
Sumnjao sam, hence link u body-u. Apsolutni, sam na sebe.
Stvar radi ovako. User zatraži URL, npr. '/kontakt/'. Ako je to prvi hit u tri sata, smatra se početkom posjete (visit). Umjesto pravog sadržaja URL-a, Shortstat napravi output fantomske stranice koja u sebi ima JS koji napika što treba i pozove (via window.location) skriptu koja pospremi dane parametre u bazu. Skripta nakon spremanja napravi refresh (header: Location) i sad se učita normalan sadržaj. AKO čovjek (spider) nema JS, fantomska stranica ima meta refresh tag, meta 'noindex, noarchive, follow' (ipak ne želim da se tekst fantomske stranice indeksira) i user-friendly tekst u body-u sa linkom na resource '/kontakt/'.
My guess: spider posjeti neki URL, recimo opet '/kontakt/'. Prvo što dobije je fantomska stranica koja kaže noindex. On si misli, vid' noindeksa, pa izbaci URL iz goggle baze ako ga je imao od prije. Slijedi link na '/kontakt/', ali pošto je to opet isti resource, on si misli 'neću ja ovo indeksirat'. Surfa dalje, indeksira normalno, ali prvu je stranicu izbacio iz indeksa. Sutra dolazi opet, na drugi URL, pa i taj izbaci iz indeksa jer je to novi visit za moje statistike. URL po URL, nakon nekog vremena svi odu iz indeksa i ostanu samo oni linkovi koji su nepostojeći i kojih se nisam riješio na vrijeme. Jesam li u pravu? Nisam mislio da će se tako ponašati
BTW: cookies enabled: 88.7% (naravno, bez spidera/crawlera/walkera itd.)... da li je to moguće? Po meni je premalo, pa ne isključuje toliko ljudi kolačiće
Joined: 13 Nov 2003 Posts: 1397 Location: Karlovac
Posted: 10.07.2005 10:57 Post subject:
Sulien wrote:
Prvo sam to napravio tako da stavim 1x1 pixel IMG u dokument i pustim browser da ga zatraži, a SRC bi zapravo bio PHP koji nakon spremanja napravi output transparentnog gifa. Nakon toga sam skužio sve mane tog postupka (npr. images off ) i odlučio se za fantomsku 'međustranicu' koja ima taj isti JS u sebi. Radilo je dosta dobro, moram priznati, osim za spidere.
da ubacis u frame? iframe?....neznam ne pada mi nista drugo napamet...
Sulien wrote:
My guess: spider posjeti neki URL, recimo opet '/kontakt/'. Prvo što dobije je fantomska stranica koja kaže noindex. On si misli, vid' noindeksa, pa izbaci URL iz goggle baze ako ga je imao od prije. Slijedi link na '/kontakt/', ali pošto je to opet isti resource, on si misli 'neću ja ovo indeksirat'. Surfa dalje, indeksira normalno, ali prvu je stranicu izbacio iz indeksa. Sutra dolazi opet, na drugi URL, pa i taj izbaci iz indeksa jer je to novi visit za moje statistike. URL po URL, nakon nekog vremena svi odu iz indeksa i ostanu samo oni linkovi koji su nepostojeći i kojih se nisam riješio na vrijeme. Jesam li u pravu? Nisam mislio da će se tako ponašati
ja isto mislim da se to tako ponasa. a da to izbacis i probas vidjet kako ce se ponasat sajt na googleu. obzirom da imas dobro slozenu semantiku i ostale stvari trebao bi se relativno brzo pojaviti na guglu (jedino ako nisi upao u neku black listu )
btw. cestitam, uspio si razviti sistematicno brisanje stranica s googlea
Sulien wrote:
BTW: cookies enabled: 88.7% (naravno, bez spidera/crawlera/walkera itd.)... da li je to moguće? Po meni je premalo, pa ne isključuje toliko ljudi kolačiće
po kojem "kljucu" izbacujes spidere/crawlere/walkere iz statistike?
_________________ Bolje biti malo lud, nego malo pametan.
cuj, do standarda ili IR tehnike ti definitivno nije, jer meni DamirPhoto 2 tjedna nakon sto je postavljen i poslan googleu stoji na prvom mjestu ponosno a bio je i burne.org isto
E, ali mislim da ti onaj nofollow u suranji sa tim praznim splashom definitivno smeta. Provaj maknit to i ponovo se dodat u gugl.
P.S. Ako su stavljali fake keyworde moze i to biti
cuj, do standarda ili IR tehnike ti definitivno nije
Oh I dunno, bio sam čitao da se IR fore poput "text-indent: -9000px;" ni malo ne sviđaju guglu, pogotovo ako je skriven link.
Usput, istraživao sam zašto bi moj sajt dobio ban pa sam došao do informacije za duplicate content: google-u se ne sviđa ako je isti sadržaj na "www.sajt.com" i na "sajt.com" -- http://www.sitepoint.com/blog-post-view.php?id=272330
_________________ Get busy living, or get busy dying.
Prvo sam to napravio tako da stavim 1x1 pixel IMG u dokument i pustim browser da ga zatraži, a SRC bi zapravo bio PHP koji nakon spremanja napravi output transparentnog gifa. Nakon toga sam skužio sve mane tog postupka (npr. images off ) i odlučio se za fantomsku 'međustranicu' koja ima taj isti JS u sebi. Radilo je dosta dobro, moram priznati, osim za spidere.
da ubacis u frame? iframe?....neznam ne pada mi nista drugo napamet...
mislio sam, ali me baš zanimalo za handheld brauzere da li imaju ili će ikad imati JS, a mislim da handheldovi ne učitavaju frejmove
Quote:
btw. cestitam, uspio si razviti sistematicno brisanje stranica s googlea
(klanjanje) thank you, thank you
Quote:
Sulien wrote:
BTW: cookies enabled: 88.7% (naravno, bez spidera/crawlera/walkera itd.)... da li je to moguće? Po meni je premalo, pa ne isključuje toliko ljudi kolačiće
po kojem "kljucu" izbacujes spidere/crawlere/walkere iz statistike?
Oh I dunno, bio sam čitao da se IR fore poput "text-indent: -9000px;" ni malo ne sviđaju guglu, pogotovo ako je skriven link.
Ma nema šanse da ijedna IR tehnika smeta googleu, makar u mome slučaju, na skoro svakom sajtu je bila korištena, i uvik prvi bez beda.
Sve te SEO gluposti mi idu toliko na kurac da to nije normalno. Ljudi se ubijaju sa tim pričama i trikovima, nema što ne rade a sve za kurac. Triba samo imat čist i semantičan kôd i gotovo. Što manje toga, to bolje.
Sulien, nije mi uopće jasno zašto si u tolikoj mjeri komplicirao stvari.
zbog flasha i reze, samo zbog toga
jebga, JS je client side, a ja oću te stvari u bazi
jest, treba biti jednostavno... sajt je i bio jednostavan u biti, ali spider se malo čudno ponašao oko meta tag-a
kad sam započeo raspravu iz očaja sam isključio statistike i eto nas, opet prvi moram to malo sredit kad budem opet uključivao, mislim da ću ipak ići na iframe varijantu
Oh I dunno, bio sam čitao da se IR fore poput "text-indent: -9000px;" ni malo ne sviđaju guglu, pogotovo ako je skriven link.
Ma nema šanse da ijedna IR tehnika smeta googleu, makar u mome slučaju, na skoro svakom sajtu je bila korištena, i uvik prvi bez beda.
Sve te SEO gluposti mi idu toliko na kurac da to nije normalno. Ljudi se ubijaju sa tim pričama i trikovima, nema što ne rade a sve za kurac. Triba samo imat čist i semantičan kôd i gotovo. Što manje toga, to bolje.
Uhm, yea. A evo mene nema u indexu. A čuj, to što se spominje toliko IR ne vjerujem da je slučajno.
_________________ Get busy living, or get busy dying.
Naime, iako smo prvi na googlu, opet nema indeksiranih stranica osim onih 800-tinjak starih. Stari URL-ovi su isključivo oblika "/index.php?bla=nesto&blabla=josnesto" jer nije bilo mod_rewritea. Već više od tjedan dana (ranije uopće nisam shvatio da su većina google rezultata upravo ti stari URL-ovi) hvatam stare GET varijable i preusmjeravam ih na nove URL-ove sa 301:
Code:
header('HTTP/1.1 301 Moved Permanently');
header("Location: $resource");
die;
Pošto novijih indeksiranih stranica nema, pitao sam se kako to da smo onda prvi. Kad sam malo razmislio o tekstu (description) ispod rezultata pretrage, skužio sam da je to tekst kojime smo prijavljeni na www.dmoz.org. Nakon toga sam došao do zaključka da je jedini razlog zašto se pojavljujemo na goglu upravo entry za naš site na dmoz-u, što baš i nije bajno. Moje statistike su isključene već skoro tjedan dana, bez efekta na indeksiranje. Čudno, zbog toga što GoogleBot posjećuje site uredno svaki dan u jutarnjim satima.
Koristim li dobar način za uvjeravanje googla da stare linkove izbaci iz indeksa i zamijeni novima?
You cannot post new topics in this forum You cannot reply to topics in this forum You cannot edit your posts in this forum You cannot delete your posts in this forum You cannot vote in polls in this forum