Annak érdekében, hogy Önnek a legjobb élményt nyújtsuk "sütiket" használunk honlapunkon. Az oldal használatával Ön beleegyezik a "sütik" használatába.

Minden amit tudni akartál a Google Analytics spam eltávolításáról 2. rész

  •  Webes varázslatok
  • 2016-02-09 20:05:00
  • Házi Csaba
  • http://blog.abstractgroup.hu/
Tehát hogyan is fogunk megszabadulni a spamektől?
A tegnap elkezdett sorozatunk második részét olvashatjátok most. Ne számítsatok túl sok "jóra", ugyanolyan "belemenős", mint a korábbi. Tehát nagy sóhaj, és ugorjunk is bele...

 

Röviden, a következőket fogjuk tenni:

 

  • Fölállítunk Google Analytics nézeteket a forgalmi csatornáidra, itt szétválasztjuk a beérkező forgalmadat:
    • direkt forgalomra,
    • keresési forgalomra,
    • ppc forgalomra (ha használsz fizetett hirdetést),
    • social forgalomra,
    • hivatkozási forgalomra,
    • és létrehozunk egy nyers/szűretlen nézetet, referencia pontnak.

 

Ezzel önmagában elérjük, hogy az újonnan létrehozott nézetek spammentesek lesznek, kivéve a hivatkozási forgalmat (hogy miért, azt lásd lejjebb).

 

  • Megtisztítjuk a hivatkozási forgalmadat a spamtől 3 lépésben:
  •  
    • Felállítunk egy szűrőt (valid hostname filter), amely kiszedi a ghost referral-okat.
    • Beállítjuk, hogy a hasznos botok (pl.: Googlebot) látogatásait se számolja az Analytics, de ne is tekintse őket spamnek.
    • Kiegészítjük egy szűrővel, amely az összes ismert spamcrawler-t eltávolítja az Analytics-ből.

 

Analytics nézetek létrehozása, megtisztítása

Az egyik legjobb dolog az Analytics-ben, hogy különböző szempontok alapján (azaz leginkább szűrőkkel) egyéni nézeteket hozhatsz létre. Alapvetően érdemes minden fontosabb szempontra külön nézetet készíteni, mert így kényelmesen hozzáférhetsz bármilyen adathoz és nem kell egyéni dimenziókkal, egyéni szűrőkkel varázsolni.

 

Tipp: Mindig érdemes nézetet létrehozni, ha több mutatót akarsz kombinálni.

 

Például, ha kíváncsi vagy, hogy a Magyarországról érkezett, mobiltelefonos látogatók hogyan konvertáltak. Gyakorlatilag bármilyen izgalmasabb mutatóhoz kombinálnod kell a rendelkezésre álló információkat.

 

7 Analytics nézet, ami MINDENKINEK jól jön

Ami piactól, biznisztől függetlenül mindenkire igaz, hogy tudni szeretné, a forgalmi csatornái hogyan teljesítenek. Még az is mindegy, hányféle csatornával dolgozol, a lényeg, hogy szét tudd választani őket és pontos képet kapj arról, mi működik és mi nem. Ezért fel kell állítani 5 nézetet az 5 fő forgalmi csatornára:

 

Érdemes kritikusan vizsgálni a keresési (organikus) forgalmat, ugyanis aki a te céged/honlapod nevét írja be keresőszóként a Google-be, az is organikus találatnak számít, ám valójában direkt forgalom.

 

  • Direkt forgalom – Akik konkrétan a honlapod címét írják be és így jutnak el hozzád (plusz még néhány szempont).
  • Keresési (organikus) forgalom – Akik a keresőkön keresztül érkeznek. Valamilyen kulcsszót írtak be, amelyre te megjelentél és arra kattintva landoltak nálad.
  • PPC forgalom – Azaz fizetett hirdetés (pl.: AdWords). Ha hirdetsz, akkor mindenképp érdemes ezt a nézetet beállítanod, ugyanis sokkal több információhoz férsz hozzá (főleg demográfiai téren), mintha csak az AdWords fület nézegetnéd Analytics-ben.
  • Közösségi forgalom (Social) – Közösségi médián keresztül érkezett látogatások (pl.: Facebook, Twitter). Ha energiát ölsz abba, hogy ezekről az oldalakról látogatókat (és gyanítom, vásárlókat is) szerezz, akkor elengedhetetlen, hogy minden adatot láss és elemezhess.
  • Hivatkozási forgalom (Referrals) – Nos, igen. Ez is itt van és ezért gyűltünk ma egybe. A hivatkozók olyan oldalak, amelyek linkelnek ránk. Ez egy nagyon értékes forgalom (SEO és tartalom szempontból is), érdemes vele foglalkozni és pont ezt torzítja, rágcsálja az értékes részeket elrejtve a szemünk elől a spamforgalom.

 

De sebaj, haladjunk tovább, nemsokára itt a gyógyír!

 

Ezen felül még rengeteg mindenre lehet nézetet készíteni (mobil forgalomra, regisztrált felhasználókra stb.), azonban ennek az ötnek meg kell lennie, hogy pontos képet kaphass az egyes csatornákról.
 

Még két nézetet érdemes létrehozni:

 

  • Egy spamszűrt főnézetet (amit általános használatra szánunk, minden nap meg lehet nézegetni, ha nem akarsz komolyabb elemzésbe fogni),
  • valamint egy szűretlen nézetet referenciapontnak és biztonsági mentésnek.

 

Akkor vágjunk is bele, jöhetnek a részletek!

 

1. Szűretlen nézet létrehozása

Fontos, hogy legyen egy biztonsági mentésünk és referencia pontunk, amivel ellenőrizhetjük, hogy jól csináltuk, amit csináltunk. A következőket tedd:

 

  1. Lépj be Analyticsbe, válaszd az Adminisztrálást és a kívánt fiókot, valamint tulajdont.
  2. A megtekintés fülön kattints a beállítások megtekintésére.
  3. Írd át a nézet nevét "Minden webhelyadatról" "Szűretlen nézetre".
  4. Ellenőrizd, hogy biztosan nincs beállítva szűrő erre a nézetre: kattints a nézetnél a szűrőkre és győződj meg róla, hogy üres a lista. Ha nem lenne az, akkor kattints a szűrőre és töröld ki.

 

#1 lépés: Válaszd az Adminisztrálást, majd a megfelelő nézet alatt a Beállítások megtekintését. 

 

#2 lépés: Írd át a nézet nevét "Szűretlen nézetre"

 

Rendben, innentől már nyugodtan garázdálkodhatunk, baj nem történhet.

 

2. Az 5 fő forgalmi csatorna nézetei

Magyarul itt 5 db nézetet fogunk készíteni és mindegyikben CSAK az adott forgalmi csatorna adatait fogod látni.

 

A feladat egyszerű lesz, csak ismételgetni kell, néhány szó különbséggel.

 

#1-2 Hozz létre egy új nézetet!

 

#1 Lépj be Analytics-be, azon belül válaszd az Adminisztrálást, majd a tulajdont, amellyel dolgozni akarsz.

#2 Itt a megfelelő honlaphoz a Nézetek fülön válaszd az új nézet létrehozását.

 

#3 Nevezd el a nézetedet!

 

#3 Add meg az adott nézet nevét, így:

  • Direkt forgalom
  • Keresési forgalom
  • PPC forgalom
  • Közösségi forgalom
  • Hivatkozási forgalom

 

#4 Hozz létre egy új szűrőt!

 

#4 Ezután kattints a szűrőkre, ott az új szűrő létrehozására.

 

#5-7 Szűrő beállítása

 

A szűrő annyit fog tenni, hogy KIZÁRÓLAG az adott forgalmi csatornából engedi be a forgalmat, a többiből pedig kizárja. Ezért a szűrő nevének érdemes ezeket megadni:

 

  • Csak direkt forgalom
  • Csak keresési forgalom
  • Csak PPC forgalom
  • Csak közösségi forgalom
  • Csak hivatkozási forgalom

 

#5 A szűrő működésénél válaszd az „Egyénit”, a szűrési típusnál pedig a „Belefoglalt”. Ez azt jelenti, hogy csak azt a paramétert engedi át a szitán, amelyet meg fogsz adni, a többit kukázza.

 

#6 A forrásnál válaszd a "Kampánymédiumot". Ez azt jelenti, hogy forgalmi csatornát fogsz megadni.

 

#7 Ezután a feladat, hogy megadd az adott nézethez a megfelelő forgalmi csatornát, így:

 

  • Direkt nézethez írd be, hogy „direct”
  • Keresési nézethez írd be, hogy „search”
  • PPC nézethez: „cpc” (Vigyázz! Pay per Clicknek becézzük, de az Analyticsban Cost Per Click, azaz CPC)
  • Közösségi nézethez: „social”
  • Hivatkozási nézethez: „referral”

 

+1 Végül, ha van kedved, ellenőrizheted az eddigi adatok alapján a szűrő működését a „Szűrő ellenőrzése” résszel. Ne ess kétségbe, ha nem működik, vagy nem hoz eredményt! Ez a rész nagyon megbízhatatlan és valószínű, hogy valamilyen belső hiba miatt akad el az Analytics.

 

Van egy nyers és 5 nézeted a forgalmi csatornáidra. Így ha kíváncsi vagy, pl.: hogyan teljesít a Facebook-ról érkező látogatóhad, csak válaszd ki a Közösségi forgalom nézetet és máris minden információt látni fogsz.

 

A jó híreknek ezzel még nincs vége! Még valamit sikerült elérned, mégpedig azt, hogy a hivatkozási (és szűretlen) nézeten kívül

 

EGYIK MÁSIK NÉZETBEN SEM LESZ SPAM!

 

Na, ez hogy lehet?
 

A válasz olyan egyszerű, hogy a lap aljára kéne írnom fejjel lefelé, mint a rejtvényekben: Csak a hivatkozási forgalomba kerülhet spam, és mivel a szűrők minden más forgalmat kizárnak és csak az egyes csatornákat mutatják, lehetetlen, hogy spam kerüljön közéjük.

 

Hurrá! No akkor a kellő önbizalommal felvértezve ugorjunk neki a nehezének!

 

3. A hivatkozási nézet megtisztítása a spamtől

Az állomásnév vagy hosztnév (hostname) egy számítógép-hálózatra csatlakozó eszközhöz rendelt címke, ami azonosítja az eszközt az elektronikus kommunikáció során.

 

Először meg kell bírkóznunk a nem valódi látogatókkal (ghost referral), tehát jöhet a Ghost Busters. Ehhez föl fogunk állítani egy szűrőt, amely hostnamek alapján kidobálja az összes olyat, amely nem valódi forgalom.

 

A ghost referralok legfőbb ismérve (a crawlerekkel szemben), hogy nem tudják, kit céloznak, ezért invalid hostnevet használnak.

 

Ezt kihasználva, egy olyan szűrőt fogunk készíteni, amely csak azt a forgalmat engedi át, amelynek valid a hostneve. Mivel a ghost referralok ezzel nem rendelkeznek, gyakorlatilag 100%-ban kiszűrjük őket.

 

Spamlista összeállítása. - Minden domain, amely nem a tiéd, nem tudsz róla spam, valamint a "not set" is: 1700 látogatás 0 konverzióval, majdnem 100%-os bounce rate-el? Nem valószínű.

 

#1 lépés: Összeállítani egy listát a valid hostnevekből

 

  • Lépj be Analyticsbe és válaszd a szűretlen nézetet

  • Állíts be minél tágabb időintervallumot

  • Baloldalt, válaszd a Közönség fület, azon belül a Technológiát és abban a Hálózatot

  • Fölül győződj meg, hogy az "Állomásnév" van kiválasztva (alapból a "Szolgáltatót" mutatja a szoftver)

 

Ökölszabály:
Csak azok a hostnevek validok, ahová elhelyezted a Google Analytics követőkódodat, minden más spam!

 

Validok a következők:

 

  • a saját domainneved (pl kisjakab.hu)

  • a saját aldomainjeid (pl blog.kisjakab.hu)

 

Valamint azok a szolgáltatások, amelyek kapcsolódnak a honlapodhoz és használhatják a követőkódot. Ilyen például egy beépülő foglalási rendszer, másik analitikai szoftver, YouTube, PayPal stb.

 

Nem valid hostnevek:
Az előzőkön kívül minden más invalid! Légy résen, mert itt jólcsengő és ismert nevek is bekerülhetnek, mint a Google és az Amazon.com, vagy egyszerűen Not Set. Ezek viszont nem hivatkozások, hanem spammerek, akik jólhangzó neveket használnak, hogy ne fogj gyanút.

 

Megvan a lista a valid hostnevekből? Oké, akkor mehetünk tovább!

 

#2 lépés: a valid hostnevekből regex kifejezés készítése

A valid hostnév sem volt egyszerű, erre jövök ezzel a regex-el… Tudom, tudom, elnézést is kérek érte, de ha egyszer ez a megoldás…

 

A regex, a Regular Expressions-t takarja. Ez arra jó, hogy ahelyett, hogy külön-külön minden hostnévre beállítanánk egy szűrőt, egy speciális kifejezéssel, egyetlen sorral megadhatjuk az összeset. Így már azért jobban hangzik, ugye?
 

Egy regex kiefejezés valahogy így kell kinézzen:

yourdomain.com|otherdomain.com|translateservice.com|yourshoppingcart.com|otherservice.net

 

Tehát csak egyszerűen bemásolgatod a hostneveket és néhány speciális karaktert raksz közéjük, amit az alábbi táblázatban találsz:

 

Hogyan írj regex-et?

 

  • Mivel Analyticsbe URL-eket fogsz másolgatni, ezért fontos, hogy ne nyomj space-t két URL között

  • Az elválasztáshoz a függőleges vonalat | használd. Ez a regex nyelvén a VAGY-ot jelenti. (pl.: facebook.com|google.com azt jelenti: facebook.com VAGY google.com)

  • A kifejezés elejére és végére ne tegyél függőleges vonalat!

  • A regex kifejezés maximum 255 karakterből állhat. Ha hosszabb kifejezést akarsz beírni, akkor több szűrőt hozz létre (valószínűleg nem lesz rá szükséged).

  • Bizonyos karakterek elé backslash-t kell tenni, hogy helyesen értelmezze a rendszer. Mivel URL-ről van szó, legtöbb esetben ezt a két karaktert kell kimentened: . (pont) és – (kötőjel). Tehát: . és -

 

Példa: Tegyük fel, két valid hostneved van: kis-jakab.hu és blog.kis-jakab.hu. Ebben az esetben a regexed így néz ki:

kis-jakab.hu|blog.kis-jakab.hu

 

Tipp:
Írd le a regexet a valid hostnevekből drive-ba, wordbe, vagy bármilyen szöveges szerkesztőbe és ellenőrizd, hogy ne legyen benne hiba! Ha használsz kódszerkesztőt (pl.: Sublime Text), akkor használd azt!

 

Megvan a regex? Akkor jöhet a szűrő!

 

Valid hostnevekből álló szűrő létrehozása

 

#3 lépés: Analytics szűrő létrehozása

 

  • Lépj be Analyticsbe, válaszd az Adminisztrálást.

  • A megfelelő fióknál kattints a szűrőre (NEM a nézetnél, ahogy eddig, hanem FIÓK szinten hozzuk létre a szűrőt, mert két nézetnél is fel fogjuk használni: hivatkozási forgalom és főnézet).

  • Válaszd az új szűrő létrehozását és add meg névnek, hogy „Valid Hostnév Szűrő”.

  • A szűrő típusa legyen "Egyéni" és "Belefoglal"

  • A "Szűrőmezőnél" válaszd a „Gazdagép nevét” a legördülő listából.

  • A "Szűrőmintánál" pedig másold be a valid hostnevekből készített REGEX kifejezést.

 

Mielőtt élesíted, győződj meg róla, hogy működik, kattints a "Szűrő ellenőrzésére" (ha épp olyan kedve van az Analytics-nek, akkor megmutatja, hogy mi történik a szűrővel és anélkül).

 

Ha a későbbiekben újabb hostnevet akarsz hozzáadni a listához (pl.: időközben bekötöttél egy online fizetési rendszert), akkor nyugodtan bővítsd a REGEX kifejezést. Amire ügyelj: mindenképp a VÉGÉRE írd az új hostnevet.

 

Huh. Újabb elismerésem! Már eljutottál a folyamat 75%-áig! Van spammentes nézetünk a fontos forgalmi csatornákra és a hivatkozási forgalmadat is megtisztítottuk a ghost referraloktól.

 

Igyál egy kávét, megérdemled! Most pedig jöjjön egy ujjgyakorlat:

 

4. A hasznos botok kizárása a rendszerből

Ezekkel a botokkal semmi baj nincs. Járják az internetet, információt gyűjtenek, nélkülük a Google se működne. Azaz egy baj mégiscsak van velük: nem tekinthetjük hasznos látogatásnak őket, így jó lenne kiszűrni őket az Analyticsből, hogy elrejtve működjenek, zajtalan.

 

 

Hasznos robotok kiszűrése a statisztikából

 

  1. Lépj be Analyticsbe, válaszd az Adminisztrálást, majd a Hivatkozási nézetnél a „Beállítások megtekintését
  2. Itt pipáld ki a "Robotok szűrésénél" az "Ismert robotok és webbejárók összes lekérésének kizárása" opciót.
  3. Kattints a mentésre és kész is!

 

Crawler spamek kiszűrése

Ez az utolsó megmérettetés. Ezek azok a botok, amelyek eddig átjutottak a szűrőn:

 

  • Nem hasznos botok, nem szűrhetők ki az Analytics bot opciójával
  • Nem ghost látogatások, valóban megérkeznek az oldalra, valid hostnévvel bírnak, így nem szűrhetők a Valid Hostname Filterrel

 

Ezektől szintén szűrővel és REGEX-el fogunk tudni megszabadulni.

 

Ehhez két dologra lesz szükség:

 

  • Egy listára azokról a spamekről, amelyeket blokkolni akarsz (ebből készítünk REGEX-et)
  • Egy Analytics szűrőre, amely kizárja ezeket a nézetből

 

Honnan szerzek listát a spamekről?
Több cég készít listákat az ismert crawler spamekről és frissíti rendszeresen. Ezen az oldalon tájékozódhatsz a legfrissebb spamekről: Legfrissebb crawler spamlista

 

Itt találsz egy REGEX kifejezést, amely lefedi a jelenleg ismert crawler spameket.

 

DE! Vigyázó szemed mindig vesd a hivatkozási forgalomra, s ha olyat találsz, amely spamgyanús, akkor egészítsd ki a REGEX kifejezést (ha nagyon jófej akarsz lenni, még be is küldöd egy ismertebb oldalnak, aki listára veszi).

 

Honnan tudhatom, hogy spam?

Elég biztos módszer, ha megnézed, hogy mennyi időt töltöttek az oldalon és mekkora az adott forgalom visszafordulási aránya (bounce rate).

 

Tipikus spam: 00:00:00 átlagos látogatási idő és 100%-os bounce rate:
Ugyanis nem emberi viselkedés egyik sem. Nincs olyan, hogy 0 másodperc legyen az átlagosan eltöltött idő. Ha mindenki aki megnyitja az oldalt, rögtön be is zárja, akkor is valahol 1-5 másodperc között kell lennie az időfaktornak.

 

A 100%-os visszafordulási arány szintén extremitás, mert nem valószínű, hogy mindenki azonnal bezárja az oldalt, anélkül, hogy bármire is kattintana.

 

Tehát, ha a fenti ismérv valamelyikét magán hordozza egy hivatkozó, akkor jó eséllyel spam és mehet is a listára!

 

Szűrő elkészítése:

 

  • Lépj be Analyticsbe, válaszd az Adminisztrálást és a megfelelő nézetnél a Szűrőket.
  • Válaszd az új szűrő létrehozását és nevezd el „Crawler Spam Szűrőnek”
  • A szűrő típusa legyen "Egyéni" és "Kizárás" jellegű
  • A "Szűrőmintához" másold be az alábbi REGEX-et (friss lista az ismert crawlerekből):

    (best|100dollars|success)-seo|(videos|buttons)-for|anticrawler|musica-gratis|semalt|forum69|7makemoney|sharebutton|ranksonic|sitevaluation|dailyrank
  • Majd a "Szűrő ellenőrzése" funkcióval nézd meg, hogyan teljesít a szűrő a jelenlegi adatok alapján.

 

JÓ TUDNI: a szűrőknél akár 24 óra is eltelhet, mire működésbe lépnek, így ne aggódj, ha nem látsz instant változást.
Készen is vagyunk! Friss, ropogós Analytics, spam nélkül.

 

Végül: Mit NE tegyél, mert nem fog működni

 

  • Ne írj .HTACCESS-t, hogy blokkolni próbáld a Ghost Referralokat
  • Ne használd a Referral Exclusion listet arra, hogy spameket zárj ki vele
  • Ne változtasd meg (csak ezért) a Google Analytics Tracking ID-t
  • Ne használd szűrők esetében a "Hivatkozást" (Referral), használd helyette a "Kampányforrást"
  • SOHA ne kattints egy ghost referral, vagy spamcrawler linkjére
  • Ha beállítasz szűrőt, ne felejtsd el, hogy visszafelé nem működik, tehát csak a szűrő beállítása utáni dátumokat nézd :)

 

2 egyszerű és gyors módszer, ha nincs időd a komplex megoldásra:

 

1. Szűrés ország szerint (főleg Magyarországon működik)

Ha csak egy bizonyos ország a célpiacod (pl.: Magyarország), akkor nyugodtan beállíthatsz egy szűrőt Analyticsben (Tulajdon nézet, Szűrő hozzáadása), amely minden más országból érkező forgalmat kizár. Mivel a spamek (egyelőre) külföldi domainek alol érkeznek, így azokat teljes egészében kizárja a rendszer.

 

2. Egy-egy spam hivatkozó manuális kiszűrése

Ha a legnagyobb gondodat a kiugró floating-share-buttons.com, vagy hasonló oldal jelenti, de ezt leszámítva nem jelentős a spam forgalmad, akkor hozz létre egy Analytics nézetet és egy szűrőt, amellyel forgalmi csatorna és REGEX alapján kiszűrőd az adott spammert:

 

  1. Lépj be Analyticsbe, válaszd az Adminisztrálást, majd a megfelelő fiókot és tulajdont.
  2. Válaszd az új nézet létrehozását
  3. Adj hozzá egy szűrőt: Egyéni, kampányforrás alapú és kizáró jellegű.
  4. Szűrőmintának írd be REGEX-el a spammer domain nevét

 

Ha ez a leírás túl gyors lett volna, akkor görgess visszább, ott minden részletes információt megtalálsz!

 

Összegzés

Megszabadultunk az adatokat torzító spamektől Analyticsban három egyszerű szűrővel:

 

  • Kiszűrtük a Ghost Referralokat a Valid Hostname Filterrel
  • Kiszűrtük a crawler spameket egy regex Analytics szűrővel
  • Beállítottuk, hogy a jó botokat szűrje ki nekünk az Analytics

 

Ezen felül létrehoztunk 5 nézetet a fő forgalmi csatornáidnak, így könnyedén áttekintheted és végezhetsz összetettebb elemzéseket is a szoftverben.

 

Itt vége is?
Nos, még két dolgot lehet tenni:

 

  • Ha szeretnél régebbi, még szűretlen statisztikai adatokat spammentesíteni, akkor olvasd el ezt a cikket, amely megmutatja, hogyan teheted ezt meg az egyéni szegmensek használatával:
  • Remove Referrer Spam from historical data with Segments
  •  
  • Emellett pedig mindig figyeld a hivatkozási forgalmadat, keresd a spameket, félévente nézz rá a spamlistákra és bármi az utadba kerül, szűrd és szűrd.

 

További olvasgatásra az alábbi cikkeket ajánlom:

 

 

Házi Csaba

http://blog.abstractgroup.hu/

Megosztás
Minden amit tudni akartál a Google Analytics spam eltávolításáról 1. rész: Bevezetés
Nem tudod, hogyan távolítsd el a spam botokat: Az abstractos fiúk segítenek neked ebben. Figyelj és tanulj! Mi bele is kezdünk...
   2016-02-08    Webes varázslatok