Zgaduj zgadula, co powie Google?
Używam Google Analytics, bo żadne inne darmowe narzędzie nie daje takich możliwości analiz.
Darmowemu systemowi statystyk w metodologię głupio zaglądać, ale mam coraz więcej wątpliwości.
Dziś rano sprawdzam statystyki serwisu klienta z danego okresu. Oprócz GA korzystam też z BBClone. Jest to oparty o PHP „licznik z dopalaniem”, który ma tę miłą zaletę, że rejestruje prawie dokładnie to samo co logi serwera, a przeglądanie jest łatwiejsze.
No i wejścia z dwóch róznych adresów.
Adres 1: BBClone pokazuje 97 wejść, GA 188.
Adres 2: BBClone pokazuje 56 wejść, GA tylko 28.
I dlaczego nie wierzę Googlowi?
Adres 1 – skądinąd wiem że baner przez który nastąpiły wejścia wyświetlony został w danym okresie nieco ponad 250 razy. O ile wskaźnik wejść na poziomie 35% jestem w stanie zrozumieć (baner jest rozwinięciem newsa), to 75% jest już lekkim przegięciem. :)
Adres 2 – w logach mam udokumentowane każde z tych 56 wejść, w GA nie mogę sprawdzić które konkretnie wejścia odnotowano.
Kilka możliwych teorii, dlaczego tak się dzieje:
- GA duplikuje sobie referery przy przeładowaniu strony.
- Ma miejsce zgrzyt w liczeniu liczby sesji, jedna wizyta może generować kilka „Visits” z tym samym refererem.
- Niektóre PV (a więc i może referery powiązane z tymi PV) są rejestrowane wielokrotnie, o tym może świadczyć kosmiczna wartość kolumny „P/Visit” w niektórych analizach.
- Skrypt nie zawsze działa i nie rejestruje wszystkich wejść (to oczywiście wyjaśnia miejszą liczbę przy adresie 2, ale tym bardziej nie wyjaśnia większej w adresie 1).
Za Piotrem Mikołajskim muszę powtórzyć:
Ze wstydem przyznaję, że nie mam żadnych konkretnych wniosków.
Mało konkretne wnioski są takie:
- do systemów statystyk, nawet tak profesjonalnych jak Google Analytics należy podchodzić z dużą rezerwą,
- jeśli to możliwe, nie opierać się tylko na jednym systemie,
- w miarę wiarygodna analiza jest możliwa tylko wtedy gdy znamy sposób działania, a więc i słabości każdego z systemów.
Podobne artykuły:
Być może zainteresują Cię następujące artykuły:
- Monitoring mediów Press Service – amatorka na granicy ataku DoS
- Wpadka Google Analytics
- Analiza świeżości odwiedzin w Google Analytics
- Konta i profile Google Analytics
- 5 powodów, aby pokochać Google Analytics
Zapisz się na kanał RSS bloga i dołącz do ponad 1500 czytelników RSS.
19 czerwca 2006 12:37
Jak już Ci kiedyś mówiłem, też mam problemy z GA, lecz są one nieco dziwniejsze. Mam stworzone dwa profile dla dwóch stron i w przypadku strony B(dodanej, jako drugiej i nieco później) widzę referery strony A. Działa to też w drugą stronę, ale w mniejszym stopniu. Może ktoś z czytelników spotkał się z tego rodzaju problemem?
19 czerwca 2006 15:37
Zapominasz, że GA to Urchin 5.0? ludzie bulili niezłą kasę za ten system? i on ma być mało wiarygodny? Litości. :)
19 czerwca 2006 15:50
Riddle:
Miliony ludzi oglądały „Big Brothera,” „Bar” i „Idola.” I to ma być beznadziejne? Litości. :)
19 czerwca 2006 17:09
Może być mało wiarygodny, tym bardziej, że każdy skrypt można zablokować, jak ja to robię wszędzie, gdzie się da (strona działa bez tego), bo niestety -rozszerzenia- używam superszybkiego i superreaktywnego Firefoxa1.5 *1. To by wyjaśniało drugi przypadek.
*1 Co z _idiota_ wymyślił, ten _debilny_ system obsługi zdarzeń wywołanych przez lusera w czasie wykonywania skryptów na stronie!?
19 czerwca 2006 17:21
Wyjaśnienia:
* GA działa tylko dla przeglądarek, które mają włączony JavaScript i nie blokują urchinTrackera. W logach możesz mieć masę botów i AdBlocki też nic nie wytną.
* GA zlicza odwołania ze stron, które są w cache. Z serwera możesz jedym requestem obsłużyć tysiące użytkowników chello, astercity i innych „proxujących”. W IE wstecz/dalej może nabijać GA, a nie ssać z serwera.
19 czerwca 2006 17:31
uglukk: z tym blokowaniem to kwestia, jaki będzie zasięg osób dodających blokadę na GA/gemiusa/inne skrypty. Nie sądzę, aby było to zjawisko masowe, nie sądzę, aby przekraczało 1% internautow.
porneL: userzy z wyłączonym JS to pewnie 1-2%, z kolei BBCode wyławia boty, zresztą nie zauważyłem aby Google czy Yahoo (ani nawet spamboty) używały refererów i to takich.
Co do cache, masz rację, to może być jakaś przyczyna różnic.
19 czerwca 2006 18:53
Dość popularne jest rozszerzenie do FF Noscript, którego i ja używam. Pozwala ono na wycięcie javascriptu i javy wszędzie poza wybranymi domenami.
20 czerwca 2006 18:28
Z tego wniosek, że nie ma dobrego skryptu statystyk — kazdy kłamie na swój sposób ;)
Mimo to pozostanę przy GA, bo daje mnóstwo informacji, jakich nie dostanę z Gemiusa, Webalizera czy AWStats.
Swoją drogą czy stworzenie niezawodnego skryptu statystyk jest w ogóle możliwe?
20 czerwca 2006 20:37
Nigdy jakoś nie przekonałem się do GA, chociaż wstawione jest i ciągle zlicza. Za to bardzo cenie sobie BBClone, na chwile obecną brakuje mi w nim tylko sprawdzania rozdzielczości usera.
20 czerwca 2006 21:18
Są (obecnie: były) gorsze rzeczy, niż błędy w zliczaniu refererów…
http://blog.konieczny.be/2006/06/18/a-nasty-bug-in-google-analytics/
28 czerwca 2006 10:45
Jak się okazuje, Gemius też ma błędy i to zasadnicze. Tak przynajmniej można wnioskować po przeczytaniu tekstu u Marka Futregi:
http://www.futrega.org/stek/2006/06/27/pbi_gemius_toria_z_bledem.html
Moje pytanie o istnienie dobrego skryptu statystyk pozostaje otwarte. A BBClone spróbuję przetestować ;)
26 marca 2007 17:07
Nio właśnie i ja zainstalowałem sobie na stronce GA oraz mam własny skrypcik który mi zlicza wejścia.
Wnioski:
mój skrypt zliczył 167 wejść w 24h (sprawdzane z logami z serwa) GA … 31 :/
co ciekawe wg mojego skryptu wejścia rejestrowane były w stosunkowo równych odstepach czasu
a GA rejestruje zwykle od 8:00 do 17:00 i może czasem „coś” później (niejest to kwestia jednego dnia,ale tak zlicza cały czas)
co jest grane??