Skocz do linków, Skocz do treści

Zgaduj zgadula, co powie Google?

19 czerwca 2006 11:00. Autor: Robert Drózd. 12 komentarzy

Używam Google Analytics, bo żadne inne darmowe narzędzie nie daje takich możliwości analiz.

Darmowemu systemowi statystyk w metodologię głupio zaglądać, ale mam coraz więcej wątpliwości.

Dziś rano sprawdzam statystyki serwisu klienta z danego okresu. Oprócz GA korzystam też z BBClone. Jest to oparty o PHP „licznik z dopalaniem”, który ma tę miłą zaletę, że rejestruje prawie dokładnie to samo co logi serwera, a przeglądanie jest łatwiejsze.

No i wejścia z dwóch róznych adresów.

Adres 1: BBClone pokazuje 97 wejść, GA 188.
Adres 2: BBClone pokazuje 56 wejść, GA tylko 28.

I dlaczego nie wierzę Googlowi?

Adres 1 – skądinąd wiem że baner przez który nastąpiły wejścia wyświetlony został w danym okresie nieco ponad 250 razy. O ile wskaźnik wejść na poziomie 35% jestem w stanie zrozumieć (baner jest rozwinięciem newsa), to 75% jest już lekkim przegięciem. :)

Adres 2 – w logach mam udokumentowane każde z tych 56 wejść, w GA nie mogę sprawdzić które konkretnie wejścia odnotowano.

Kilka możliwych teorii, dlaczego tak się dzieje:

  • GA duplikuje sobie referery przy przeładowaniu strony.
  • Ma miejsce zgrzyt w liczeniu liczby sesji, jedna wizyta może generować kilka „Visits” z tym samym refererem.
  • Niektóre PV (a więc i może referery powiązane z tymi PV) są rejestrowane wielokrotnie, o tym może świadczyć kosmiczna wartość kolumny „P/Visit” w niektórych analizach.
  • Skrypt nie zawsze działa i nie rejestruje wszystkich wejść (to oczywiście wyjaśnia miejszą liczbę przy adresie 2, ale tym bardziej nie wyjaśnia większej w adresie 1).

Za Piotrem Mikołajskim muszę powtórzyć:

Ze wstydem przyznaję, że nie mam żadnych konkretnych wniosków.

Mało konkretne wnioski są takie:

  • do systemów statystyk, nawet tak profesjonalnych jak Google Analytics należy podchodzić z dużą rezerwą,
  • jeśli to możliwe, nie opierać się tylko na jednym systemie,
  • w miarę wiarygodna analiza jest możliwa tylko wtedy gdy znamy sposób działania, a więc i słabości każdego z systemów.

Podobne artykuły:

Być może zainteresują Cię następujące artykuły:

Zapisz się na kanał RSS bloga i dołącz do ponad 1500 czytelników RSS.

Zostań fanem WebAudit na Facebooku.

Komentarze czytelników

Śledź komentarze do tego artykułu: format RSS
  1. Bellois

    Jak już Ci kiedyś mówiłem, też mam problemy z GA, lecz są one nieco dziwniejsze. Mam stworzone dwa profile dla dwóch stron i w przypadku strony B(dodanej, jako drugiej i nieco później) widzę referery strony A. Działa to też w drugą stronę, ale w mniejszym stopniu. Może ktoś z czytelników spotkał się z tego rodzaju problemem?

  2. Riddle

    Zapominasz, że GA to Urchin 5.0? ludzie bulili niezłą kasę za ten system? i on ma być mało wiarygodny? Litości. :)

  3. Patrys

    Riddle:

    Miliony ludzi oglądały „Big Brothera,” „Bar” i „Idola.” I to ma być beznadziejne? Litości. :)

  4. uglukk

    Może być mało wiarygodny, tym bardziej, że każdy skrypt można zablokować, jak ja to robię wszędzie, gdzie się da (strona działa bez tego), bo niestety -rozszerzenia- używam superszybkiego i superreaktywnego Firefoxa1.5 *1. To by wyjaśniało drugi przypadek.

    *1 Co z _idiota_ wymyślił, ten _debilny_ system obsługi zdarzeń wywołanych przez lusera w czasie wykonywania skryptów na stronie!?

  5. porneL

    Wyjaśnienia:

    * GA działa tylko dla przeglądarek, które mają włączony JavaScript i nie blokują urchinTrackera. W logach możesz mieć masę botów i AdBlocki też nic nie wytną.

    * GA zlicza odwołania ze stron, które są w cache. Z serwera możesz jedym requestem obsłużyć tysiące użytkowników chello, astercity i innych „proxujących”. W IE wstecz/dalej może nabijać GA, a nie ssać z serwera.

  6. Robert Drózd

    uglukk: z tym blokowaniem to kwestia, jaki będzie zasięg osób dodających blokadę na GA/gemiusa/inne skrypty. Nie sądzę, aby było to zjawisko masowe, nie sądzę, aby przekraczało 1% internautow.

    porneL: userzy z wyłączonym JS to pewnie 1-2%, z kolei BBCode wyławia boty, zresztą nie zauważyłem aby Google czy Yahoo (ani nawet spamboty) używały refererów i to takich.

    Co do cache, masz rację, to może być jakaś przyczyna różnic.

  7. uglukk

    Dość popularne jest rozszerzenie do FF Noscript, którego i ja używam. Pozwala ono na wycięcie javascriptu i javy wszędzie poza wybranymi domenami.

  8. Mikołaj

    Z tego wniosek, że nie ma dobrego skryptu statystyk — kazdy kłamie na swój sposób ;)
    Mimo to pozostanę przy GA, bo daje mnóstwo informacji, jakich nie dostanę z Gemiusa, Webalizera czy AWStats.

    Swoją drogą czy stworzenie niezawodnego skryptu statystyk jest w ogóle możliwe?

  9. Michał Stempień

    Nigdy jakoś nie przekonałem się do GA, chociaż wstawione jest i ciągle zlicza. Za to bardzo cenie sobie BBClone, na chwile obecną brakuje mi w nim tylko sprawdzania rozdzielczości usera.

  10. Piotr Konieczny

    Są (obecnie: były) gorsze rzeczy, niż błędy w zliczaniu refererów…
    http://blog.konieczny.be/2006/06/18/a-nasty-bug-in-google-analytics/

  11. Mikołaj

    Jak się okazuje, Gemius też ma błędy i to zasadnicze. Tak przynajmniej można wnioskować po przeczytaniu tekstu u Marka Futregi:
    http://www.futrega.org/stek/2006/06/27/pbi_gemius_toria_z_bledem.html

    Moje pytanie o istnienie dobrego skryptu statystyk pozostaje otwarte. A BBClone spróbuję przetestować ;)

  12. rebeliant

    Nio właśnie i ja zainstalowałem sobie na stronce GA oraz mam własny skrypcik który mi zlicza wejścia.
    Wnioski:
    mój skrypt zliczył 167 wejść w 24h (sprawdzane z logami z serwa) GA … 31 :/
    co ciekawe wg mojego skryptu wejścia rejestrowane były w stosunkowo równych odstepach czasu
    a GA rejestruje zwykle od 8:00 do 17:00 i może czasem „coś” później (niejest to kwestia jednego dnia,ale tak zlicza cały czas)
    co jest grane??

Zostaw komentarz

W komentarzu można (choć nie trzeba) używać podstawowych znaczników XHTML. Komentarze zawierające w podpisie słowa kluczowe mogą zostać potraktowane jako spam i usunięte.