Skocz do linków, Skocz do treści

Niebezpieczne skutki używania OR

12 maja 2006 0:50. Autor: Robert Drózd. 6 komentarzy

Twórcy serwisu Joe Monster ironicznie spytali parę miesięcy temu, czy Telekomunikacja Polska rozszerzyła swoją ofertę?

Na zapytanie: usługi dla frajerów - wyszukiwarka znalazła ponad 800 wyników.

Dział marketingu TP S.A. nie czyta Joe Monstera, wyszukiwarka w serwisie firmy nadal działa w pokazany wyżej sposób.

Mamy tu ilustrację jednego z poważniejszych dylematów, które od wielu lat stały przed twórcami wyszukiwarek. Jeśli użytkownik wpisze więcej niż jedno słowo, jak traktować relację tych słów? Dwa oczywiste operatory logiczne to AND (wszystkie szukane słowa) i OR (dowolne z szukanych słów).

Dylemat chyba już rozwiązany. Nie wdając się w poszukiwanie badań, kilka przyczyn, dla których ? moim zdaniem ? jednak AND, a nie OR.

  • Google tak robi. Ludzie intensywnie używający Googla mają świadomość, że znajdzie on tylko strony związane ze wszystkimi wyrazami, które podano. Jakiś czas temu na ten system przeszedł też Onet, który wcześniej korzystał z OR.
  • Przy OR bardzo trudno jest sortować znalezione informacje. Przykład: szukamy dwóch słów. Skąd wyszukiwarka ma wiedzieć, które z tych słów jest ważniejsze, dokumenty z którym wyświetlić? Czy strona na której było i pierwsze i drugie słowo jest ważniejsza, niż ta na której jest tylko jedno, ale wielokrotnie? Algorytmy tego nie rozwiążą.
    Pierwsze moje doświadczenia z wyszukiwaniem w zagranicznym Internecie. Kolega polecił mi HotBot. Chciałem się czegoś dowiedzieć o amerykańskim pisarzu Philiphie Rothu. Nieznane mi były frazy i operatory specjalne. Wpisałem więc Philip Roth – i przez długi czas myślałem, że ten Internet to jednak globalny śmietnik. HotBot wyrzucił mi dziesiątki stron na których gdzieś te dwa słowa się pojawiały, czasami i razem, ale nie pomogło mi to za wiele.
  • No i wreszcie, przekomiczne rezultaty w przypadku, gdy użytkownikowi chodzi o związek tych słów lub wręcz frazę. Przekomiczne, ale i nieprawdziwe z punktu widzenia użytkownika. Oczywiście na stronach TP ani razu nie pojawia się słowo ?frajerów?. Ale wyszukiwarka oparta na OR zlicza wszystko jak leci, w tym przypadku ?oferty? oraz ?dla?.

Jak można uratować użyteczność wyszukiwarki TP bez jej gruntownej przeróbki?

  • Zmienić opis! Obecny komunikat jest całkowicie błędny: „Wyniki wyszukiwania dla frazy …” sugeruje wprost, że to jest taka fraza czyli coś, co byśmy w Googlu otoczyli znakami cudzysłowu.
  • Rozdzielić liczbę wyników wyszukiwania na poszczególne słowa, czyli np. „oferty: 401, dla: 510, frajerów: 0”. To uświadomi klientowi, że wyszukano osobno każde z tych słów, a nie wszystkie.

Tworzenie wewnętrznych wyszukiwarek nie jest sprawą prostą. Jeśli nie mamy odpowiedniego doświadczenia i zasobów, lepiej kupić gotowe (i skonfigurowane) rozwiązanie.

A jeśli prestiż serwisu na tym nie cierpi ? wtedy po prostu dać formularz wyszukiwania w Google ograniczonym do danej domeny. Warto też nakarmić Googla całą zawartością serwisu korzystając z Google Sitemaps.

Albo jak radzą autorzy Architektury Informacji ? skorzystać z innych narzędzi: na przykład przygotować porządny indeks.

Podobne artykuły:

Być może zainteresują Cię następujące artykuły:

Zapisz się na kanał RSS bloga i dołącz do ponad 1500 czytelników RSS.

Zostań fanem WebAudit na Facebooku.

Komentarze czytelników

Śledź komentarze do tego artykułu: format RSS
  1. Grzegorz Bosak

    Czy ta wyszukiwarka nie funkcjonuje czasem tak jak cala TPSA?

  2. mati

    Miało być:
    „Dział marketingu TP S.A. nie czyta Joe Monstera” – wątpię. Przecież nie wzięli się za obsługę klientów? :>

  3. Sebastian xxxxxxxxxxx

    Szczerze mówiac nigdy nie zwreacalem uwagi na wyszukiwarke TP zreszta to nie moj dział ….
    Jestem pracownikiem TP – i :
    ad.1 -stary uwierz mi pracownicy TP to tez ludzie ,nie ktorzy tak jak ja jestesmy studentami …
    ad.2
    mati to wszystko nie jest takie proste,to zlorzony proces -jesli ktos cos spierzy klient z regoly dostaje k…..y i potem spada to wszystko na mnie
    ,tam gdzie pracuje w oddziale uwierz mi stajemy z regoły na glowie zeby pomoc klientowi -tez jestesmy ludzi i dlaczego mamy nie pomagac innym ?? uwierz mi albo nie ale kazda osobe ktora miala jakis problem -robilem wszystko zeby takiej pomoc ->> oczywiscie jesli ktos jest tez dla mnie mily, i nie wyrzywa sie na mnie :)
    pozdro

  4. cyan

    Odnosząc się kolejno do argumentów Autora:

    – „Google tak robi” – owszem, ale inna reguła (stosowana zresztą przez Google w innych sytuacjach) mówi, że jeśli tylko można pokazać userowi jakieś wyniki – należy to zrobić. Która z reguł jest silniejsza? Wg mnie – druga. Google szuka w nieporównywalnie większej bazie, więc jest bardziej wybredne, choćby dlatego, że generowanie wyników uwzględniających także pojedyncze słowa z frazy byłoby obciążeniem dla serwerów. Typowy serwis korporacyjny nie musi i nie powinien być tak ostrożny w zwracaniu wyników i jeśli wyniki miałyby być zerowe, lepiej wyświetlić pasujące chociaż do niektórych słów z frazy,
    – „Przy OR bardzo trudno jest sortować znalezione informacje” – dobrze działająca wyszukiwarka powinna wg mnie premiować wyniki zawierające wszystkie słowa z frazy (a dodatkowo premiować wyniki, gdzie słowa te występują obok siebie – i najlepiej jeszcze – w tej samej kolejności), a na dalszych miejscach wyświetlać wyniki zawierające chociaż pojedyncze słowa,
    – „No i wreszcie, przekomiczne rezultaty (…)” – tu się częściowo zgadzam, w tym sensie, że użytkownik powinien być informowany, że przedstawione wyniki pasują tylko do części zapytania.

  5. Robert Drózd

    @cyan: tak właśnie robi np. Amazon – podaje, że nie znaleziono produktów ze wszystkimi słowami – i poniżej pokazuje wyniki dla tych słów, które znaleziono.

Komentarze z innych blogów

  1. O tym jak mBank partnerom swoim handlować nie daje : WebAudit Blog

    […] Kto wie, może do każdego egzemplarza dodają myszkę? No jasne, że nie, mamy ewidentny przykład złych skutków stosowania OR w wyszukiwarce. […]

Zostaw komentarz

W komentarzu można (choć nie trzeba) używać podstawowych znaczników XHTML. Komentarze zawierające w podpisie słowa kluczowe mogą zostać potraktowane jako spam i usunięte.