Niebezpieczne skutki używania OR
Twórcy serwisu Joe Monster ironicznie spytali parę miesięcy temu, czy Telekomunikacja Polska rozszerzyła swoją ofertę?
Dział marketingu TP S.A. nie czyta Joe Monstera, wyszukiwarka w serwisie firmy nadal działa w pokazany wyżej sposób.
Mamy tu ilustrację jednego z poważniejszych dylematów, które od wielu lat stały przed twórcami wyszukiwarek. Jeśli użytkownik wpisze więcej niż jedno słowo, jak traktować relację tych słów? Dwa oczywiste operatory logiczne to AND (wszystkie szukane słowa) i OR (dowolne z szukanych słów).
Dylemat chyba już rozwiązany. Nie wdając się w poszukiwanie badań, kilka przyczyn, dla których ? moim zdaniem ? jednak AND, a nie OR.
- Google tak robi. Ludzie intensywnie używający Googla mają świadomość, że znajdzie on tylko strony związane ze wszystkimi wyrazami, które podano. Jakiś czas temu na ten system przeszedł też Onet, który wcześniej korzystał z OR.
- Przy OR bardzo trudno jest sortować znalezione informacje. Przykład: szukamy dwóch słów. Skąd wyszukiwarka ma wiedzieć, które z tych słów jest ważniejsze, dokumenty z którym wyświetlić? Czy strona na której było i pierwsze i drugie słowo jest ważniejsza, niż ta na której jest tylko jedno, ale wielokrotnie? Algorytmy tego nie rozwiążą.
Pierwsze moje doświadczenia z wyszukiwaniem w zagranicznym Internecie. Kolega polecił mi HotBot. Chciałem się czegoś dowiedzieć o amerykańskim pisarzu Philiphie Rothu. Nieznane mi były frazy i operatory specjalne. Wpisałem więc Philip Roth – i przez długi czas myślałem, że ten Internet to jednak globalny śmietnik. HotBot wyrzucił mi dziesiątki stron na których gdzieś te dwa słowa się pojawiały, czasami i razem, ale nie pomogło mi to za wiele. - No i wreszcie, przekomiczne rezultaty w przypadku, gdy użytkownikowi chodzi o związek tych słów lub wręcz frazę. Przekomiczne, ale i nieprawdziwe z punktu widzenia użytkownika. Oczywiście na stronach TP ani razu nie pojawia się słowo ?frajerów?. Ale wyszukiwarka oparta na OR zlicza wszystko jak leci, w tym przypadku ?oferty? oraz ?dla?.
Jak można uratować użyteczność wyszukiwarki TP bez jej gruntownej przeróbki?
- Zmienić opis! Obecny komunikat jest całkowicie błędny: „Wyniki wyszukiwania dla frazy …” sugeruje wprost, że to jest taka fraza czyli coś, co byśmy w Googlu otoczyli znakami cudzysłowu.
- Rozdzielić liczbę wyników wyszukiwania na poszczególne słowa, czyli np. „oferty: 401, dla: 510, frajerów: 0”. To uświadomi klientowi, że wyszukano osobno każde z tych słów, a nie wszystkie.
Tworzenie wewnętrznych wyszukiwarek nie jest sprawą prostą. Jeśli nie mamy odpowiedniego doświadczenia i zasobów, lepiej kupić gotowe (i skonfigurowane) rozwiązanie.
A jeśli prestiż serwisu na tym nie cierpi ? wtedy po prostu dać formularz wyszukiwania w Google ograniczonym do danej domeny. Warto też nakarmić Googla całą zawartością serwisu korzystając z Google Sitemaps.
Albo jak radzą autorzy Architektury Informacji ? skorzystać z innych narzędzi: na przykład przygotować porządny indeks.
Podobne artykuły:
Być może zainteresują Cię następujące artykuły:
- Dlaczego twoja wyszukiwarka ma być gorsza od Google?
- Nowy komputronik.pl i wyszukiwarka która zawodzi
- Pomiń intro razem z Google
- Gazeta.pl i szkolne błędy wyszukiwarki
- Stronę Windows Live lepiej odwiedzać Firefoksem
Zapisz się na kanał RSS bloga i dołącz do ponad 1500 czytelników RSS.
Komentarze czytelników
Komentarze z innych blogów
- O tym jak mBank partnerom swoim handlować nie daje : WebAudit Blog
[…] Kto wie, może do każdego egzemplarza dodają myszkę? No jasne, że nie, mamy ewidentny przykład złych skutków stosowania OR w wyszukiwarce. […]
17 maja 2006 20:49
Czy ta wyszukiwarka nie funkcjonuje czasem tak jak cala TPSA?
12 czerwca 2006 18:34
Miało być:
„Dział marketingu TP S.A. nie czyta Joe Monstera” – wątpię. Przecież nie wzięli się za obsługę klientów? :>
13 października 2007 22:49
Szczerze mówiac nigdy nie zwreacalem uwagi na wyszukiwarke TP zreszta to nie moj dział ….
Jestem pracownikiem TP – i :
ad.1 -stary uwierz mi pracownicy TP to tez ludzie ,nie ktorzy tak jak ja jestesmy studentami …
ad.2
mati to wszystko nie jest takie proste,to zlorzony proces -jesli ktos cos spierzy klient z regoly dostaje k…..y i potem spada to wszystko na mnie
,tam gdzie pracuje w oddziale uwierz mi stajemy z regoły na glowie zeby pomoc klientowi -tez jestesmy ludzi i dlaczego mamy nie pomagac innym ?? uwierz mi albo nie ale kazda osobe ktora miala jakis problem -robilem wszystko zeby takiej pomoc ->> oczywiscie jesli ktos jest tez dla mnie mily, i nie wyrzywa sie na mnie :)
pozdro
13 maja 2009 01:39
Odnosząc się kolejno do argumentów Autora:
– „Google tak robi” – owszem, ale inna reguła (stosowana zresztą przez Google w innych sytuacjach) mówi, że jeśli tylko można pokazać userowi jakieś wyniki – należy to zrobić. Która z reguł jest silniejsza? Wg mnie – druga. Google szuka w nieporównywalnie większej bazie, więc jest bardziej wybredne, choćby dlatego, że generowanie wyników uwzględniających także pojedyncze słowa z frazy byłoby obciążeniem dla serwerów. Typowy serwis korporacyjny nie musi i nie powinien być tak ostrożny w zwracaniu wyników i jeśli wyniki miałyby być zerowe, lepiej wyświetlić pasujące chociaż do niektórych słów z frazy,
– „Przy OR bardzo trudno jest sortować znalezione informacje” – dobrze działająca wyszukiwarka powinna wg mnie premiować wyniki zawierające wszystkie słowa z frazy (a dodatkowo premiować wyniki, gdzie słowa te występują obok siebie – i najlepiej jeszcze – w tej samej kolejności), a na dalszych miejscach wyświetlać wyniki zawierające chociaż pojedyncze słowa,
– „No i wreszcie, przekomiczne rezultaty (…)” – tu się częściowo zgadzam, w tym sensie, że użytkownik powinien być informowany, że przedstawione wyniki pasują tylko do części zapytania.
7 października 2009 12:03
@cyan: tak właśnie robi np. Amazon – podaje, że nie znaleziono produktów ze wszystkimi słowami – i poniżej pokazuje wyniki dla tych słów, które znaleziono.