Jak działają najpopularniejsze wyszukiwarki internetowe? Skąd „wiedzą” czego poszukujemy i który wynik wyświetlić na górze strony? Ostatnia wymiana ognia między Google i Microsoftem daje o tym pewne wyobrażenie.
Przedstawiciele Google twierdzą, że wyszukiwarka Bing (konkurent Google) ni mniej, ni więcej tylko kopiuje wyniki zamiast stosować własne algorytmy. W dodatku zdołali to udowodnić stosując sprytną pułapkę, w którą złapali się twórcy Bing.
Sprawę opisuje na firmowym blogu Amit Singhal z Google. W lecie 2010 roku programiści odpowiedzialni za tę najpopularniejszą wyszukiwarkę internetową zaczęli sprawdzać wyniki dla słowa „tarsorrhaphy” (to rzadko stosowana procedura chirurgiczna polegające na czasowym zamknięciu, zszyciu, szpary powiekowej). Wyszukiwarka Google zwracała poprawne wyniki również dla słowa wpisanego z błędem („torsorophy”) — takie pomyłki, literkówki, często zdarzają się internautom i oprogramowanie wyszukiwarki potrafi sobie z nimi radzić.
„Niedługo później Bing również zaczął pokazywać wyniki dla słowa z błędem, jednak nie wyświetlając poprawnej wersji” — pisze Singhal. „To było bardzo dziwne. Jak mogli mieć poprawne wyniki bez poprawnego wyszukiwanego słowa? ” W ciągu kolejnych kilku miesięcy w wyszukiwarce Bing coraz częściej zaczęły pojawiać się wyniki z Google. „Nie mogliśmy oprzeć się wrażeniu, że dzieje się coś dziwnego” — czytamy na oficjalnym blogu firmy.
Dlatego programiści zastawili pułapkę. W październiku ubiegłego roku utworzono 100 sztucznych wyników wyszukiwania „przypiętych” do słów, a właściwie zbitek liter, których zapewne nikt nie wpisałby w wyszukiwarkę. Na przykład szukanie „hiybbprqg” wyświetlało link do rezerwacji biletów w jednym z teatrów w Los Angeles. (Inne „słowa” to „juegosdeben1ogrande” kierujące do sklepu z ozdobami, czy „delhipublicschool40 chdjob” kierujące do usług bankowych). Poszukiwane słowo i wynik nie miały ze sobą nic wspólnego — z wyjątkiem sztucznego sklejenia ich w Google. Następnie 20 inżynierom rozdano laptopy ze świeżo zainstalowanym Windows i polecono wpisywać w Bing 100 słów-pułapek.
Po kilku tygodniach absurdalne wyniki zaczęły również ukazywać się w wyszukiwarce Bing. Google miało w ręku dowód.
- Rezultaty z Bing przypominają niekompletne i nieświeże wyniki wyszukiwania z Google. Tania podróbka — nie owija w bawełnę Singhal.
- Nie kopiujemy wyników z Google — zapewnia Stefan Weitz, szef Bing. — Wykorzystujemy różne sygnały i metody w ustalaniu kolejności wyszukanych wyników.
Jak tłumaczy Weitz dane to mogą pochodzić ze specjalnych rozszerzeń instalowanych w przeglądarce (m. in toolbarów), które śledzą czym interesuje się użytkownik i w co klika. Na tej podstawie może powstać swego rodzaju ranking stron wykorzystywany później do precyzowania wyników szukania. W odpowiedzi na zarzuty Google Microsoft stara się wytłumaczyć na oficjalnym blogu jak działa Bing. Harry Shum przywołuje tam „1000 metod” wykorzystywanych przez Bing do tworzenia listy rezultatów szukania.
Z tych danych wynika, że Microsoft rutynowo wykorzystuje przeglądarkę Internet Explorer oraz różne mechanizmy wbudowane w Windows do zbierania danych o tym, w co użytkownicy klikają i czego szukają w Internecie. To prawdopodobnie tą drogą wyniki z Google przeciekają do konkurencyjnej wyszukiwarki.
[ramka][srodtytul]Czytaj więcej[/srodtytul]
[b][link=http://googleblog.blogspot.com/2011/02/microsofts-bing-uses-google-search.html]Jak Google złapał Microsoft na oszustwie [/link][/b]
[link=http://www.bing.com/community/site_blogs/b/search/archive/2011/02/01/thoughts-on-search-quality.aspx]Jak Microsoft się tłumaczy[/link] [/ramka]