Sztuczna intuicja maszyny

Algorytmy przewidują skuteczność promocji w sklepach. Albo to, która firma zdobędzie inwestorów.

Aktualizacja: 20.10.2015 18:15 Publikacja: 20.10.2015 17:29

W „Raporcie mniejszości” z Tomem Cruisem przewidywanie zdarzeń służyło ściganiu zbrodni

W „Raporcie mniejszości” z Tomem Cruisem przewidywanie zdarzeń służyło ściganiu zbrodni

Foto: materiały prasowe

Analiza danych wymaga nie tylko umiejętności liczenia. Potrzebna jest też spostrzegawczość i przede wszystkim intuicja, które pozwolą analitykowi doszukać się ukrytych zależności pomiędzy zmiennymi. Intuicja to cecha wydawałoby się typowo ludzka. Jednak dobrze napisany program komputerowy potrafi ją zastąpić.

Max Kanter, student Massachusetts Institute of Technology (MIT), napisał swój program w ramach pracy magisterskiej. Zarówno jemu, jak i jego promotorowi algorytm wydawał się bardzo dobry, potrzeba jednak było jakiegoś obiektywnego testu. O to w świecie analityków danych nietrudno. Środowisko to organizuje konkursy na najtrafniejszą analizę, więc Kanter zgłosił swój program do kilku edycji takich zmagań: pucharu KDD 2014 i 2015 oraz zawodów IJCAI 2015. Zasady były za każdym razem podobne. Uczestnicy otrzymywali bazę z olbrzymią ilością danych i na tej podstawie musieli odpowiedzieć jak najtrafniej na konkursowe pytanie.

 

W przypadku konkursu KDD należało przewidzieć, który z uczestników internetowych studiów zrezygnuje z kursu w ciągu dziesięciu dni oraz który z pomysłów na biznes przedstawiony na portalu crowdfundingowym zostanie przez publiczność uznany za ekscytujący. Przewidywania dotyczyły więc ludzkich zachowań. W obu edycjach pucharu KDD algorytm studenta wykazał się zdolnością przewidywania na poziomie 95 proc. tego, co zaprezentował zwycięzca, pokonując większość innych drużyn.
A były to drużyny nie byle jakie, sami fascynaci analizy danych, motywowani chęcią zdobycia nagród z puli wynoszącej 20 tys. dolarów.

 

W trzecim konkursie (IJCAI 2015) algorytm miał za zadanie przewidzieć, który klient kupujący towar w promocji powróci potem, by kupić tę samą rzecz już w pełnej cenie. Jest to pytanie, które spędza sen z powiek wielu ekspertom od sprzedaży. Główna nagroda w tym konkursie ufundowana przez chiński koncern handlowy Alibaba wynosiła 50 tys. dolarów. Program Kantera poradził sobie tu nieco gorzej (87 proc. wyniku zwycięzcy).

 

Jak działa ten algorytm?
W sposób dość mechaniczny wykorzystuje moc obliczeniową komputera, tworząc mnóstwo nowych parametrów. Mnoży i dzieli dane wejściowe przez siebie, sprawdzając na przykład maksymalny, minimalny i średni koszt zamówienia klienta. Potem te nowo otrzymane zmienne przetwarza znów i znów, tworząc zmienne, które człowiek uznałby za bezsensowne i pozbawione odniesień w rzeczywistości. Algorytm działa więc niejako na ślepo, bez jakiejkolwiek próby wniknięcia w istotę sytuacji. Nie zastanawia się, które parametry są mniej ważne. Po prostu wykonuje na nich mnóstwo różnych działań, poszukując zależności.

 

O sukcesie algorytmu Kantera  poinformowało biuro prasowe MIT, twierdząc, że jest to przełomowe odkrycie, bo oto komputer pokonał ludzi w konkursie na analizę danych.

 

Natychmiast informację przekazały dalej inne media. Jednak w doniesieniach zabrakło jednego ważnego szczegółu – otóż drużyny, z którymi algorytm Kantera przegrał, również używały programów komputerowych, tyle że innych. Zmagania, w których maszynie z MIT poszło najgorzej (IJCAI), są wręcz zawodami dla sztucznej inteligencji. W konkursie KDD startują ludzie, ale wspomagają się komputerami.

 

Oznacza to, że mamy do czynienia z sytuacją jednocześnie mniej i bardziej interesującą, niż przedstawia to dział PR politechniki MIT. Bo z jednej strony program Kantera nie jest wcale taki przełomowy. Jest tylko jednym z wielu algorytmów. Ale z drugiej strony samo użycie algorytmów w analizie danych rzeczywiście jest przełomem.

 

Żyjemy w czasach, gdy zbieranie danych jest wyjątkowo łatwe, gromadzimy ich tak monstrualne ilości, że tylko maszyny są w stanie zapoznać się z nimi i wyciągnąć z nich wnioski. I nawet jeśli robią to w sposób mechaniczny, są w tym rzeczywiście dobre.

 

Zwycięzca pucharu KDD 2015 zgadywał, czy student w ciągu dziesięciu dni porzuci internetowy kurs, z dokładnością do 90 proc. Co do algorytmów przewidujących efektywność promocji, to dotychczas specjaliści firmy Alibaba potrafili prognozować tę skuteczność w 65 proc. Zwycięski program osiągnął 70 proc. Te wyniki będą się poprawiać, choć oczywiście nigdy nie osiągną stuprocentowej dokładności.

Max Kanter, student Massachusetts Institute of Technology (MIT), napisał swój program w ramach pracy magisterskiej. Zarówno jemu, jak i jego promotorowi algorytm wydawał się bardzo dobry, potrzeba jednak było jakiegoś obiektywnego testu. O to w świecie analityków danych nietrudno. Środowisko to organizuje konkursy na najtrafniejszą analizę, więc Kanter zgłosił swój program do kilku edycji takich zmagań: pucharu KDD 2014 i 2015 oraz zawodów IJCAI 2015. Zasady były za każdym razem podobne. Uczestnicy otrzymywali bazę z olbrzymią ilością danych i na tej podstawie musieli odpowiedzieć jak najtrafniej na konkursowe pytanie.

W przypadku konkursu KDD należało przewidzieć, który z uczestników internetowych studiów zrezygnuje z kursu w ciągu dziesięciu dni oraz który z pomysłów na biznes przedstawiony na portalu crowdfundingowym zostanie przez publiczność uznany za ekscytujący. Przewidywania dotyczyły więc ludzkich zachowań. W obu edycjach pucharu KDD algorytm studenta wykazał się zdolnością przewidywania na poziomie 95 proc. tego, co zaprezentował zwycięzca, pokonując większość innych drużyn.
A były to drużyny nie byle jakie, sami fascynaci analizy danych, motywowani chęcią zdobycia nagród z puli wynoszącej 20 tys. dolarów.

W trzecim konkursie (IJCAI 2015) algorytm miał za zadanie przewidzieć, który klient kupujący towar w promocji powróci potem, by kupić tę samą rzecz już w pełnej cenie. Jest to pytanie, które spędza sen z powiek wielu ekspertom od sprzedaży. Główna nagroda w tym konkursie ufundowana przez chiński koncern handlowy Alibaba wynosiła 50 tys. dolarów. Program Kantera poradził sobie tu nieco gorzej (87 proc. wyniku zwycięzcy).

Jak działa ten algorytm?
W sposób dość mechaniczny wykorzystuje moc obliczeniową komputera, tworząc mnóstwo nowych parametrów. Mnoży i dzieli dane wejściowe przez siebie, sprawdzając na przykład maksymalny, minimalny i średni koszt zamówienia klienta. Potem te nowo otrzymane zmienne przetwarza znów i znów, tworząc zmienne, które człowiek uznałby za bezsensowne i pozbawione odniesień w rzeczywistości. Algorytm działa więc niejako na ślepo, bez jakiejkolwiek próby wniknięcia w istotę sytuacji. Nie zastanawia się, które parametry są mniej ważne. Po prostu wykonuje na nich mnóstwo różnych działań, poszukując zależności.

O sukcesie algorytmu Kantera  poinformowało biuro prasowe MIT, twierdząc, że jest to przełomowe odkrycie, bo oto komputer pokonał ludzi w konkursie na analizę danych.

Natychmiast informację przekazały dalej inne media. Jednak w doniesieniach zabrakło jednego ważnego szczegółu – otóż drużyny, z którymi algorytm Kantera przegrał, również używały programów komputerowych, tyle że innych. Zmagania, w których maszynie z MIT poszło najgorzej (IJCAI), są wręcz zawodami dla sztucznej inteligencji. W konkursie KDD startują ludzie, ale wspomagają się komputerami.

Oznacza to, że mamy do czynienia z sytuacją jednocześnie mniej i bardziej interesującą, niż przedstawia to dział PR politechniki MIT. Bo z jednej strony program Kantera nie jest wcale taki przełomowy. Jest tylko jednym z wielu algorytmów. Ale z drugiej strony samo użycie algorytmów w analizie danych rzeczywiście jest przełomem.

Żyjemy w czasach, gdy zbieranie danych jest wyjątkowo łatwe, gromadzimy ich tak monstrualne ilości, że tylko maszyny są w stanie zapoznać się z nimi i wyciągnąć z nich wnioski. I nawet jeśli robią to w sposób mechaniczny, są w tym rzeczywiście dobre.

Zwycięzca pucharu KDD 2015 zgadywał, czy student w ciągu dziesięciu dni porzuci internetowy kurs, z dokładnością do 90 proc. Co do algorytmów przewidujących efektywność promocji, to dotychczas specjaliści firmy Alibaba potrafili prognozować tę skuteczność w 65 proc. Zwycięski program osiągnął 70 proc. Te wyniki będą się poprawiać, choć oczywiście nigdy nie osiągną stuprocentowej dokładności.

Analiza danych wymaga nie tylko umiejętności liczenia. Potrzebna jest też spostrzegawczość i przede wszystkim intuicja, które pozwolą analitykowi doszukać się ukrytych zależności pomiędzy zmiennymi. Intuicja to cecha wydawałoby się typowo ludzka. Jednak dobrze napisany program komputerowy potrafi ją zastąpić.

Max Kanter, student Massachusetts Institute of Technology (MIT), napisał swój program w ramach pracy magisterskiej. Zarówno jemu, jak i jego promotorowi algorytm wydawał się bardzo dobry, potrzeba jednak było jakiegoś obiektywnego testu. O to w świecie analityków danych nietrudno. Środowisko to organizuje konkursy na najtrafniejszą analizę, więc Kanter zgłosił swój program do kilku edycji takich zmagań: pucharu KDD 2014 i 2015 oraz zawodów IJCAI 2015. Zasady były za każdym razem podobne. Uczestnicy otrzymywali bazę z olbrzymią ilością danych i na tej podstawie musieli odpowiedzieć jak najtrafniej na konkursowe pytanie.

Pozostało 89% artykułu
2 / 3
artykułów
Czytaj dalej. Subskrybuj
Czym jeździć
Technologia, której nie zobaczysz. Ale możesz ją poczuć
Materiał Promocyjny
BaseLinker uratuje e-sklep przed przestojem
Tu i Teraz
Skoda Kodiaq - nowy wymiar przestrzeni
Materiał Promocyjny
Kod Innowacji - ruszył konkurs dla firm stawiających na nowe technologie w komunikacji z konsumentami
Materiał Promocyjny
Polska na czele rewolucji technologii kwantowych
Materiał partnera
Technologie kwantowe: nauka tworzy szanse dla gospodarki
Nowe technologie
Niewykrywalny bombowiec strategiczny Sił Powietrznych USA odbył pierwszy lot