Sztuczna inteligencja ogrywa w pokera mistrzów

Sztuczna inteligencja ograła w pokera czterech mistrzów kasyna.

Aktualizacja: 01.02.2017 17:33 Publikacja: 31.01.2017 17:41

Poker różni się od szachów czy go brakiem pewności co do rzeczywistej siły przeciwnika.

Foto: Bloomberg

Program Libratus wygrał od ludzi ponad 1,7 miliona dolarów – gdyby grano na prawdziwe, a nie wirtualne, pieniądze. Autorzy oprogramowania z Carnegie Mellon University będą jednak musieli się zadowolić samą satysfakcją. Przegrani pokerzyści podzielą się zaś kwotą 200 tys. dolarów.

Czterej mistrzowie – Jason Les, Dong Kim, Jimmy Chuo, Daniel McAulay – i maszyna rozegrali 120 tys. rozdań przez trzy tygodnie. Turniej odbywał się w Rivers Casino w Pittsburghu według zasad Texas Hold'em, jeden na jednego i bez limitu stawki.

– To wielkie wydarzenie w rozwoju sztucznej inteligencji – mówił prof. Tuomas Sandholm, twórca Libratusa.

– Dostaliśmy lanie – krótko skomentował Jimmy Chuo.

Najbardziej zaskakująca dla ludzi była agresywność poczynań maszyny. Libratus ostro grał nawet o niskie stawki. W dodatku dopasowywał strategie do konkretnego przeciwnika.

– Kiedy wiedziałem, że maszyna blefuje, myślałem sobie: „przecież wcale jej tego nie uczyłem" – mówi naukowiec z zespołu maszyny Noam Brown. – Nie mam pojęcia, do czego Libratus jest zdolny.

Rozgrywki w Rivers Casino trwały od 11 rano do 22 wieczorem. W nocy naukowcy podłączali Libratusa do zasobów superkomputera Bridges w Pittsburgh Supercomputer Center, na którym testowano nowe warianty gry. Każdego dnia rano Libratus był lepszy.

Czterej mistrzowie też po partii nie tylko pili piwo. Do drugiej w nocy wspólnie analizowali strategię maszyny.

– Do mniej więcej dziesiątego dnia myśleliśmy jeszcze, że się z tego wygrzebiemy. Ale później zdaliśmy sobie sprawę, że to już koniec – przyznał Daniel McAuley.

– Nie nauczyliśmy Libratusa, jak dobrze grać w pokera. Daliśmy mu zasady gry i kazaliśmy uczyć się samemu – tłumaczy Brown. Maszyna rozegrała sama ze sobą i innymi programami setki milionów rozdań, aby dopracować strategię wygrywającą.

Pierwszy podobny mecz odbył się w maju 2015 roku. Wówczas prof. Sandholm dostarczył na zawody program o nazwie Claudico. Mistrzowie pokera ośmieszyli wówczas maszynę. Komputer wygrał tylko z jednym z ludzi, pozostała trójka okazała się lepsza od algorytmów.

– Wcale nie byłem pewny, że Libratus teraz wygra. Bukmacherzy przyjmowali zakłady 4 do 1 na zwycięstwo ludzi – mówi prof. Sandholm.

– Libratus okazał się znacznie lepszy, niż sobie wyobrażaliśmy – przyznał Jason Les. – To demoralizujące. Jeśli grasz przeciw człowiekowi, w każdej chwili możesz zrobić sobie przerwę. A tu musieliśmy siedzieć, żeby przez 11 godzin ktoś spuszczał nam lanie. Trudno to znieść, bo nie przywykliśmy do przegrywania.

Naukowcy podkreślają, że algorytmy, dzięki którym Libratus wygrywa, nie są ograniczone tylko do pokera. Znajdą zastosowanie również w innych grach, ale też w negocjacjach biznesowych, sztuce wojennej czy w medycynie.

Założeniem programistów było bowiem stworzenie procesu podejmowania decyzji, który działa również w warunkach niepewności, przy niepełnych danych.

W szachach i go – dyscyplinach, w których sztuczna inteligencja już pokonała ludzi – sytuacja jest w pełni widoczna. Nigdzie nie kryją się niespodzianki, nie ma prób blefu, nie można też ukryć własnej siły lub słabości. Pod tym względem poker znacznie lepiej odzwierciedla niepewność i ryzyko, z którymi mamy do czynienia w życiu.

masz pytanie, wyślij e-mail do autora: p.koscielniak@rp.pl

Reklama