Sébastien Bohler. Zachłanny mózg. Jak nienasycony homo sapiens skazuje świat na zagładę

Trudno jest uwolnić się od zasady „ciągle więcej". Jej najbardziej widocznym przejawem jest moda na fast foody i śmieciowe jedzenie. Podobny mechanizm przesądza o potrzebie nowych podbojów seksualnych.

Publikacja: 17.01.2020 17:00

Sébastien Bohler. Zachłanny mózg. Jak nienasycony homo sapiens skazuje świat na zagładę

Foto: AdobeStock

Gdy wewnątrz naszego prążkowia neurobiolodzy zauważyli neurony, w pierwszym momencie sądzili, że ich głów-nym zadaniem jest uwalnianie dopaminy i wzbudzanie przy-jemności w odpowiedzi na osiąganie celu. To prawda, jednak odkrycia ostatnich lat zniuansowały ich hipotezy. Faktycznie, neurony prążkowia i cały – jak go ochrzciliśmy – układ na-grody popychają nas ku temu, co pozwala zdobyć pożywienie, seks, pozycję społeczną, informacje oraz zaoszczędzić energię. Faktycznie, robią to, by zwiększyć nasze szanse przeżycia. Jak z czasem spostrzegli uczeni, cechują się jednak również o wiele istotniejszą właściwością: odgrywają fundamentalną rolę w pro-cesach uczenia.




Jeżeli umieścimy szczura w labiryncie, w którym jest ukry-te pożywienie, a szczur w wybranym przez siebie korytarzu znajdzie kawałek sera, to w momencie dokonania przez niego odkrycia neurony łączące pole brzuszne nakrywki z jądrem półleżącym (w prążkowiu) uwolnią dużą ilość dopaminy. Szczur oczywiście będzie odczuwał przyjemność. To jednak nie koniec doświadczenia, i właśnie jego druga część jest szczególnie inte-resująca. Jeżeli ponownie umieścimy tego samego szczura przy wejściu do labiryntu i jeżeli szczur ponownie wybierze ten sam korytarz, to – jak zauważymy – neurony uwolnią dopaminę już przy wejściu do korytarza. Szczur będzie przewidywał obecność sera na końcu korytarza. Jeśli zwierzę wejdzie do korytarza i doszedłszy do jego końca, znajdzie oczekiwany kawałek sera, odnotujemy brak reakcji neuronów dopaminergicznych, ich bezczynność. Tak, jakby przyjemność nie była potrzebna, bo szczur spodziewał się znaleźć jedzenie i efekt był zgodny z ocze-kiwaniami.

Jeżeli jednak zwierzę nie znajdzie sera, neurony dopaminer-giczne całkowicie się zdezaktywują, wskutek czego mózg odczuje deficyt dopaminy: układ nerwowy ukarze szczura, ponieważ rezultat jest poniżej oczekiwań. Kara działa jak wewnętrzne ostrzeżenie: „Zmień taktykę, bo dotychczasowa nie działa". Szczur wybiera więc inny korytarz. Ponieważ nie wie jeszcze, czego się spodziewać, nie formułuje żadnych oczekiwań odnoś-nie do obecności sera. Jeżeli znajdzie pokarm, neurony dopami-nergiczne zareagują intensywnym wyładowaniem. Następnym razem szczur ponownie wybierze ten sam korytarz. Jeśli na jego końcu znów będzie kawałek sera, neurony dopaminergicz-ne pozostaną obojętne, ponieważ zwierzę się go spodziewało. Ale jeśli łut szczęścia sprawi, że zamiast jednego kawałka sera szczur znajdzie dwa kawałki, neurony dopaminergiczne znowu uwolnią dopaminę.

Doświadczenie dowodzi, że układ nagrody aktywuje się tylko wówczas, gdy zyskujemy więcej, niż się spodziewaliśmy. Oczeki-wane efekty nie dostarczają przyjemności. Wartość ma jedynie rezultat lepszy od przewidywanego. Motywem przewodnim naszych działań jest zasada:

MÓZG NAGRADZA MNIE, GDY ZYSKUJĘ WIĘCEJ NIŻ OSTATNIM RAZEM.

Nietrudno zrozumieć, dlaczego taki system to potężne narzę-dzie dydaktyczne. Każde zachowanie (na przykład wybranie określonego korytarza), które służy osiągnięciu lepszego efektu, jest premiowane kosztem tych, które jedynie powielają wypró-bowane schematy. Dzięki temu układ nerwowy optymalizuje działania i gwarantuje progres.

Doskonale zdajemy sobie sprawę, jaką rolę może to odgrywać w zdobywaniu wiedzy przez człowieka. Załóżmy, że uczysz się grać na pianinie. Twój nauczyciel oswaja cię z pewną metodą, na przykład z charakterystyczną techniką palcowania trudnego fragmentu. Po kilku dniach zauważasz, że ćwiczony fragment wychodzi ci znacznie lepiej. Pod wprawionymi palcami instru-ment brzmi bardzo dobrze, ludzie przysłuchują się twojej grze z przyjemnością, w głowie zaczyna ci kiełkować myśl o wstą-pieniu do konserwatorium! Jednak po upływie kilku tygodni zaczynasz odnosić wrażenie, że stoisz w miejscu. Początkowy entuzjazm wygasł, czujesz znudzenie albo frustrację. Wtedy nauczyciel pokazuje ci nowy sposób palcowania, którego opa-nowanie wymaga nieco więcej pracy. Po miesiącu stwierdzasz, że twoja gra zyskała na płynności, a słuchacze nagradzają cię rzęsistymi brawami. W twoim prążkowiu dochodzi do uwol-nienia dopaminy, a nowe zachowanie zostaje przez mózg auto-matycznie wzmocnione.

W wyjaśnieniu mechanizmu tego systemu uczenia się nieba-gatelną rolę odegrały prace Wolframa Schultza, neuronaukowca z uniwersytetu we Fryburgu w Szwajcarii. Jeżeli chcemy wykonać jakiś ruch albo podejmujemy pewną decyzję, do akcji wkraczają neurony odpowiedzialne za przygotowanie nas do działania. Mieszczą się one w korze, zewnętrznej warstwie mózgu, i mają cieniutkie wypustki, które dzięki strukturom nazywanym sy-napsami łączą się z neuronami prążkowia. Jeżeli wykonanie danego gestu lub zrealizowanie postanowienia przynosi lepsze efekty niż wcześniej podejmowane działania, neurony wycho-dzące z pola brzusznego nakrywki uwalniają w tych synapsach dopaminę. Dopamina jest jak klej neuronalny: błyskawicznie zespala neurony odpowiedzialne za wykonanie korzystnego gestu lub postanowienia z neuronami prążkowia w taki spo-sób, żeby utrwalić w mózgu nowe zachowanie. W efekcie za-pamiętywane są działania, które przynoszą rezultaty lepsze od poprzednich.

Oczywiście, działa to także w drugą stronę: jeżeli nowa czyn-ność nie daje spodziewanego efektu, dostawy dopaminy zostają wstrzymane, a połączenie słabnie. Jeżeli rezultat nie różni się od poprzedniego, połączenie jest po prostu podtrzymywane. A jeżeli inne działanie przyniesie lepsze efekty, powstanie dla niego nowe, jeszcze mocniejsze połączenie, skazując poprzednie na zapomnienie.

Zmuszone do szybszej pracy

Opisany na początku tego rozdziału eksperyment ze szczu-rem i labiryntem, choć przeprowadzony nie w naturze, ale w warunkach laboratoryjnych, bardzo dobrze ilustruje proces ciągłe-go poszukiwania ulepszeń. Podobnych obserwacji dokonano u ludzi. Funkcjonujemy dokładnie tak samo. Podstawo-wym czynnikiem, stanowiącym fundament tej teorii, jest błąd predykcji. Nasz mózg nieustannie opracowuje predykcje, czyli przewidywania dotyczące skutków naszych poczynań, co w sy-tuacji, gdy podejmujemy czynność mogącą przynieść korzyści, powoduje wyładowanie związane z antycypacją neuronów do-paminergicznych. Mózg decyduje o utrwaleniu lub nie dane-go zachowania zależnie od tego, czy między prognozowanym a faktycznym rezultatem wystąpiła różnica i jaki miała charakter. Jeżeli różnica jest pozytywna (rezultat lepszy od przewidywa-nia), zachowanie zostaje mocno utrwalone. Jeżeli różnica jest negatywna (rezultat gorszy od przewidywania), zachowanie zostaje wyeliminowane. Jeżeli nie ma różnicy (rezultat zgodny z przewidywaniem), skutkiem jest zniechęcenie i gotowość pod-jęcia działań umożliwiających osiągnięcie lepszego rezultatu.

Błędy odgrywają zasadniczą rolę w kształtowaniu naszych zachowań. Tę samą zasadę – na długo zanim odkryliśmy, że kierują się nią również nasze prążkowia – wykorzystali cyber-netycy podczas prac nad samouczącymi się sieciami neuro-nowymi, kładąc podwaliny pod uczenie maszynowe, machine learning, i proces „głębokiego" uczenia się, podstawowe za-gadnienia w badaniach nad sztuczną inteligencją. Sieć neuro-nowa zaprogramowana na wykonanie zadania (na przykład rozpoznanie ludzkiej twarzy) dokonuje pomiaru rozbieżności między rezultatem oczekiwanym a przewidywanym przez nią samą. Błędny wynik jest następnie ponownie przesyłany przez połączenia między neuronami, a sieć modyfikuje je tak, aby na następnym etapie obliczeń zmniejszyć rozbieżność. Mówimy wówczas o propagacji wstecznej błędu.

Te same zasady obowiązują w prążkowiu żywych organizmów. Oczekiwanymi rezultatami prążkowia są wzmocnienia pierwot-ne (jedzenie, seks, status, informacja, minimalny wysiłek), a neu-rony dopaminergiczne za każdym razem formułują prognozy odnośnie do naszych możliwości osiągnięcia celów. Różnica między realnymi osiągnięciami a prognozami znajduje odbicie w reakcji układu nagrody – pozytywnej, gdy osiągamy cel korzystniejszy od przewidywanego, lub negatywnej, gdy jest odwrotnie.

Odkrycie tego mechanizmu potwierdziło błyskotliwą hipote-zę, jaką w 1976 roku postawił biolog i genetyk Richard Dawkins. W książce „Samolubny gen", należącej według mnie do dziesięciu książek naukowych, które bezwzględnie należy przeczytać, Daw-kins opisuje organizmy żywe jako maszyny przetrwania. Każde zwierzę z osobna jest nosicielem genów regulujących jego zdol-ność przetrwania, co z kolei umożliwia przekazanie tych genów następnemu pokoleniu. Dawkins stawia następujące pytanie: w jaki sposób geny mogą decydować o budowie i funkcjonowa-niu organizmów dążących do realizowania z góry określonych celów, takich jak odżywianie czy rozmnażanie? Aby obrazowo wyjaśnić całe zagadnienie, przedstawia urządzenie zwane regula-torem Watta. Regulator Watta składa się z dwóch kul krążących wokół osi napędzanej silnikiem parowym. Każda z ołowianych kul jest przytwierdzona do końca ruchomego ramienia, które podnosi się wraz ze wzrostem prędkości obrotowej. Podniesienie ramion powoduje zamknięcie przepustnicy regulującej dopływ pary, co skutkuje zmniejszeniem ciśnienia i spadkiem prędkości. Wraz z ograniczeniem prędkości kule opadają, otwierając prze-pustnicę, co powoduje ponowny wzrost ciśnienia i tym samym prędkości. Ostatecznie, dzięki sukcesywnym korektom, układ osiąga stabilizację, której parametry zależą od tego, w jakim miejscu na ramionach operator urządzenia umocował kule.

Regulator Watta zachowuje się tak, jakby jego celem było osiągnięcie prędkości ustalonej przez obsługę urządzenia. Jeżeli obraca się zbyt szybko, następuje spowolnienie, a jeżeli obraca się zbyt wolno, pojawia się przyśpieszenie. Oczywiście urządzenie nie robi tego świadomie, jest przecież tylko zbiorem metalowych prętów i kul, jednak w oczach zewnętrznego obserwatora wy-gląda to tak, jakby regulator realizował cel. Ten sam obserwator uznałby, że identyczne zachowanie wykazuje szczur, który dzięki węchowi znajduje w labiryncie kawałek sera.

Regulator Watta osiąga swój cel dzięki temu, że rozbieżność między jego zachowaniem a zaprogramowanym celem pociąga za sobą zmiany – na zasadzie sprzężenia zwrotnego – w pracy urządzenia. Wykorzystuje ono błąd, by skalibrować działanie, poprawić parametry i doprowadzić je do wartości najbliższych końcowej równowadze. Regulator Watta działa jak sieci neu-ronowe z propagacją wsteczną. W ten sam sposób zachowują się neurony dopaminergiczne w prążkowiu. Jeżeli nasze dzia-łanie oddala nas od optymalnych korzyści, sygnalizują nam to, wzbudzając nieprzyjemne odczucia; jeżeli do owych korzy-ści zbliża, zachęcają nas zastrzykiem dopaminy. Wracając do naszego porównania, zmienna ilość dopaminy w prążkowiu mogłaby odpowiadać zmiennemu ciśnieniu pary w regulatorze Watta.

Istnieje jednak znacząca różnica między naszym prążkowiem a regulatorem Watta. Gdy urządzenie osiąga żądaną prędkość ob-rotową, utrzymuje ją. Tymczasem w przypadku prążkowia tak się nie dzieje: po zapamiętaniu danej czynności, przynoszącej pewne korzyści (co odpowiada określonemu ciśnieniu pary w regulato-rze), nowym celem referencyjnym stanie się każde zachowanie umożliwiające zdobycie jeszcze większej ilości jedzenia, seksu lub prestiżu. Inaczej mówiąc, prążkowie jest regulatorem Watta zaprogramowanym na ciągły wzrost końcowych parametrów. Wygląda to tak, jakby ktoś nieprzerwanie przesuwał kule ku końcom ramion tak, by wciąż podnosić optymalną wartość pręd-kości obrotowej, zmuszając urządzenie do coraz szybszej pracy.

Nowy partner odradza namiętność

Taki mechanizm działania ma tragiczne konsekwencje: bez zwiększania dawek nie potrafimy stymulować układu nagrody. Gdy kupujemy sobie pierwszy luksusowy samochód, neuro-ny dopaminergiczne reagują entuzjastycznie, ponieważ nowa sytuacja wydaje się korzystniejsza od tej, do której przyzwycza-iliśmy nasz układ nerwowy. Jednak bardzo szybko włączanie zapłonu bez przekręcania kluczyka, miękkie skórzane obicia foteli czy dyskretny pomruk silnika stają się dla neuronów pola brzusznego nakrywki kompletnie przewidywalne i w efekcie przestajemy odczuwać przyjemność. Rzeczy powszednieją po-twornie szybko. Nowe auto, które jeszcze kilka tygodni wcześniej sprawiało, że gdy przechodziliśmy obok salonu samochodowego, serce zaczynało nam bić szybciej, robi się zwyczajne i nudne. Zaczynamy spoglądać w stronę innych, bardziej luksusowych, bardziej podrasowanych modeli, z większym „pazurem" i wy-posażeniem „full opcja" (dodatki premium to smaczki, którymi producenci wabią nasze prążkowia). To prawda, że nowe modele są droższe, ale formuła leasingu pozwala żyć w iluzji, że rachunek jest całkiem rozsądny – 1200 lub 1600 złotych miesięcznie, cóż to jest? Takiej okazji nie można przegapić.

Problem w tym, że za chwilę znów się znudzimy, bo proces powszednienia może potencjalnie powtarzać się w nieskończo-ność. Wzrost możliwości finansowych, żywieniowych czy repro-dukcyjnych przynosi krótkotrwałą satysfakcję i pociąga za sobą konieczność jeszcze intensywniejszego zwiększania zasobów.

W przypadku seksu przekłada się to na potrzebę nowych podbojów. Znużenie partnerem jest, w pewnej mierze, efektem opisanego mechanizmu spadku odczuwania przyjemności pod wpływem przewidywalności sytuacji. Miesiąc po miesiącu, rok po roku komórki nerwowe w prążkowiu nabywają dokładną wiedzę na temat tego, co się wydarzy, więc źródło dopaminy wysycha. W konsekwencji, wskutek zaprogramowanej reak-cji neuronów dopaminergicznych, zaczynamy szukać nowych doznań w większych dawkach. Gdy pojawia się nowy partner seksualny, prążkowie odżywa i odradza się namiętność.

Jednak nie ulega wątpliwości, że bulimia prążkowia rozwija się najbardziej w świecie wirtualnym. Pornografia internetowa zakłada bowiem pojawianie się coraz to nowych pozycji w ofercie filmowej i szybkie zwiększanie dawek. To, że bodźce wizualne są do siebie bardzo podobne, tylko wzmacnia ten mechanizm, dlatego że neurony dopaminergiczne na próżno starają się zna-leźć nagrodę korzystniejszą niż przewidywana. Kompulsywna, regularna konsumpcja pornografii oraz spadek libido są wówczas ewidentnymi oznakami uzależnienia.

To pokazuje, jak trudno jest uwolnić się od zasady „ciągle więcej" wpisanej w nasze neuronalne oprogramowanie. Jej naj-bardziej widocznym przejawem jest moda na fast foody i śmie-ciowe jedzenie, która w ogromnym stopniu przyczynia się do światowej epidemii otyłości. Działanie fast foodów opiera się na przewidywaniu nagrody. Kiedy szczur po raz pierwszy wchodzi do labiryntu, odczuwa przyjemność dopiero na końcu korytarza, w chwili, gdy zjada znaleziony tam kawałek sera. Ale za dru-gim razem prążkowie szczura aktywuje się już przy wejściu do znajomego korytarza, przewidując nagrodę w postaci kawałka sera. Restauracje szybkiej obsługi swój sukces zawdzięczają po-dobnemu mechanizmowi: przykładają wielką wagę do tego, aby ich logo było obecne w mediach i na miejskich lub przydrożnych billboardach, na których jest umieszczona informacja o tym, jak trafić do lokalu, stymulując, poprzez antycypację, nasze neurony dopaminergiczne. Widząc taki przekaz wizualny, mózg, bez udziału naszej świadomości, formułuje prognozę odnośnie do spodziewanej nagrody (w postaci jadalnego zlepka tłuszczu, soli i cukru), a robi to tak precyzyjnie i tak często, że nagroda okazuje się identyczna z przewidywaniami. Dla naszego mózgu jest to gra o sumie zerowej, ponieważ na końcowym etapie nie dochodzi do uwolnienia dopaminy. Skoro schemat wskazówka-–prognoza–rezultat jest całkowicie przewidywalny, jedynym sposobem na uzyskanie w całej tej historii pozytywnych doznań będzie zwiększenie dawki. 

Sébastien Bohler jest francuskim dziennikarzem, felietonistą, mówcą i pisarzem. Redaktor naczelny czasopisma „Cerveau & Psycho". Zajmuje się zagadnieniami związanymi z neuronauką i psychologią.

Książka Sébastiena Bohlera, „Zachłanny mózg. Jak nienasycony homo sapiens skazuje świat na zagładę", przeł. Łukasz Musiał, ukazała się właśnie nakładem wydawnictwa Feeria Science, Łódź 2020. Tytuł i śródtytuły pochodzą od redakcji

Gdy wewnątrz naszego prążkowia neurobiolodzy zauważyli neurony, w pierwszym momencie sądzili, że ich głów-nym zadaniem jest uwalnianie dopaminy i wzbudzanie przy-jemności w odpowiedzi na osiąganie celu. To prawda, jednak odkrycia ostatnich lat zniuansowały ich hipotezy. Faktycznie, neurony prążkowia i cały – jak go ochrzciliśmy – układ na-grody popychają nas ku temu, co pozwala zdobyć pożywienie, seks, pozycję społeczną, informacje oraz zaoszczędzić energię. Faktycznie, robią to, by zwiększyć nasze szanse przeżycia. Jak z czasem spostrzegli uczeni, cechują się jednak również o wiele istotniejszą właściwością: odgrywają fundamentalną rolę w pro-cesach uczenia.

Pozostało 96% artykułu
2 / 3
artykułów
Czytaj dalej. Subskrybuj
Plus Minus
Portugalska rewolucja goździków. "Spotkałam wiele osób zdziwionych tym, co się stało"
Plus Minus
Kataryna: Ministrowie w kolejce do kasy
Plus Minus
Decyzje Benjamina Netanjahu mogą spowodować upadek Izraela
Plus Minus
Prawdziwa natura bestii
Plus Minus
Śmieszny smutek trzydziestolatków