Wytoczył pan proces firmie, która wykorzystała w swej reklamie pana głos przetworzony przez sztuczną inteligencję. W jakich okolicznościach dowiedział się pan o istnieniu tej reklamy?
Pewnego dnia znajomy przesłał mi link do reklamy, na którą natknął się w internecie. Napisał, że słyszy tam coś, co brzmi jak mój głos, ale jednocześnie coś ewidentnie się nie zgadza. Otworzyłem ten link i przeżyłem szok połączony z niedowierzaniem. Usłyszałem głos łudząco podobny do mojego. Powiedziałbym nawet, że to był mój głos, ale mówiący słowa, których nigdy nie wypowiedziałem i których z całą pewnością nie nagrałem na potrzeby reklamy żadnej firmy.
Co było w tym najbardziej uderzające?
Po pierwsze to, że ten głos mówił coś, czego nigdy nie czytałem. Po drugie – mówił w sposób, w jaki ja nie odczytałbym takiego komunikatu. Było w tym coś sztucznego. Zdałem sobie sprawę, że zetknąłem się de facto ze swoim głosowym sobowtórem. W kontekście AI często używa się słowa „klon” głosu, ale ja bym go tutaj nie stosował. Klon z natury rzeczy powinien być identyczny z oryginałem. Sobowtór natomiast zakłada pewną sztuczność, pewne podszywanie się pod kogoś. I właśnie z czymś takim miałem do czynienia.
Czyli nie chodziło tylko o podobieństwo techniczne, ale też o wrażenie podszycia się pod pana?
Dokładnie tak. Ktoś wygenerował głos, który miał brzmieć jak mój i zrobił to po to, by zarobić pieniądze. Nie oszukujmy się – mój głos został użyty komercyjnie. Posłużył do przygotowania reklamy, która dotarła ostatecznie do kilkuset tysięcy osób w internecie.
Czytaj więcej
Znany lektor Jarosław Łukomski domaga się przed sądem zadośćuczynienia za bezprawne wykorzystanie w reklamie jego – przerobionego przez sztuczną in...
Jak laikowi wyjaśnić różnicę między pana prawdziwym głosem a tym wygenerowanym?
Proszę wyobrazić sobie złe połączenie telefoniczne. Słyszymy kogoś niewyraźnie, ale w dalszym ciągu rozpoznajemy tę osobę – np. brata, ciotkę, wujka. Natomiast gdyby po drugiej stronie był robot, wyczulibyśmy to. Maszyna nie potrafi posługiwać się narzędziami prozodycznymi tak jak człowiek – emfazą, akcentem, tempem, pauzą. Melodia i linia głosu, jego sposób poprowadzenia – to wszystko wyglądałoby u mnie zupełnie inaczej.
Zwracał pan zresztą na to uwagę podczas rozprawy w sądzie, mówiąc, że sam przeczytałby pan taki komunikat zupełnie inaczej.
Tak, bo inaczej poprowadziłbym melodię wypowiedzi, inaczej rozłożyłbym akcenty, inaczej ustawiłbym rytm. To nie jest detal. Dla zawodowego lektora to jest istota pracy.
Dlaczego uznał pan, że sprawa powinna trafić do sądu?
Najpierw była po prostu reakcja ludzka – tak jak wspomniałem: szok, niedowierzanie, poczucie wtargnięcia w coś bardzo osobistego. Miałem wrażenie, jakby ktoś wszedł do mojego domu podczas mojej nieobecności i go splądrował. Na marginesie dodam, że strona pozwana używa argumentów w rodzaju: drzwi były otwarte. Tylko że fakt, iż ktoś nie zamknął drzwi na klucz, nie jest zaproszeniem, by wejść do środka.
Czy wcześniej próbowali państwo załatwić spór polubownie?
Tak. W pierwszej kolejności, przy pomocy firmy Mikrofonika, z którą współpracuję na kilku płaszczyznach, zwróciliśmy się pisemnie do tej firmy z prośbą o wyjaśnienia, usunięcie materiałów, przeprosiny i zadośćuczynienie. Chodziło zarówno o wymiar finansowy – bo zostałem pozbawiony wynagrodzenia za komercyjne użycie mojego głosu – jak i o wymiar wizerunkowy. Spotkaliśmy się jednak z odpowiedzią, którą odebrałem jako arogancką. Strona, do której się zwróciliśmy, uznała, że nie doszło do żadnego naruszenia i nie zamierza niczego naprawiać. Po kilku miesiącach stało się dla nas jasne, że tak tego zostawić nie można.
Ugoda wchodzi jeszcze w grę?
Wyczerpaliśmy wszystkie możliwości polubownego załatwienia tej sprawy.
Czytaj więcej
W historii przepisów gospodarczych rzadko zdarza się sytuacja, w której ustawodawca próbuje stworzyć kompleksowe ramy prawne dla technologii będące...
Jedno z najważniejszych pytań w tej sprawie brzmi - skąd w ogóle pana głos trafił do strony pozwanej?
To właśnie pozostaje jedną z największych niewiadomych. Nie wiemy, w jaki sposób mój głosowy sobowtór trafił do dyspozycji firmy JFC Polska. Chcielibyśmy to ustalić, bo uważamy, że to ma znaczenie dla sprawy. Tymczasem strona pozwana najwyraźniej stara się to okryć tajemnicą. Nie chce ujawnić, u kogo zamówiono mój głos ani kto odpowiadał za całą produkcję tych spotów. Powód takiej postawy jest dla mnie niejasny, a sama próba unikania odpowiedzi – podejrzana.
Czeka pan też na opinię biegłego z zakresu fonoskopii.
Tak. Obie strony wnioskowały o jego powołanie – strona pozwana dlatego, że chce udowodnić, iż ten głos nie jest moim głosem. Chodzi o to, żeby przy zastosowaniu metod naukowych stwierdzić, czy wygenerowany głos brzmi jak mój. Do sądu opinia ta wpłynęła w ostatniej chwili, czekam na nią.
Na ile ten proces jest dla pana sprawą osobistą, a na ile czymś większym?
Na pewnym etapie to przestała być tylko moja sprawa. Czuję się może nie tyle powołanym, ale na pewno uprawnionym przedstawicielem środowiska najbliższego sobie, czyli lektorów, ale też szerzej – ludzi pracy twórczej. Co ważne, nie chodzi o walkę ze sztuczną inteligencją jako taką. Chodzi o nieuprawnione wykorzystywanie narzędzi AI. Mam nadzieję, że pozytywny wynik tego procesu może wpłynąć na najbliższe lata pracy wielu ludzi. Być może nie wywoła natychmiast zmian w przepisach, bo prawo ewoluuje powoli, ale może zadziałać odstraszająco. Mam nadzieję, że część osób i firm dwa razy się zastanowi, zanim sięgnie po cudzy głos bez zgody.