Jak przeciwdziałać halucynacjom i szkodliwym treściom

Jak znaleźć bezpieczny rodzaj sztucznej inteligencji i o czym pamiętać? Najważniejsze jest znalezienie rozwiązania, które pozwoli na identyfikację potencjalnie „groźnych” wyników działania modelu, któremu towarzyszyć będą środki „naprawcze”.

Aktualizacja: 27.07.2024 08:06 Publikacja: 16.01.2024 02:00

Jak przeciwdziałać halucynacjom i szkodliwym treściom

Foto: Adobe Stock

Michał Nowakowski

Halucynacje i szkodliwe treści. Czy da się im przeciwdziałać, korzystając z zewnętrznych modeli? Odpowiedź na to pytanie jest krótka: w pewnym stopniu. No, chyba że zdecydujemy się na poddanie każdego wkładu do modelu manualnym procesom, które w rezultacie pozbawią nas efektywności charakterystycznej dla generatywnej AI. Modele, które są dla nas dostępne zarówno w modelu subskrypcyjnym i osobistym, jak i poprzez API, są modelami niedokładnymi, podatnymi na błędy oraz mogącymi generować treści, które są co najmniej niepożądane („treści wrażliwe” lub „szkodliwe”). Możemy więc uzyskać odpowiedzi, które nie będą prawdziwe, lub otrzymać treść, która godzi w obyczaje lub jest w jakiś sposób dyskryminacyjna. Mamy też „worek” z tymi wynikami działania AI, które z jakichś względów zakłamują rzeczywistość i wykraczają poza zbiór danych wykorzystywanych w procesie trenowania.

Pozostało 89% artykułu

Treść dostępna jest dla naszych prenumeratorów!

Kontynuuj czytanie tego artykułu w ramach e-prenumeraty Rzeczpospolitej. Korzystaj z nieograniczonego dostępu i czytaj swoje ulubione treści w serwisie rp.pl i e-wydaniu.

Kup teraz Zaloguj się

Konsumenci

Paliwo będzie droższe o 50 groszy na litrze, rachunki za gaz o jedną czwartą

Rząd szykuje wdrożenie dyrektywy UE, która obciąży opłatą sprzedawców paliw. Na początek 40 gr/l.

Materiał Promocyjny

Hyundai Tucson z ratą 1.568 zł/mies. w leasingu 100% online!

Praca, Emerytury i renty

Krem z filtrem, walizka i autoresponder – co o urlopie powinien wiedzieć pracownik

Sezon urlopowy w pełni! Piaszczyste plaże, górskie pasma i mazurskie jeziora – o tym myślą pracownicy zamykając laptopy ostatniego dnia przed urlopem. Zanim jednak wszyscy udadzą się na zasłużony wypoczynek i zakupią przewodniki po atrakcyjnych destynacjach na całym świecie, zapraszamy do zapoznania się z naszym przewodnikiem po urlopie.

Podatki

Wykup samochodu z leasingu – skutki w PIT i VAT

Pod koniec trwania umowy leasingu operacyjnego, wielu przedsiębiorców zastanawia się, czy lepiej wykupić samochód do majątku firmowego, czy do prywatnego. Aby podjąć dobrą decyzję, trzeba wcześniej przeanalizować jej konsekwencje podatkowe.

Nieruchomości

Jak kwestionować niezgodne z prawem plany inwestycyjne sąsiada? Odpowiadamy

Jak lokalizować budynki mieszkalne i jak kwestionować niezgodne z prawem plany inwestycyjne sąsiada? Odpowiedzi na konkretne pytania.

Materiał Promocyjny

Mity i fakty – Samochody elektryczne nie są ekologiczne

Często w wątpliwość poddaje się ekologiczny charakter samochodów elektrycznych. Główne zarzuty dotyczą produkcji prądu zużywanego przez auta elektryczne, procesu recyclingu oraz emisji CO2 jaka powstaje w czasie ich wytwarzania.

Nieruchomości

Wywłaszczenia pod inwestycje infrastrukturalne. Jakie mamy prawa?

Jakie są podstawy wywłaszczenia nieruchomości? Kiedy moja nieruchomość może zostać wywłaszczona? Kto może pozbawić mnie nieruchomości? Czy za wywłaszczenie dostanę odszkodowanie? Odpowiadamy na najważniejsze pytania dotyczące wywłaszczeń nieruchomości.

Materiał Promocyjny

Konto Osobiste w Citi Handlowy. Zyskaj 6,8% w Ofercie Powitalnej.

„Mars Express. Świat, który nadejdzie”, reż. Jérémie Périn, dystr. Gutek Film

Plus Minus

„Mars Express”: AI zdycha czy umiera?

„Mars Express” przypomina, że definicja człowieczeństwa wcale nie jest oczywista.

OpenAI informuje, że uruchomiło zapisy na nowe narzędzie, które znajduje się obecnie w fazie prototy

Technologie

Koniec dominacji Google? Twórca ChatGPT wprowadza wyjątkową wyszukiwarkę z AI

OpenAI wkracza na terytorium od dawna zdominowane przez Google, uruchamiając SearchGPT, wyszukiwarkę opartą na sztucznej inteligencji, zapewniającą dostęp do informacji z Internetu w czasie rzeczywistym.

Biznes

Wykup nieruchomości z użytkowania wieczystego – kiedy się opłaca?

Użytkownicy wieczyści, którym przysługuje prawo nabycia nieruchomości na własność, mają coraz mniej czasu na złożenie wniosku. Nie wszyscy są świadomi, że taki wykup może „uzdrowić” stan prawny nieruchomości.

Internet i prawo autorskie

Prawa autorskie w marketingu – umowa z domem mediowym

Pracami, które mogą stanowić własność intelektualną, są m.in. prezentacje, ulotki, broszury, animacje, grafiki, klipy reklamowe czy kontent marketingowy zawarty na stronach internetowych lub w social mediach. Z tych względów warto zadbać o uregulowanie kwestii prawnoautorskich w umowie zawieranej z agencją czy domem mediowym.

Dane osobowe

Usługi digital health. Czy tajemnica lekarska jest chroniona?

Medycyna w XXI przeniosła się także do internetu i różnego rodzaju aplikacji mobilnych. Z jednej strony, jest to duże ułatwienie dla pacjentów, z drugiej niejednokrotnie wiąże się z obawą o bezpieczeństwo ich danych medycznych.

Biznes

Konsola do gier w kosztach firmy

Przedsiębiorca, który chce poszerzyć zakres działalności, musi zainwestować w nowe urządzenia. Fiskus to rozumie.

Podatki

Projekt wspierany środkami unijnymi? Uważaj na płatności gotówkowe

Limit płatności gotówką obowiązuje przedsiębiorców oraz podatników VAT. Czy beneficjenci środków unijnych mają dodatkowe ograniczenia przy realizacji płatności za wydatki w projekcie?

Biznes

Teresa Siudem: Prawo autorskie w marketingu

Treść ulotki lub broszury może być chroniona prawem autorskim. Warto wcześniej uregulować te kwestie.

Władimir Putin i Aleksander Łukaszenko wizytują Wałaam w Republice Karelii

Konflikty zbrojne

Krzyk rozpaczy Niemca skazanego na karę śmierci. Mińsk i Moskwa szantażują Berlin?

Białoruska telewizja rządowa opublikowała rozmowę z obywatelem Niemiec, z której wynika, że mógł paść ofiarą prowokacji KGB. W każdej chwili może zostać stracony przez reżim. Wygląda na to, że Mińsk i Moskwa szantażują niemiecki rząd.

Kalendarium

Kalendarium - Sobota-Niedziela 27-28.07

Co dziś nowego w prawie i gospodarce? Co opublikowano w Dzienniku Ustaw, jaki rozporządzenia wchodzą w życie, jakie ważne interpretacje wydały sądy, co ogłosił GUS, a co zapowiedział rząd? Oto nasze subiektywne kalendarium najważniejszych newsów dla Profesjonalistów.

Świat

Wojna Rosji z Ukrainą. Dzień 885

24 lutego 2022 roku Rosja rozpoczęła pełnowymiarową inwazję na Ukrainę.

W tym roku Zanzibar odwiedzi ponad 800 tysięcy gości z zagranicy

Zanim Wyjedziesz

Zanzibar - każdy turysta zapłaci za obowiązkowe ubezpieczenie

Zanzibar wprowadza obowiązkową opłatę ubezpieczeniową w wysokości 44 dolarów. Będzie ją musiał zapłacić każdy turysta przyjeżdżający na ten archipelag u wybrzeży Afryki.

Celine Dion na wieży Eiffela śpiewa "Hymn do miłości"

Kultura

Jacek Cieślak: Olimpijski Paryż znowu stolicą świata. Artystyczny kankan o wielu znaczeniach

Nawet Przemysław Babiarz, który drugi raz nazwał „Imagine” komunistyczną piosenką, nie był w stanie przyćmić otwarcia paryskich igrzysk w przestrzeni i kulturowym kodzie miasta oraz Francji. Było miejsce na kankana, a finał należał do Celine Dion.

Konflikty zbrojne

Wojna Rosji z Ukrainą. Dzień 884

24 lutego 2022 roku Rosja rozpoczęła pełnowymiarową inwazję na Ukrainę.

Paryż 2024

Paryż 2024. Iga Świątek wkracza na kort, grają siatkarze. Starty Polaków

Igrzyska olimpijskie w Paryżu zostały oficjalnie otwarte. W sobotę rozpoczyna się rywalizacja w kilkunastu dyscyplinach. Wystartuje kilkunastu reprezentantów Polski, w tym Iga Świątek, siatkarze. Kto jeszcze? Jakie mamy szanse? Oto program startów.

Paryż 2024

Zapłonął olimpijski znicz. Igrzyska w Paryżu rozpoczęte

W Paryżu rozpoczęły się 33. letnie igrzyska olimpijskie. Po raz pierwszy w historii ceremonia została zorganizowana w plenerze, a nie na stadionie. Znicz olimpijski zapalili była francuska sprinterka Marie-José Pérec i judoka Teddy Riner.

Paryż 2024

Paryż 2024. Czy można uwieść świat tańcem w deszczu?

Deszcz mógł rozmyć francuski plan uwodzenia świata, ale ceremonia otwarcia igrzysk olimpijskich była spektakularna i pokazała, że także w deszczowym Paryżu można się zakochać.

Akty prawne

Dziennik Ustaw z 26 lipca 2024 r. (poz. 1121-1128)

Akty prawne

Monitor Polski z 26 lipca 2024 r. (poz. 692-689)

Polityka

Rozszerzenie UE w polu zainteresowania nowego polskiego komisarza

Ursula von der Leyen poprosiła państwa członkowskie o nazwiska kandydatów na komisarzy do końca sierpnia. Donald Tusk nie ujawnił jeszcze kogo chce wysłać do Brukseli.

Minister rodziny, pracy i polityki społecznej Agnieszka Dziemianowicz-Bąk na sali obrad Sejmu w Wars

Praca, Emerytury i renty

Sejm uchwalił: renta wdowia w wersji skąpej

Renta wdowia będzie wypłacana od 1 lipca 2025 r. w wysokości 100 proc. własnej emerytury i 15 proc. świadczenia zmarłego małżonka. Wzrośnie dopiero w 2027 r.

Konsumenci

Tylko wiarygodna organizacja będzie mogła walczyć o prawa konsumentów

Nowy typ postępowania grupowego ułatwi konsumentom dochodzenie swoich praw w sądzie – wynika z ustawy uchwalonej we środę.

Gaz

Eksplozja na największym złożu Rosneftu. Jedna osoba nie żyje, szaleje pożar

Do nieoczekiwanego wybuchu doszło na największym polu gazowym koncernu Rosnieft na Półwyspie Jamalskim. Na miejscu zginął jeden pracownik, siedmiu zostało rannych. Złoże płonie.

Konflikty zbrojne

Rosjanie stawiają na tanie drony. Szukają ukraińskiej obrony powietrznej

Rosja zaczęła wykorzystywać nowe, tanie drony w swoich atakach dalekiego zasięgu na Ukrainę. Celem jest wykrywanie obrony powietrznej, nagrywanie dokonanych uszkodzeń i działanie jako wabiki.

Prawo karne

Nowa definicja gwałtu bez poprawki. Co zrobi Andrzej Duda?

Sejm nie zgodził się na wprowadzenie poprawki Senatu do głośnej nowelizacji kodeksu karnego zmieniającej definicję zgwałcenia. Decyzja w sprawie tych przepisów należy teraz do prezydenta Andrzeja Dudy.

Granica z Obwodem Królewieckim w Gołdapi

Mundurowi

Sejm uchwalił: strzelanie na granicy w majestacie prawa

Wojsko działające w ramach operacji pokojowej będzie mogło legalnie używać broni przeciwko cywilom, gdy będą uzasadnione powody.

Zatrzymany przez policję (zdjęcie ilustracyjne)

Prawo karne

Nawoływał do zabicia Tuska i Bodnara. Grozi mu kilka lat za kratami

Policjanci z Kalisza zatrzymali 61-latka mężczyznę miał malować hasła nawołujące do zabójstwa premiera Donalda Tuska i ministra sprawiedliwości Adama Bodnara.

Komentarze i opinie

Igrzyska Olimpijskie i Paraolimpijskie w Paryżu to nie tylko sport

Większość komentarzy dotyczących Igrzysk w Paryżu skupia się wyłącznie na wynikach sportowych, a przecież igrzyska to nie tylko rywalizacja, choć jest ona główną osią tego wydarzenia.

Prawo dla Ciebie

Czy informatorów możemy powszechnie nazywać sygnalistami?

Wątpliwości pojawiające się w związku z tym, że ustawa o ochronie sygnalistów jeszcze nie obowiązuje rozwiewa radca prawny dr Dominika Dörre-Kolasa, partner w Kancelarii Raczkowski sp.k.

Sejm przyjął w piątek poprawki Senatu do nowelizacji ustawy o prawie autorskim i prawach pokrewnych.

Internet i prawo autorskie

Prawo autorskie doszlusowało do XXI wieku. Jest decyzja Sejmu

Nowelizacja ustawy o prawie autorskim i prawach pokrewnych, uprawniająca twórców do otrzymywania tantiem za wykorzystywanie treści online, czeka na podpis prezydenta.

Kolejne samorządy zapowiadają inwestycje w nowe baseny i kąpieliska miejskie

Społeczności lokalne

Skocz do wody dla ochłody. Powstają nowe baseny odkryte i kąpieliska miejskie

Latem także w miastach można bezpiecznie się wykąpać i odpocząć w cieniu drzew. W Bydgoszczy trwa właśnie przetarg na zaprojektowanie i budowę miejskiego kąpieliska w Parku Centralnym.

Gospodarka

Szefowa Banku Rosji traci cierpliwość, mówi o największym przegrzaniu gospodarki

Rosja znajduje się w stanie cyklicznego przegrzania gospodarki, a jego skala jest największa od 16 lat - stwierdziła Elwira Nabiullina kierująca rosyjskim bankiem centralnym. Przyznała, że zwiększa się dziura między spadającą podażą, a rosnącym popytem. Nie wskazała wprost, że to skutki wojny Putina, ale zapowiedziała, że żadnych obniżek stóp już w tym roku nie będzie.