Języków niech się uczy komputer

Za chwilę zniknie ostatnia bariera utrudniająca ludziom komunikację – obiecują inżynierowie. Elektroniczni tłumacze staną się tak doskonali, że nieznajomość języków obcych nie będzie nam komplikować życia

Publikacja: 23.04.2010 01:46

Phraselator wygląda jak specjalnie wzmacniany elektroniczny notes

Phraselator wygląda jak specjalnie wzmacniany elektroniczny notes

Foto: AFP

Wyobraźmy sobie, że w restauracji wystarczy zrobić zdjęcie kartki menu telefonem komórkowym, aby po chwili otrzymać tłumaczenie – i zamówić ulubiony kotlet. Albo przeczytać artykuł w obcym języku. Może nawet książkę. Albo zrozumieć instrukcję obsługi, znaki drogowe, napisy w metrze. Albo porozmawiać przez telefon z osobą, która akurat nie mówi po polsku... Stop. O ile wszystkie wcześniejsze funkcje są dostępne już dziś, o tyle mechaniczne tłumaczenie mowy na żywo to jeszcze przyszłość.

Ale wbrew pozorom nie taka daleka. Niedawno firma Google ogłosiła, że pracuje nad systemem dla swoich telefonów komórkowych, który umożliwi właśnie takie tłumaczenie na żywo. Internetowy gigant dysponuje już dość wydajnym oprogramowaniem do tłumaczenia tekstu. Można z niego korzystać w sieci.

Coraz lepiej działają też systemy rozpoznawania mowy – są używane m.in. w telefonach komórkowych, czy do sterowania niektórymi funkcjami samochodów (np. nawigacją). Teoretycznie wystarczy połączyć te dwie technologie, aby działający automatyczny tłumacz stał się rzeczywistością.

[srodtytul]Powiedz mi to przez telefon[/srodtytul]

Mam w komórce rozpoznawanie mowy, mam tłumacza tekstu, dlaczego nie mogę porozmawiać przez telefon z kimś, kto nie mówi w moim języku? – pytał podczas niedawnej wystawy Mobile World Congress w Barcelonie szef Google Eric Schmidt. I obiecywał: – Jeszcze tego nie zrobiliśmy, ale idziemy w dobrym kierunku.

Schmidt pokazał m.in., w jaki sposób telefon może przetłumaczyć niemieckie menu w restauracji na angielski – wystarczy komórką sfotografować tekst na kartce. Na odpowiedź systemu tłumaczącego trzeba czekać tylko kilka sekund („sałatka wiosenna”).

– Sądzimy, że tłumaczenie mowy na bieżąco jest możliwe i że będzie rozsądnie działać za kilka lat – twierdzi Franz Och, odpowiedzialny w Google’u za technologie maszynowego tłumaczenia. – Oczywiście, aby to działało, jak należy, potrzebne jest połączenie rozpoznawania mowy i precyzyjnego tłumaczenia tekstu z syntezą mowy. Jeśli jednak popatrzymy na to, co ostatnio się dzieje w tych dziedzinach, widać ogromny postęp.

To, co robi teraz Google, nie jest pierwszym podejściem do automatycznego tłumaczenia mowy. Wcześniej, jeszcze w 1999 roku, podobny system, ale ograniczony tylko do angielskiego i japońskiego, opracował Advanced Telecommunications Research Institute. Miał ułatwić obcokrajowcom poruszanie się w Japonii. Powstawały również systemy pozwalające tłumaczyć wiadomości SMS i e-maile. Obecnie można też korzystać z komunikatora internetowego VoxOx, który umożliwia każdemu użytkownikowi pisanie w swoim ojczystym języku, a komputer troszczy się o tłumaczenie wpisów.

[link=http://www.rp.pl/galeria/275010,3,465798.html] [obrazek=http://grafik.rp.pl/grafika2/465798,480543,3.jpg" style="border:1px #808080 solid; margin:5px 0 5px 5px;"] [/link]

Ten pomysł to już prawie techniczna realizacja słynnej ryby Babel z serii science fiction „Autostopem przez galaktykę” Douglasa Adamsa. Małą żółtą rybkę należało umieścić w uchu, a ta, odbierając fale mózgowe, dokonywała błyskawicznego tłumaczenia między językami różnych ras zamieszkujących kosmos. Z nazwy fikcyjnej rybki korzysta teraz jeden z popularniejszych sieciowych serwisów tłumaczących tekst – Yahoo! Babel Fish.

[srodtytul]Jak to będzie: ręce do góry?[/srodtytul]

Dzięki książkowej rybie Babel każdy rozumiał wszystko, co mówili inni, a to szybko doprowadziło do krwawej wojny. W prawdziwym świecie było odwrotnie – to wojna doprowadziła do prób stworzenia maszyn tłumaczących „z obcego na nasze”. Zimna wojna. Już w połowie lat 50. testowano technikę maszynowego tłumaczenia tekstu. W Londynie usiłowano np. tłumaczyć z angielskiego na francuski. Amerykański eksperyment Georgetown (w roku 1954) polegał na translacji kilkudziesięciu zdań z rosyjskiego na angielski. Komputer IBM posługiwał się słownikiem 250 słów (głównie chemia organiczna) i sześcioma zasadami gramatycznymi. Efekty były niezłe i pomysłodawcy ogłosili, że w ciągu trzech – pięciu lat problem tłumaczenia z języków obcych zostanie rozwiązany. Rządowy raport z postępów prac sporządzony ponad dziesięć lat później był jak kubeł zimnej wody – nie udało się, a fundusze zostały zmarnowane.

Mniej więcej wtedy powstała firma Systran tworząca oprogramowanie tłumaczące. Z pomocą tych narzędzi amerykański Wydział Obcych Technologii USAF tłumaczył m.in. naukowe i techniczne dokumenty zdobyte od Rosjan. Dziś korzysta z tej technologii m.in. Yahoo! Babel Fish czy program tłumaczący wbudowany w system Apple Mac OS X. Używał go też Google, dopóki nie uzyskał dostępu do tłumaczonych przez ludzi dokumentów Organizacji Narodów Zjednoczonych, które pozwoliły firmie na opracowanie własnej ogromnej bazy danych.

Zainteresowanie wojska technologiami rozpoznawania mowy i automatycznego tłumaczenia jednak wcale nie zanikło. Potrzeba wyposażenia amerykańskich żołnierzy w urządzenia pozwalające zrozumieć, co do nich mówią miejscowi, pojawiła się w momencie inwazji w Afganistanie. Taki sprzęt, o nazwie Phraselator, został przetestowany już w 2001 roku. Służy przede wszystkim do translacji konkretnych fraz na angielski. Dokładność rozpoznawania mowy wynosi ok. 70 proc. Amerykanie wykorzystują to urządzenie zresztą również w akcjach pokojowych – do ratowania ofiar tsunami, na Haiti, w ośrodkach wychowawczych, a nawet do ratowania ginących języków Indian.

Na podstawie tej samej technologii opracowano specjalny wojskowy system tłumaczący między angielskim i arabskim. IraqComm umożliwia prawie normalną rozmowę, zna kilkadziesiąt tysięcy zwrotów. Najlepiej jednak sprawdza się nie w pogaduszkach, ale w rozmowach (i przesłuchaniach) dotyczących wojny, medycyny i bezpieczeństwa. Nie jest to zestaw kieszonkowy (Phraselator wygląda jak wzmocniony elektroniczny notatnik) – IraqComm wymaga całej walizki i komputera.

[srodtytul]Między słowami[/srodtytul]

Dlaczego opracowanie działającego systemu tłumaczenia mowy jest tak trudne, znacznie trudniejsze niż tłumaczenie słowa pisanego? Wystarczy posłuchać: ludzie rzadko używają eleganckich, doskonałych składniowo zdań. Powtarzają niektóre wyrazy, dodają „eee”, „yyyy”, nie kończą myśli. Do tego w tle trzaskają drzwi, szczeka pies albo sześć innych osób rozmawia między sobą. Żeby było trudniej (komputerowi), słowa mogą mieć różne znaczenia w zależności od kontekstu i nie ma znaków interpunkcyjnych.

– Każdy ma inny głos, inny tembr, inny akcent – tłumaczy Och. – Ale rozpoznawanie mowy powinno być łatwiejsze w telefonach komórkowych, bo ze swojej natury są one bardziej osobiste. Telefon może przyzwyczaić się do twojego głosu.

Podobnie ma być z dokładnością samego tłumaczenia. Częściej wykorzystywany elektroniczny tłumacz z czasem będzie dawał lepiej oddające zamysł mówiącego zdania. – Im więcej danych dostarczymy, tym lepsza będzie jakość – dodaje inżynier Google’a.

Na razie z jakością tłumaczenia tekstu (nawet nie mowy) nie jest zbyt dobrze. Internauci naśmiewają się z „grupy łysych dżentelmenów” (zamiast „bandy skinheadów”) albo „wodnej owcy” jako odpowiednika „hydraulicznego tarana” (prostego urządzenia). Do historii przeszła sprawa niewielkiego niemieckiego miasteczka, które dla oszczędności przetłumaczyło broszurę promocyjną za pomocą komputera („odkryty basen” stał się „darmową kąpielą”). Broszura poszła na przemiał. Albo pewnej hiszpańskiej gazety, która w wersji angielskiej nazwała spotkanie Jose Marii Aznara i Tony’ego Blaira „upośledzonym”. A jak brzmiałby początek tego tekstu po przepuszczeniu przez elektronicznego tłumacza na angielski i z powrotem? „Za chwilę znikną ostatnie bariery dla swobodnego osób komunikacyjne – obiecują inżynierów. komputer Freelance się tak doskonały, że nieznajomość języków obcych nie komplikować życia”. Niby można zrozumieć, ale od zamierzenia autora daleko.

Czy zatem skonstruowanie tłumacza mowy jest w najbliższym czasie realne? – Sam byłbym pierwszym użytkownikiem takiego systemu – przyznaje

Franz Och. – Jak wiele osób, które często podróżują, uważam, że byłby bardzo użyteczny. Mógłbym wejść do chińskiej knajpy i nie zamówić wreszcie kurzych nóżek. Byłoby fajnie.

Wyobraźmy sobie, że w restauracji wystarczy zrobić zdjęcie kartki menu telefonem komórkowym, aby po chwili otrzymać tłumaczenie – i zamówić ulubiony kotlet. Albo przeczytać artykuł w obcym języku. Może nawet książkę. Albo zrozumieć instrukcję obsługi, znaki drogowe, napisy w metrze. Albo porozmawiać przez telefon z osobą, która akurat nie mówi po polsku... Stop. O ile wszystkie wcześniejsze funkcje są dostępne już dziś, o tyle mechaniczne tłumaczenie mowy na żywo to jeszcze przyszłość.

Pozostało jeszcze 94% artykułu
Nowe technologie
Podcast „Rzecz w tym”: Czy jesteśmy skazani na bipolarny świat technologiczny?
Nowe technologie
Chińska rewolucja w sztucznej inteligencji. Czy Ameryka traci przewagę?
Materiał Promocyjny
Kod Innowacji - ruszył konkurs dla firm stawiających na nowe technologie w komunikacji z konsumentami
Nowe technologie
Niewykrywalny bombowiec strategiczny Sił Powietrznych USA odbył pierwszy lot
Nowe technologie
Co mówią kury? Naukowcy opracowali tłumacza, użyli sztucznej inteligencji