Tłumacz w komórce

Nie jedziesz na wakacje, bo nie znasz języka obcego? To już znasz – telefon pomoże się dogadać na całym świecie.

Aktualizacja: 29.07.2015 22:26 Publikacja: 29.07.2015 21:04

Tłumacz w komórce

Foto: ROL

Najnowsza wersja Tłumacza Google (Google Translate) zyskała niezwykle przydatną dla polskich podróżników funkcję. To tłumaczenie napisów – wystarczy skierować na nie kamerę smartfona. Działa to zarówno z tablicami informacyjnymi, jak i z gazetami, biletami czy menu. Przetłumaczony napis pojawia się dokładnie w tym samym miejscu co oryginalny i ma taką samą czcionkę oraz kolor. Tłumaczenie odbywa się na żywo – jeżeli przesuniemy kamerę na inny obraz, nowe napisy zostaną od razu wyświetlone na ekranie.

Tryb natychmiastowego tłumaczenia (Word Lens) pojawił się w smartfonowej aplikacji w styczniu. Wówczas obejmował siedem najpopularniejszych języków – angielski, francuski, niemiecki, włoski, portugalski, rosyjski i hiszpański. Teraz Google dodał do listy 20 kolejnych – w tym m.in. polski, bułgarski, czeski, duński, holenderski, szwedzki, turecki, ukraiński czy norweski. Funkcjonalność nie jest jeszcze pełna: smartfon potrafi przetłumaczyć napisy angielskie na polski i odwrotnie, a także z dowolnego spośród obsługiwanych języków na angielski. Co oznacza, że jeżeli znamy ten język, a odwiedzamy Węgry, to smartfon się nam bardzo przyda.

Do korzystania z nowej funkcji potrzebna jest aktualizacja aplikacji Tłumacz w smartfonie oraz pobranie pakietu obsługującego dany język. Co istotne – do używania tłumacza nie jest potrzebne stałe połączenie z internetem. A to oznacza, że nie zapłacimy za roaming ani za Wi-Fi za granicą, czyli tam, gdzie tłumacz najbardziej się przydaje.

Przedstawiciele Google'a podkreślają, że analiza obrazu na żywo, z uwzględnieniem liternictwa, a później tłumaczenie tekstu na urządzeniu mobilnym były wielkim wyzwaniem. Prostsze smartfony mają moc obliczeniową 50 razy mniejszą niż zwykły laptop i miliony razy mniejszą niż centra obliczeniowe. Tłumaczenie przez internet nie stanowi dziś problemu. Co innego w prostym telefonie.

Google poprawił również tryb konwersacji, znany z wcześniejszych wersji aplikacji. Funkcja ta umożliwia prowadzenie (prawie) normalnej rozmowy z osobą w jej języku ojczystym. Wygląda to tak: wybieramy odpowiednie języki (np. polski i niemiecki), naciskamy ikonę mikrofonu i zaczynamy mówić. Smartfon nagra i przeanalizuje na żywo, co mówimy, oraz wypowie na głos tłumaczenie. Nasz rozmówca odpowie po niemiecku, a smartfon przetłumaczy to i przemówi po polsku. Magia. —peka

Barak Turovsky, szef projektu Google Translate

Kładziesz smartfon na stole i zaczynasz mówić

Rzeczpospolita: Tłumacz zaczynał jako zwykła usługa przekładania tekstu na stronach WWW.

Tak, to był pierwszy krok. Dodaliśmy tłumaczenie głosu oraz obrazu. Mamy ok. 500 mln użytkowników Google Translate w miesiącu. Robią ponad miliard tłumaczeń. Ostatnie dane pokazują, że dziennie tłumaczymy 100 miliardów słów. Całkiem sporo. To jeden z najbardziej globalnych produktów jakie mamy. Zwykle najwięcej użytkowników dowolnego produktu mamy w USA, tu tak nie jest. W Europie Polska znajduje się w tej dziedzinie w pierwszej dziesiątce. To dlatego polski język był wysoko na liście priorytetów.

Proszę pamiętać, że dla większości obecnych użytkowników smartfon jest pierwszą bramą, przez którą wchodzą do Internetu. Dlatego zaoferowaliśmy tłumaczenie napisów oraz tryb konwersacji — wystarczy położyć komórkę na stole, aby rozpocząć rozmowę w nieznanym sobie języku. Naszą misją jest zburzenie granic językowych i zbliżenie ludzi. To szczególnie istotne na rynkach rozwijających się. Mniej więcej połowa zawartości Internetu jest po angielsku. Ale tylko 20 proc. użytkowników Internetu mówi po angielsku. To ogromna bariera.

Jak to działa?

Opieramy się na dokumentach przetłumaczonych przez ludzi. Co to oznacza? Że bierzemy ogólnodostępne dokumenty administracyjne albo dokumenty ONZ i je analizujemy. Nasz system w rezultacie uczy się języka. Analizujemy połączenia semantyczne.

To chyba dobre do dokumentów biznesowych. Co z prostymi pogawędkami, czy rozmowami typowo turystycznym?

Tak, to prawda. Nasze dane treningowe są bardziej biznesowe i oficjalne. Jednym z obszarów, nad którym ciągle pracujemy jest tłumaczenie slangu, pogaduszek, idiomów.

Pomagają nam w tym ochotnicy ze społeczności Google Translate. Zwykle zaczyna się od tego, że jakaś grupa prosi nas o włączenie do programu konkretnego języka. Tak było w Kazachstanie. Problem polegał na tym, że nie mamy zbyt wielu dokumentów pozwalających maszynie nauczyć się kazachskiego. Powiedzieliśmy im, że nie damy rady. Ale oni byli uparci i zapytali co mogą zrobić. Założyliśmy zespoły lokalnych tłumaczy, którzy mieli przekładać proste teksty na ich język. Inni mieli oceniać jakość przekładu. W Kazachstanie było ok. 300 czy 400 tłumaczy pracujących nad tym. Zaczęliśmy dostawać tysiące tłumaczeń tygodniowo. Wow! Jak to możliwe — zapytaliśmy. A oni pokazali nam nagranie, na którym prezydent Kazachstanu wzywa wszystkich dziennikarzy mówiących po angielsku o udział w programie. W Polsce nie było to koniecznie, ale muszę przyznać, że dodatkową trudnością tutaj jest tłumaczenie polskich znaków. Litery w języku angielskim są „czyste", wy macie różne dodatkowe kreski, apostrofy i jak wy to nazywacie...

... ogonki

Dokładnie. To utrudnia analizę obrazu. Musieliśmy wykorzystać tzw. sieci neuronowe do nauczenia systemu co jest literą, a co nie jest. To w zasadzie łatwe, gdy ma się do dyspozycji superkomputer. Ale naszym celem było uruchomienie tej funkcji bez połączenia z Internetem — offline na niezbyt mocnym urządzeniu. I jeszcze żeby to działało na każdym smartfonie, w tym na tanich i niezbyt mocnych telefonach sprzedawanych na rynkach rozwijających się.

Drugim wyzwaniem było nauczenie systemu rozpoznawania liter innych niż komputerowe. Komputerowe kroje są łatwe, ale Word Lens miał odczytywać na przykład znaki na tablicach informacyjnych, czy w instrukcjach obsługi. Ludzie się skarżą, że kupują niemiecką pralkę i nic nie rozumieją. Tłumacz ma im w tym pomóc. Musieliśmy stworzyć różne warianty liter, które odpowiadałyby tym spotykanym w prawdziwym życiu, często uszkodzonym, zamazanym, słabiej oświetlonym.

Czy system potrafi rozpoznawać pismo odręczne?

Nie, to generalnie bardziej skomplikowana sprawa. Pracujemy nad tym, ale Tłumacz jeszcze sobie z tym nie radzi.

A czy mogę przeczytać gazetę dzięki Tłumaczowi?

Tak, oczywiście. Choć to nie to było naszym głównym celem. Chcemy dać szybkie, w czasie rzeczywistym, tłumaczenie krótkich napisów — tablic informacyjnych, instrukcji obsługi, tego typu rzeczy. Duży, drukowany tekst — tu funkcja Word Lens sprawdza się najlepiej.

Nie mogę nie zadać tego pytania, w końcu pracuje pan dla Google. Czy analizujecie treść tłumaczonych dokumentów w celu wykorzystania tej wiedzy później do swoich reklam? Nie. Nie przechowujemy informacji na temat tłumaczonych dokumentów. Analizy treści używamy wyłącznie do poprawiania jakości tłumaczeń. I prosimy użytkowników o zgodę na takie działania.

Które języki są najpopularniejsze?

Hiszpański, portugalski i arabski są najbardziej popularne. Większość tłumaczeń, ponad 90 proc., to tłumaczenia z angielskiego lub na angielski. To odpowiada temu, co mówiłem o popularności tego języka w Internecie. Czy nam się to podoba czy nie, angielski jest najważniejszym językiem w Sieci.

Microsoft pokazywał niedawno komunikator Skype z wbudowanym tłumaczem. Przetłumaczone zdania pojawiały się jako napisy na dole ekranu podczas rozmowy na żywo z osobą posługującym się obcym językiem. Czy macie coś podobnego w komunikatorze Hangouts?

Obecnie mamy integrację z innymi naszymi produktami. Pierwszym jest wyszukiwanie (Search), drugim jest przeglądarka Chrome. Mamy też integrację z Gmailem.

Hangouts z tłumaczem to jedna z tych spraw, nad którymi jeszcze pracujemy. Tłumacz to naprawdę duży projekt i najpierw chcemy zadbać o te funkcje, które użytkownicy najczęściej wykorzystują. Zaczęliśmy od tłumaczenia rozmów twarzą w twarz, czyli trybu konwersacyjnego, bo to ma naszym zdaniem największe znaczenie. Znam przypadki gdy pacjenci przychodzili do lekarza w obcym kraju i używali naszego tłumacza. Wiem, że w jednym z przypadków w Kongo kobieta mająca urodzić wyjęła telefon i słuchała poleceń sanitariusza, który mówił w niezrozumiałym dla niej języku. Super sprawa.

Materiał Promocyjny
Kod Innowacji - ruszył konkurs dla firm stawiających na nowe technologie w komunikacji z konsumentami
https://track.adform.net/adfserve/?bn=77855207;1x1inv=1;srctype=3;gdpr=${gdpr};gdpr_consent=${gdpr_consent_50};ord=[timestamp]
Materiał Promocyjny
Polska na czele rewolucji technologii kwantowych
Materiał partnera
Technologie kwantowe: nauka tworzy szanse dla gospodarki
Nowe technologie
Niewykrywalny bombowiec strategiczny Sił Powietrznych USA odbył pierwszy lot
Materiał Promocyjny
Do 300 zł na święta dla rodziców i dzieci od Banku Pekao
Nowe technologie
Co mówią kury? Naukowcy opracowali tłumacza, użyli sztucznej inteligencji