fbTrack
REKLAMA
REKLAMA

Telekomunikacja i IT

Amazon Echo. Gra, słucha, rozumie. I chętnie pogada

materiały prasowe
Oto inteligentny głośnik Amazona – i jego nieoczekiwany sukces. Wydaje się, że żadna inna firma jeszcze na to nie wpadła.

Była jesień 2014 r., kiedy specjalny zespół w Lab126 – centrum badawczym firmy Amazon – kończył prace nad nowym głośnikiem przetwarzającym polecenia głosowe. Data jego premiery zbliżała się wielkimi krokami, dopracowywano ostatnie szczegóły. I tedy część zespołu doszła do wniosku, że trzeba raz jeszcze pogadać z szefem firmy Jeffem Bezosem. Nowe urządzenie prezentowało się świetnie, technologia rozpoznawania głosu była coraz lepsza, a pudełka, w których nowe gadżety miały być sprzedawane, już dawno zostały zaprojektowane i złożone. Niektórzy wciąż jednak mieli problem z nazwą urządzenia: Amazon Flash. Bezos ją przeforsował, ale wielu osobom nazwa ta nie przypadła do gustu.

 

Na horyzoncie pojawiło się też inne zmartwienie. Do swoich podstawowych funkcji urządzenie wymaga tzw. wake word – czyli odpowiedniego hasła, które w głośniku aktywuje wirtualnego asystenta. Jednym z dwóch rozważanych słów było „Alexa", sam Bezos twierdził natomiast, że najlepiej sprawdzi się po prostu „Amazon". Konstruktorzy uznawali to za potencjalnie problematyczne: np. podczas telewizyjnych reklam Amazona istniałoby poważne ryzyko, że głośnik samoistnie się aktywuje. A następnie – podłączony do internetu za pomocą sieci Wi–Fi – mógłby rozpocząć np. zakupy internetowe.

 

Inżynierowe i menedżerowie produktu starali się stłumić swoje obawy, koncentrując się na stworzeniu tego, czego ich zdaniem szef oczekiwał. Jednak kilka tygodni przed planowaną premierą dysydenci zdecydowali się na konfrontację z Bezosem. A ten w końcu zgodził się na zmiany: urządzenie zostało ochrzczone Echo, a słowem aktywującym funkcję przetwarzania komend głosowych zostało „Alexa" (choć można je zmienić na „Amazon" lub „Echo" w zależności od preferencji użytkownika).

 

W świecie gadżetów, zdominowanym dzisiaj przez różne prostokątne urządzenia z ekranem dotykowym, Echo mocno się wyróżnia – to bezekranowy cylinder, mierzący prawie 23 cm wysokości i mający prawie 10 cm średnicy. Ten nowy gadżet może odtwarzać muzykę, ale potrafi też udzielić odpowiedzi na podstawowe pytania związane z gospodarstwem domowym, np. ile łyżeczek od herbaty mieści się w filiżance (ok. 48). Wobec braku ekranu jedynym sposobem interakcji z Echo są komendy głosowe. Urządzenie bezustannie czuwa, czekając na magiczne słowo klucz.

 

Gdy w listopadzie ubiegłego roku pierwsze egzemplarze głośnika trafiły do klientów, krytycy i eksperci niechętni wobec Amazona bardzo się ożywili. Niektórzy określali inteligentny głośnik mianem bezużytecznego gadżetu. Inni twierdzili, że jest on przejawem orwellowskich zapędów firmy. A po tym wszystkim nastąpiło coś niespodziewanego: okazało się, że użytkownicy Echo pokochali.

 

Amazon nigdy nie ujawnia danych o sprzedaży swoich produktów. W kwietniu firma analityczna Consumer Intelligence Research Partners opublikowała jednak raport, z którego wynika, że udało mu się sprzedać już ponad 3 mln urządzeń, z czego 1 mln w?okresie bożonarodzeniowym pod koniec 2015 r. Ok. 35 tys. osób zrecenzowało Echo na stronie Amazon.com, średnio przydzielając mu 4,5 gwiazdki na pięć możliwych. A co więcej – dziesiątki niezależnych deweloperów zaczęło tworzyć aplikacje, które dzięki wykorzystaniu funkcji komend głosowych umożliwiają np. wyłączenie światła lub zamówienie pizzy. Jednym słowem: głośnik Echo, który na pierwszy rzut oka mógł się wydawać zbędną zabawką, okazuje się najlepszym sposobem Amazona na objęcie pozycji lidera rynku urządzeń przetwarzających komendy głosowe.

 

„Chcemy być dużą firmą, która zarazem wytycza szlaki innowacji na rynku" – napisał Bezos w kwietniu w liście do inwestorów. Zachowanie spółki świetnie ilustruje, co się dzieje, gdy Amazon osiąga zamierzony cel: Bezos odmówił rozmowy na potrzeby tego artykułu, a 10 byłych i obecnych jego pracowników zgodziło się tylko pod warunkiem zachowania anonimowości, ponieważ nie zostali upoważnieni do wypowiadania się.

 

Echo narodziło się w Lab126 – ośrodku badawczym powołanym do życia w 2004 r., w którym powstawał także czytnik Kindle. Nazwa tej placówki odnosi się do alfabetu, gdzie liczba 1 oznacza literę A, a 26 – literę Z. Czytnik Kindle był projektem A. Projektem B był smartfon. Niewiele wiadomo na temat projektu C, jednak bazując na informacjach zawartych we wniosku patentowym złożonym przez Amazona, będzie to urządzenie umożliwiające interakcję z obrazami rzeczywistości rozszerzonej (AR). Głośnik Echo, czyli projekt D, to w pewnym sensie brat projektu C. Pracę nad nim rozpoczęły się w 2011 r. i na pewnym etapie kilkuset pracowników, od Seattle aż po Cambridge, było zaangażowanych w to przedsięwzięcie.

 

B, czyli Fire Phone, którego premiera miała miejsce w czerwcu 2014 r., poniósł spektakularną porażkę. Gdy Amazon zdał sobie z tego sprawę, natychmiast zaangażował część ludzi odpowiedzialnych za rozwój smartfona w prace nad Echo. Wraz z nimi w zespole pojawiły się świeże pomysły, ale także bardzo mieszany (to eufemizm) poziom entuzjazmu w stosunku do nowego urządzenia. To nie podobało się tym, którzy byli w zespole od samego początku. Nie pomagała też świadomość, że spółka gra o stawkę wyższą niż zwykle. Szef miał ogromne oczekiwania – liczył, że nowe urządzenie pomoże rozwiać wszelkie wątpliwości – zarówno te wewnątrz, jak i te poza firmą – co do tego, czy Amazon jest w stanie tworzyć gadżet konsumencki wyższej klasy.

 

Konieczne było opracowanie takiego systemu rozpoznawania komend głosowych, który mógłby konkurować z tymi stworzonymi przez Google'a oraz Apple'a. Amazon zdecydował się na zatrudnienie kilku osób z Nuance Communication, firmy opracowującej systemy przetwarzania poleceń werbalnych. Spółka kupiła również trzy start–upy z branży systemów sterowanych głosem – amerykański Yap, brytyjskie Evi oraz dobrze znaną polskim czytelnikom firmę Ivona Software z Gdańska, zajmującą się syntezą mowy.

 

Gdy inżynierowie z Amazona rozpoczęli pracę nad Echo, doszli do wniosku, że to urządzenie będzie potrzebowało więcej mocy obliczeniowej, niż przewidywali. Z tego powodu mikrokontroler, czyli prosty komputer wykorzystywany zazwyczaj w urządzeniach sterowanych zdalnie, został zastąpiony mikroprocesorem będącym w stanie poradzić sobie z bardziej skomplikowanymi zadaniami. Do ostatniego momentu projekt Echo przechodził wiele istotnych zmian. Głośnik musiał radzić sobie z jednoczesnym odbieraniem i odtwarzaniem dźwięków, co okazało się nie lada wyzwaniem dla inżynierów. Bo co, jeżeli Echo odtwarza muzykę tak głośno, że sam sobie zagłusza komendy głosowe? Dość wcześnie powstały więc prototypy mniejszych urządzeń, wyglądem przypominających krążki hokejowe, które można byłoby umieścić w różnych pomieszczeniach, aby odbierały polecenia w miejscach oddalonych od głównego urządzenia. Na późniejszych etapach ten pomysł jednak porzucono i skupiono się na rozwoju samego głośnika (co ciekawe, całkiem niedawno ta koncepcja wróciła pod postacią limitowanego urządzenia Echo Dot).

 

Aż do jesieni 2014 r. nie było pewności, czy funkcja odbierania komend działa wystarczająco dobrze. Bezos był nieugięty w kwestii ewentualnego dołożenia innego sposobu sterowania, dodatkowo wspierającego system komend głosowych. Uważał, że byłoby to oszustwo. Niektórzy inżynierowie naciskali jednak na opracowanie „pilota", do którego użytkownicy urządzenia mogliby wygłaszać swoje komendy z każdego miejsca w domu. Amazon wprowadził w tym czasie podobne rozwiązanie dla Fire TV, multimedialnego odtwarzacza z funkcją streamingu. Ostatecznie pierwsza partia sprzedanych głośników została testowo wyposażona w pilota – dane o tym, jak często użytkownicy z niego korzystają, miały posłużyć do odpowiedniego zmodyfikowania produktu. Okazało się, że wątpliwości były bezpodstawne. Użytkownicy Echo tak rzadko korzystali z dodatkowego pilota, że w konsekwencji został on usunięty z zestawu.

Umożliwienie podłączania Echo do zdalnie sterowanych żarówek, termostatów i rozmaitych sprzętów domowych produkowanych przez inne firmy nie było celem Lab126 aż do końca 2014 r. – kiedy to bardziej dla żartu jeden z inżynierów połączył głośnik z telewizorem z funkcją streamingu. – To było coś, co nieoczekiwanie bardzo się Bezosowi spodobało – wspomina jeden z pracowników. Dlatego obecna wizja Amazona jest zakrojona bardzo szeroko – w dużej mierze opiera się na uczynieniu z tego głośnika swego rodzaju centrali do smartdomu. Dave Limp, wiceprezes firmy, żartuje, że „to tylko kwestia czasu, zanim jakiś obrotny deweloper stworzy dla Echo program, który umożliwi zdalne spuszczanie wody w toalecie".

 

Żarty żartami, ale to właśnie dzięki Echo Amazon znalazł sposób na ulokowanie się na styku interakcji klientów z różnymi sprzętami domowymi oraz usługami. Główny wpływ na ten sukces miało dobre wyczucie czasu. Branża technologiczna szuka kolejnej platformy, która mogłaby zająć miejsce usług mobilnych. Inwestowanie w technologię przetwarzania komend głosowych oraz pewną formę sztucznej inteligencji było bardzo mądrym posunięciem. Wydaje się, że żadna inna firma jeszcze na to nie wpadła – a każdym razie nie ma gotowego sprzętu opartego na tej technologii. Apple oraz Google mają w swojej ofercie wirtualnych asystentów, jednak te systemy powstały głównie z myślą o?usprawnieniu funkcjonowania smartfonów. A Microsoft, którego prezes bardzo mocno wierzy w sztuczną inteligencję i „konwersację jako platformę", koncentruje się w tej dziedzinie na oprogramowaniu.

 

Obecnie za pomocą głośnika Echo można korzystać aż z 500 aplikacji, które sprawdzą stan konta w banku lub będą naśladować dźwięki ulubionych zwierząt twojego dziecka. Amazon cały czas odnotowuje interesujące pomysły przesyłane przez użytkowników i klasyfikuje je ze względu na popularność – co pomaga zdecydować o kolejności prac nad nowymi funkcjonalnościami.

 

Analityk Forrester Research Julie Ask twierdzi, że największym wyzwaniem dla Amazona będzie teraz powiązanie ze sobą już istniejących funkcji. Możliwość poproszenia Echo o zamówienie przejazdu Uberem jest fajną opcją – ale można pójść jeszcze dalej. – Za pięć lat mój Echo powie: „Hej, Julie, powinnaś już jechać na lotnisko. Zamówić ci przejazd?". A ja zwyczajnie odpowiem „tak" – snuje wizje Ask. – Na tym właśnie polega różnica pomiędzy tym, gdzie obecnie jesteśmy, a tym, gdzie chcemy być.

 

Na razie w efekcie wszystkich udoskonaleń Echo okazało się dużo bardziej skomplikowane i droższe, niż początkowo zakładano. Jeden z pracowników zaangażowanych w jego powstanie wspomina, że wyprodukowanie jednego egzemplarza miało kosztować 17 dol., a planowana cena urządzenia – nie przekraczać 50 dol. Obecnie kosztuje ono w detalu 180 dol. Ale jeśli rozumny i gadający głośnik okaże się kolejną rewolucją, na pewno nie będzie to za drogo.

 

Joshua Brustein, Spencer Soper

Tekst ukazał się w czerwcowym wydaniu magazynu Bloomberg Businessweek Polska

Źródło: rp.pl
REKLAMA
REKLAMA
REKLAMA
REKLAMA
NAJNOWSZE Z RP.PL
REKLAMA
REKLAMA