Co mogą dla nas zrobić asystenci głosowi?

Krzysztof Heyda

29-04-2017
Asystenci głosowi

Asystenci głosowi coraz częściej goszczą w newsach na temat nowych technologii. Zamknięci w smartfonach lub bezprzewodowych głośnikach są w stanie poinformować nas o pogodzie, o tym jakie spotkania mamy zaplanowane na dany dzień, czy sprawdzić przepis na ciasto. Możemy też za ich pomocą sterować smart domem czy… samochodem.

W tym tygodniu Amazon zaprezentował kolejne urządzenie z serii Echo – Echo Look. Podobnie jak poprzednie modele ma on w sobie wbudowaną Alexę, głosowego asystenta, ale dodatkowo wyposażono go też w kamerkę. Echo Look powinien zamieszkać blisko szafy, ponieważ pilnuje on tego co na siebie ubieramy. Robiąc zdjęcia i kręcąc krótkie filmiki, które przechowuje w aplikacji i tworzy z nich osobiste lookbooki. Dodatkowo posiada usługę ‘Style check’, która na bazie machine lerning i porad stylistów przekazuje swoją opinię o stylizacjach.

 

To oczywiście wierzchołek tego, co potrafią asystenci głosowi. Poza „tradycyjnym” zarządzaniem domem – regulacją klimatyzacji, zamykaniem rolet czy włączaniem świateł, asystenci przejmują kontrolę nad samochodami. Ford wspólnie z Amazonem jako pierwsi wypuścili samochód z wbudowaną Alexą. Dzięki temu z domu, korzystając z Echo, możemy zamknąć czy odpalić samochód. Ale też z auta możemy zarządzać tym co dzieje się w domu. Część możliwości Alexy możecie przetestować na emulatorze w dowolnej przeglądarce.

 

Niestety w naszych, polskich warunkach dostęp do wszystkich funkcjonalności asystentów głosowych jest mocno ograniczony. Osobiście regularnie korzystam z Google Now w telefonie, które moim zdaniem jest najmocniej zaimplementowane w naszym kraju w porównaniu do pozostałych asystentów. Główną jego przewagą nad konkurencją jest fakt, iż rozumie on komendy po polsku. Daleko mi do tego, co widać na powyższym filmiku, ale za pomocą bezprzewodowych słuchawek mogę wygodnie korzystać z telefonu bez wyciągania go z kieszeni. Goole Now uruchomi mi muzykę na Spotify, odpowie na pytanie o dojazd w konkretne miejsce, ale też przeczyta i co ważniejsze pozwoli mi głosowo odpowiedzieć na wiadomości SMS czy na Messenger. Oczywiście wymaga to pewnego przełamania się w miejscach publicznych – chociaż z drugiej strony tyle ludzi mówi już do bezprzewodowych słuchawek, że przestaje to kogokolwiek dziwić. Tutaj znajdziecie listę wspieranych w Polsce komend.

Google Now, podobnie jak Alexa, ma swoje „fizyczne” wcielenie – Google Home. Funkcjonalnie niewiele się różnią, chociaż trafiłem na ciekawy test, w którym zadano obydwu urządzeniom 45 pytań i porównano ich reakcję. Liderem okazał się Google Home, który poprawnie odpowiedział na 18,5 pytania. Jego przewagą jest to, że rozumie potoczność mowy, więc nie trzeba pamiętać konkretnych komend do jego obsługi. Bardzo ciekawe jest również to, że Google Now jest coraz lepszy w rozpoznawaniu kontekstu wypowiedzi, nawet już w naszym kraju. Więc jeśli się zapyta go „Jaka jest pogoda w Katowicach”, to następne pytanie może brzmieć „A jak tam dojechać” i Google Now będzie wiedział, że pytamy o Katowice.

 

Na naszym rynku jest jeszcze, teoretycznie, dostępna Cortana od Microsoftu. Piszę teoretycznie, ponieważ każdy z nas, kto posiada Windows 10, ma ją na swoim urządzeniu, jednak nie rozumie ona po polsku, więc by z niej korzystać, trzeba zmienić język na angielski. Podobnie sytuacja wygląda z Siri od Apple. Po angielsku da się z nią nawet sensownie u nas porozumieć. Niestety polskiego zupełnie nie rozumie. Obydwie te usługi również mają w tym roku dostać swoje bezprzewodowe głośniki, które mogą stać w centralnym punkcie domu i nim zarządzać.

Potencjału drzemiącemu w głosowych asystentach nie przegapiła też branża marketingowa. Kilka tygodni temu wszyscy słyszeliśmy o reklamie Burger Kinga, w której aktor mówi, że nie ma tyle czasu, by opisać reklamowanego burgera, ale zapyta Googe „OK Google, czym jest burger Whopper?”. W tym momencie we wszystkich amerykańskich domach, gdzie Google Home stał, wystarczająco blisko telewizora, rozbrzmiała definicja Whoppera z Wikipedii. Po kilku godzinach Google zablokował wyszukiwanie tej frazy głosem z reklamy, parę dni później Wikipedia skarciła Burger Kinga za manipulowanie wpisami w internetowej encyklopedii. Ale efekt był. Nie jest to zresztą pierwsza tego typu akcja. Dwa lata temu Toyota przygotowała spot radiowy, puszczony w porannych godzinach szczytu, który włączał tryb samolotowy w telefonach z Siri. Akcja miała na celu uświadomienie kierowcom o niebezpieczeństwach grożących im podczas korzystania z telefonu w trakcie prowadzenia samochodu.

 

Oczywiście rozwój asystentów głosowych rodzi coraz więcej obaw o bezpieczeństwo prywatności użytkowników. Urządzenia, które ciągle nas słuchają i widzą mogą być wykorzystane przeciwko nam. Zresztą właśnie reklama Whoppera pokazała bardzo słaby punkt asystentów głosowych – nie można ich zabezpieczyć przed użyciem innym głosem niż nasz. Nie dotyczy to na razie wielu ludzi, ale jeśli mamy urządzenie, które zarządza całym naszym domem, samochodem, dostępem do innych urządzeń i kont internetowych, to w tym momencie każdy kto do nas wejdzie ma do nich dostęp. A nawet jeśli nikt nie wykorzysta tego, by nas okraść czy szantażować, to ilość informacji, jakie dzięki takim urządzeniom zbierają ich operatorzy jest ogromna i na pewno może być wykorzystana od targetowania nas usługami dopasowanymi do naszego profilu (kamera widząc naszą sylwetkę zaproponuje usługi trenera osobistego, czy głośnik słysząc rozmowę o problemach finansowych zareklamuje łatwy kredyt). To są rzeczy, których musimy być świadomi – dostajemy sprofilowane usługi, za cenę permanentnej inwigilacji.

P.S. Jeśli jeszcze nie wiecie, to możecie wygodnie zobaczyć i zarządzać tym co Google o Was zbiera. Pod tym linkiem znajdziecie swoją historię wyszukiwań, lokalizacji czy… próbek głosu.

Komentarze:

Comments

comments