Indywidualni użytkownicy smartfonów coraz częściej posługują się komendami głosowymi, a to dzięki rosnącej popularności asystentów głosowych. Teraz przyszedł czas na podobne rozwiązania dla biznesu.
Partnerem materiału jest Salesforce.
Technologia, która do tej pory pojawiała się wyłącznie w książkach i filmach science fiction, stała się powszechnie dostępnym sposobem obsługi inteligentnych urządzeń, takich jak: smartfony, głośniki, samochody czy nawet lodówki.
Zmieniła też sposób wyszukiwania informacji w sieci. Początkowo polegało ono na wpisywaniu poszukiwanej frazy do okna wyszukiwarki, za pomocą klawiatury. Następnie nadszedł czas smartfonów i tabletów. Wyszukiwana fraza była wpisywana palcem na dotykowym ekranie. Dziś wystarczy, że posiadacz smartfonu zawoła „Hej, Google” czy „Hej, Siri”, aby uruchomić swojego asystenta głosowego i poprosić go wyszukanie i podanie konkretnych informacji.
Asystent do zadań osobistych
Technologia głosowa niewątpliwie przynosi konsumentom wiele korzyści. Umożliwia realizowanie wielu zadań jednocześnie, ułatwia realizację rutynowych czynności. Nic więc dziwnego, że jej adaptacja rośnie w bardzo szybkim tempie. Przyjrzyjmy się danym ze Stanów Zjednoczonych:
46% dorosłych amerykanów korzysta z asystenta głosowego – głównie na smartfonach;
16% posiada inteligentny głośnik;
przewiduje się, że ponad 55% amerykańskich gospodarstw domowych będzie posiadać jakąś formę inteligentnego głośnika do 2022 r.
Warto zatem zadać pytanie: w jaki sposób konsumenci korzystają z asystentów głosowych? Jak sama nazwa wskazuje [asystent], technologia pomaga im w codziennych zadaniach, takich jak: wyszukiwanie informacji, sprawdzanie wiadomości czy pogody, odtwarzanie muzyki, ustawianie przypomnień, wysyłanie wiadomości, tworzenie list np. zakupowych etc.
Głos w biznesie
Należy zaznaczyć, że asystent może pomagać w wykonywaniu zadań zawodowych równie efektywnie co osobistych. Pracownicy mogą zatem w sposób intuicyjny zautomatyzować podstawowe zadania w pracy, takie jak ustawianie przypomnień za pomocą własnego głosu. Przykładem rozwiązania, które ułatwia wykonywanie obowiązków zawodowych, jest Einstein Voice firmy Salesforce (obecnie działa on wyłącznie w języku angielskim). Aby zrozumieć jego zastosowanie, spójrzmy na ten hipotetyczny scenariusz:
Hans Albert jest nowym wiceprezesem ds. sprzedaży w firmie Nobel Retail. Wraz z awansem otrzymał większą odpowiedzialność – musi utrzymać swój zespół na odpowiednich torach i wyprzedzić konkurencję.
Od jakiegoś czasu Hans korzysta z asystenta głosowego (na swoim inteligentnym głośniku i smartfonie), który pomaga mu w wykonywaniu jego osobistych zadań. Naturalnie zaczął się więc zastanawiać, czy jest jakiś sposób na dostosowanie tej technologii tak, aby była pomocna również w pracy. Dowiaduje się o Einstein Voice i postanawia wykorzystać go do swoich obowiązków zawodowych.
Asystent ds. zawodowych
Co się zmieniło w życiu zawodowym Hansa po wdrożeniu asystenta głosowego? Po pierwsze, zamiast ręcznie wpisywać notatki ze spotkania, Hans może teraz ustnie zapisywać swoje uwagi za pośrednictwem aplikacji mobilnej. Wystarczy, że powie (zupełnie tak jak w przypadku asystenta głosowego od Google’a): „Hej, Einstein, zanotuj. Dzisiaj spotkałem się z Jennifer Perkins, wiceprezesem ds. e‑commerce…”, a asystent inteligentnie przewidzi, jakie informacje należy zapisać i jakie rekordy z nimi powiązać, a także jakie zmiany wprowadzić i jakie dalsze działania przypisać. Dzięki tak prostemu procesowi wprowadzania danych Hans oszczędził czas. Ponadto zauważył, że rejestruje notatki częściej i dokładniej. W rezultacie znacznie poprawiły się precyzja jego prognozowania, jakość raportowania i dokładność zaleceń wydawanych przez asystenta.
Co więcej, dzięki pomocy Einsteina Hans może także wyszukiwać, filtrować i tworzyć pulpity nawigacyjne za pomocą swojego głosu. Teraz, gdy jego szef zadaje mu pytania o rozwój biznesu, Hans może po prostu zapytać o to samo asystenta, a dane informacje pojawią się na ekranie – bez konieczności klikania, umożliwiając płynny przebieg jego prezentacji i spotkań.
Technologia rozpoznawania i zrozumienia
Technologia wykorzystywana przez asystentów głosowych wykorzystuje automatyczne rozpoznawanie mowy (ASR) w celu wykrywania skierowanych do nich poleceń. Jak to działa? Gdy użytkownik wyda komendę, asystent transkrybuje, co powiedział człowiek, a następnie ustala, czy było to polecenia czy pytanie. W tym samym czasie wyodrębnia i klasyfikuje wszelkie wymienione podmioty (osoby, rzeczy, miejsca) w celu ich wyszukania i przedstawienia rekomendacji – a to wszystko dzięki rozumieniu języka naturalnego (NLP) człowieka.
Przyjrzyjmy się temu procesowi krok po kroku:
Gdy użytkownik zaczyna mówić do swojego urządzenia, komputer rozpoznaje i przetwarza ludzki głos.
Pobiera tzw. klatki audio jego głosu i przepuszcza je przez model automatycznego rozpoznawania mowy. Mowa o ASR, czyli głęboko uczącym się modelu sekwencji, który pobiera wspomniane klatki audio i konwertuje je na sekwencje tekstu (transkrypcja).
Proces ten powtarza się, aż użytkownik skończy nagrywać swoją notatkę.
Następnie, dzięki rozumieniu języka naturalnego (NLP), komputer bierze te nieustrukturyzowane dane wejściowe i przekształca je w ustrukturyzowaną formę, którą maszyna może następnie zrozumieć i np. wykonać dane polecenie.
Choć do korzystania z asystentów głosowych nie jest potrzebna znajomość specyfiki działania tej technologii, warto znać podstawy działania przetwarzania głosowego i mieć świadomość, że składa się z dwóch innowacyjnych rozwiązań: automatycznego rozpoznawania mowy i rozumienia języka naturalnego.