Wirtualny asystent - Virtual assistant

Pilot Apple TV , za pomocą którego użytkownicy mogą poprosić wirtualną asystentkę Siri o znalezienie treści do obejrzenia
Inteligentny głośnik Amazon Echo z wirtualnym asystentem Alexa

Inteligentny asystent wirtualny ( IVA ) lub inteligentny asystent osobisty ( IPA ) jest środkiem oprogramowanie , które może wykonywać zadań lub usług dla jednostki w oparciu o polecenia lub pytania. Termin „ chatbot ” jest czasami używany w odniesieniu do wirtualnych asystentów, do których zazwyczaj lub w szczególności uzyskuje się dostęp za pośrednictwem czatu online . W niektórych przypadkach programy do czatów online służą wyłącznie do celów rozrywkowych. Niektórzy wirtualni asystenci potrafią interpretować ludzką mowę i odpowiadać za pomocą syntetycznych głosów. Użytkownicy mogą zadawać pytania swoim asystentom, sterować urządzeniami automatyki domowej i odtwarzaniem multimediów za pomocą głosu, a także zarządzać innymi podstawowymi zadaniami, takimi jak poczta e-mail, listy rzeczy do zrobienia i kalendarze, za pomocą poleceń werbalnych (wypowiadanych?). Podobna koncepcja, choć z różnicami, kryje się pod systemami dialogowymi .

Od 2017 r. możliwości i wykorzystanie wirtualnych asystentów szybko się rozwijają, wraz z wprowadzaniem na rynek nowych produktów i silnym naciskiem na interfejsy użytkownika poczty elektronicznej i głosowej . Apple i Google mają duże bazy zainstalowanych użytkowników na smartfonach . Microsoft ma duży zainstalowana baza systemu Windows -na komputerów osobistych , smartfonów i eleganckie głośniki . Amazon ma dużą bazę instalacyjną dla inteligentnych głośników. Conversica ma ponad 100 milionów zleceń za pośrednictwem inteligentnych wirtualnych asystentów dla biznesu za pośrednictwem interfejsu e-mail i SMS.

Historia

Eksperymentalne dekady: 1910—80s

Radio Rex było pierwszą zabawką aktywowaną głosem wydaną w 1922 roku. Była to drewniana zabawka w kształcie psa, która wyjdzie z domu, gdy zostanie wywołana jego nazwa.

W 1952 roku Bell Labs zaprezentował „Audrey”, maszynę do automatycznego rozpoznawania cyfr. Zajmował wysoki na sześć stóp stojak przekaźnikowy, zużywał znaczną moc, miał strumienie kabli i wykazywał niezliczone problemy konserwacyjne związane ze złożonymi obwodami lamp próżniowych. Potrafił rozpoznawać podstawowe jednostki mowy, fonemy. Ograniczał się do dokładnego rozpoznawania cyfr wypowiadanych przez wyznaczonych mówców. Mogło więc być używane do wybierania głosowego, ale w większości przypadków wybieranie za pomocą przycisku było tańsze i szybsze niż wypowiadanie kolejnych cyfr.

Innym wczesnym narzędziem, które umożliwiło cyfrowe rozpoznawanie mowy, był aktywowany głosem kalkulator IBM Shoebox , zaprezentowany szerokiej publiczności podczas targów światowych w Seattle w 1962 roku po jego pierwszym wprowadzeniu na rynek w 1961 roku. Ten wczesny komputer, opracowany prawie 20 lat przed wprowadzeniem pierwszego komputera osobistego IBM w 1981 roku, był w stanie rozpoznać 16 wypowiadanych słów i cyfry od 0 do 9.

Pierwszy program komputerowy przetwarzający język naturalny, czyli chatbot ELIZA, został opracowany przez profesora MIT Josepha Weizenbauma w latach 60. XX wieku. Został stworzony, aby „zademonstrować, że komunikacja między człowiekiem a maszyną jest powierzchowna”. ELIZA zastosowała metodologię dopasowywania wzorców i podmiany w skryptowych odpowiedziach, aby symulować rozmowę, co dawało złudzenie zrozumienia ze strony programu.

Sekretarka Weizenbauma podobno poprosiła Weizenbauma o opuszczenie pokoju, aby ona i ELIZA mogły przeprowadzić prawdziwą rozmowę. Weizenbaum był tym zaskoczony, pisząc później: „Nie zdawałem sobie sprawy… że ekstremalnie krótkie ekspozycje na stosunkowo prosty program komputerowy mogą wywołać silne urojenia u całkiem normalnych ludzi.

To dało nazwę efektowi ELIZA , tendencji do nieświadomego zakładania, że ​​zachowania komputera są analogiczne do ludzkich; czyli antropomorfizacja, zjawisko obecne w interakcjach człowieka z wirtualnymi asystentami.

Kolejny kamień milowy w rozwoju technologii rozpoznawania głosu został osiągnięty w latach 70. na Uniwersytecie Carnegie Mellon w Pittsburghu w Pensylwanii przy znacznym wsparciu Departamentu Obrony Stanów Zjednoczonych i jego agencji DARPA , sfinansowanych przez pięć lat programu badań rozumienia mowy, którego celem jest aby osiągnąć minimum 1000 słów. W programie wzięły udział firmy i środowiska akademickie, w tym IBM, Carnegie Mellon University (CMU) i Stanford Research Institute.

W rezultacie powstała "Harpia", opanowała około 1000 słów, słownictwo trzylatka i potrafiła rozumieć zdania. Potrafił przetwarzać mowę, która była zgodna z zaprogramowanymi strukturami słownictwa, wymowy i gramatyki, aby określić, które sekwencje słów mają razem sens, redukując w ten sposób błędy rozpoznawania mowy.

W 1986 roku Tangora była ulepszeniem Shoebox, była to maszyna do pisania rozpoznająca głos. Nazwany na cześć najszybszej ówczesnej maszynistki na świecie, zawierał 20 000 słów i używał przewidywania, aby określić najbardziej prawdopodobny wynik na podstawie tego, co zostało powiedziane w przeszłości. Podejście IBM opierało się na ukrytym modelu Markowa , który dodaje statystyki do technik cyfrowego przetwarzania sygnałów. Metoda ta umożliwia przewidywanie najbardziej prawdopodobnych fonemów podążających za danym fonemem. Mimo to każdy mówca musiał indywidualnie ćwiczyć maszynę do pisania, aby rozpoznawać swój głos i robić pauzy między każdym słowem.

Narodziny inteligentnych wirtualnych asystentów: lata 90. — obecnie

Technologia cyfrowego rozpoznawania mowy w latach 90. stała się cechą komputerów osobistych, a IBM , Philips i Lernout & Hauspie walczą o klientów. Znacznie później wprowadzenie na rynek pierwszego smartfona IBM Simon w 1994 roku położyło podwaliny pod inteligentnych wirtualnych asystentów, jakich znamy dzisiaj.

W 1997 roku oprogramowanie Dragon's Naturally Speaking mogło rozpoznawać i transkrybować naturalną ludzką mowę bez przerw między każdym słowem w dokumencie z szybkością 100 słów na minutę. Wersja Naturally Speaking jest nadal dostępna do pobrania i nadal jest używana, na przykład przez wielu lekarzy w USA i Wielkiej Brytanii do dokumentowania ich dokumentacji medycznej.

W 2001 roku Colloquis publicznie uruchomił program SmarterChild na platformach takich jak AIM i MSN Messenger . Podczas gdy całkowicie tekstowe SmarterChild było w stanie grać w gry, sprawdzać pogodę, wyszukiwać fakty i do pewnego stopnia rozmawiać z użytkownikami.

Pierwszy nowoczesny cyfrowy wirtualny asystent zainstalowany na smartfonie było Siri , który został wprowadzony jako cecha z iPhone 4S w dniu 4 października 2011 Apple Inc. opracowany Siri po nabyciu 2010 Siri Inc. , a spin-off z SRI International , który jest instytutem badawczym finansowanym przez DARPA i Departament Obrony Stanów Zjednoczonych . Jego celem było wspomaganie takich zadań jak wysyłanie wiadomości tekstowych, wykonywanie połączeń telefonicznych, sprawdzanie pogody czy ustawianie alarmu. Z biegiem czasu rozwinął się, aby dostarczać rekomendacje restauracji, przeszukiwać internet i zapewniać wskazówki dojazdu.

W listopadzie 2014 r. Amazon ogłosił Alexę obok Echo.

W kwietniu 2017 r. Amazon wypuścił usługę do budowania interfejsów konwersacyjnych dla dowolnego typu wirtualnego asystenta lub interfejsu.

Metoda interakcji

Wirtualni asystenci pracują poprzez:

Niektórzy wirtualni asystenci są dostępni na wiele sposobów, takich jak Asystent Google przez czat w aplikacji Google Allo i Google Messages oraz za pomocą głosu na inteligentnych głośnikach Google Home .

Wirtualni asystenci wykorzystują przetwarzanie języka naturalnego (NLP) w celu dopasowania tekstu lub głosu użytkownika do wykonywalnych poleceń. Wiele osób nieustannie uczy się, korzystając z technik sztucznej inteligencji , w tym uczenia maszynowego . Niektóre z tych asystentów, takie jak Asystent Google (który zawiera Google Lens ) i Samsung Bixby, mają również dodatkową możliwość przetwarzania obrazu w celu rozpoznawania obiektów na obrazie, aby pomóc użytkownikom uzyskać lepsze wyniki z klikniętych obrazów.

Aby aktywować wirtualnego asystenta za pomocą głosu, można użyć słowa budzenia. Jest to słowo lub grupy słów, takie jak „Hej Siri”, „OK Google” lub „Hej Google”, „Alexa” i „Hej Microsoft”. Ponieważ wirtualni asystenci stają się coraz bardziej popularni, pojawia się coraz większe ryzyko prawne.

Urządzenia i przedmioty, w których zostały znalezione

Wirtualni asystenci mogą być zintegrowani z wieloma rodzajami platform lub, jak Amazon Alexa , z kilkoma z nich:

Usługi

Wirtualni asystenci mogą świadczyć różnorodne usługi. Obejmują one:

  • Podaj informacje takie jak pogoda, fakty z np. Wikipedii lub IMDb , ustaw alarm, twórz listy rzeczy do zrobienia i listy zakupów
  • Odtwarzaj muzykę z serwisów streamingowych, takich jak Spotify i Pandora ; odtwarzać stacje radiowe; czytać audiobooki
  • Odtwarzaj filmy, programy telewizyjne lub filmy na telewizorach, przesyłając strumieniowo z np. Netflix
  • Handel konwersacyjny (patrz poniżej)
  • Wspomagaj interakcje publiczne z rządem (patrz Sztuczna inteligencja w rządzie )
  • Uzupełnij i/lub zastąp obsługę klienta przez ludzi. W jednym z raportów oszacowano, że zautomatyzowany asystent online spowodował 30% zmniejszenie obciążenia pracą w centrum obsługi telefonicznej świadczonej przez człowieka .

Handel konwersacyjny

Handel konwersacyjny to handel elektroniczny za pośrednictwem różnych środków komunikacji, w tym asystentów głosowych, ale także czatu na żywo w witrynach handlu elektronicznego , czatu na żywo w aplikacjach do przesyłania wiadomości, takich jak WeChat , Facebook Messenger i WhatsApp oraz chatbotów w aplikacjach do przesyłania wiadomości lub witrynach internetowych.

Obsługa klienta

Wirtualny asystent może współpracować z zespołem obsługi klienta firmy, aby zapewnić klientom całodobowe wsparcie. Zapewnia szybkie odpowiedzi, co poprawia wrażenia klienta.

Usługi stron trzecich

Amazon udostępnia Alexa „Skills” i Google „Actions”, czyli aplikacje działające na platformach asystentów.

Prywatność wirtualnego asystenta

Wirtualni asystenci mają wiele problemów związanych z prywatnością. Funkcje takie jak aktywacja głosowa stanowią zagrożenie, ponieważ wymagają, aby urządzenie zawsze nasłuchiwało. Zaproponowano tryby prywatności, takie jak wirtualny przycisk bezpieczeństwa, aby stworzyć wielowarstwowe uwierzytelnianie dla wirtualnych asystentów.

Polityka prywatności wybitnych wirtualnych asystentów

Asystent Google

Asystent Google nie przechowuje danych użytkowników bez ich zgody. Aby zapisać dźwięk, użytkownik może przejść do Aktywności związanej z głosem i dźwiękiem (VAA) i włączyć tę funkcję. Pliki audio są wysyłane do chmury i wykorzystywane przez Google do poprawy wydajności Asystenta Google, ale tylko wtedy, gdy funkcja VAA jest włączona.

Alexa Amazona

Wirtualna asystentka Amazona, Alexa, słucha rozmów tylko wtedy, gdy używane jest jego słowo budzące (takie jak Alexa, Amazon, Echo). Rozpoczyna nagrywanie rozmowy po wywołaniu słowa budzącego. Przestaje słuchać po 8 sekundach ciszy. Wysyła nagraną rozmowę do chmury. Możliwe jest usunięcie nagrania z chmury, odwiedzając „Alexa Privacy” w „Alexa”. Istnieje funkcja, która uniemożliwia Alexie słuchanie twoich rozmów przy użyciu funkcji „wyciszania” Alexy. Po wyciszeniu urządzenie nie może słuchać, nawet jeśli zostały użyte słowa wybudzania (takie jak Alexa).

Siri jabłoni

Apple nie nagrywa dźwięku w celu ulepszenia Siri, zamiast tego używa transkrypcji. Wysyła tylko dane ważne do analizy, np. jeśli użytkownik poprosi Siri o odczytanie jego wiadomości, nie wyśle ​​wiadomości do chmury, maszyna bezpośrednio odczyta wiadomość bez ingerencji serwera. Użytkownicy mogą zrezygnować w dowolnym momencie, jeśli nie chcą, aby Siri wysyłała transkrypcje w chmurze.

Domniemany i obserwowany interes konsumenta

Zakładana wartość dodana jako umożliwienie nowego sposobu interakcji

Wartość dodana wirtualnych asystentów może pochodzić m.in. z:

  1. Jest to wygodne: są sektory, w których głos jest jedyną możliwą drogą komunikacji, a mówiąc bardziej ogólnie, pozwala uwolnić obie ręce i wzrok potencjalnie do wykonywania innej czynności równolegle, czy też pomaga osobom niepełnosprawnym.
  2. Jest szybszy: Głos jest bardziej wydajny niż pisanie na klawiaturze: możemy wypowiedzieć do 200 słów na minutę, w przeciwieństwie do 60 w przypadku pisania na klawiaturze. Jest też bardziej naturalny, przez co wymaga mniej wysiłku (jednak czytanie tekstu może osiągnąć 700 słów na minutę).
  • Wirtualni asystenci oszczędzają dużo czasu dzięki automatyzacji: mogą umawiać się na spotkania lub czytać wiadomości, podczas gdy konsument robi coś innego. Można również poprosić wirtualnego asystenta o planowanie spotkań, co pomaga w organizacji czasu. Projektanci nowych cyfrowych planistów wyjaśnili, że mieli ambicję, aby te kalendarze planowały życie tak, aby konsument efektywniej wykorzystywał swój czas, poprzez procesy uczenia maszynowego oraz pełną organizację czasu pracy i czasu wolnego. Na przykład, gdy konsument wyraża chęć zaplanowania przerwy, VA zaplanuje ją w optymalnym momencie do tego celu (na przykład w porze tygodnia, w której są mniej produktywni), z dodatkowym długoterminowym celem potrafią zaplanować i zorganizować czas wolny konsumenta, aby zapewnić mu optymalną wydajność pracy.

Postrzegane zainteresowanie

Graficzne podsumowanie badania wychwytujące powody zainteresowania wirtualnymi asystentami dla konsumentów
  • Według niedawnego badania (2019) dwa powody korzystania z wirtualnych asystentów dla konsumentów to postrzegana użyteczność i postrzegana przyjemność. Pierwszym wynikiem tego badania jest to, że zarówno postrzegana użyteczność, jak i postrzegana przyjemność mają równoważnie bardzo silny wpływ na chęć korzystania przez konsumenta z wirtualnego asystenta.
  • Drugim wynikiem tego badania jest to, że:
  1. Dostarczona jakość treści ma bardzo duży wpływ na postrzeganą użyteczność i silny wpływ na postrzeganą przyjemność.
  2. Atrakcyjność wizualna ma bardzo duży wpływ na odczuwaną przyjemność.
  3. Automatyzacja ma duży wpływ na postrzeganą użyteczność.

Kontrowersje

Kontrowersje związane ze sztuczną inteligencją

  • Wirtualni asystenci pobudzają bańkę filtrującą : Jeśli chodzi o media społecznościowe , algorytmy wirtualnych asystentów są wytrenowane w celu pokazywania istotnych danych i odrzucania innych na podstawie wcześniejszych działań konsumenta: Odpowiednie dane to te, które zainteresują lub zadowolą konsumenta. W rezultacie zostają odizolowani od danych, które nie zgadzają się z ich punktami widzenia, skutecznie izolując ich we własnej bańce intelektualnej i wzmacniając ich opinie. Zjawisko to było znane z tego, że wzmacniało fałszywe wiadomości i komory echa.
  • Wirtualni asystenci są również czasami krytykowani za przecenianie. W szczególności A. Casilli wskazuje, że sztuczna inteligencja wirtualnych asystentów nie jest ani inteligentna, ani sztuczna z dwóch powodów:
  1. Nieinteligentni, bo jedyne, co robią, to bycie asystentem człowieka i tylko wykonywanie zadań, które człowiek mógłby wykonać z łatwością iw bardzo ograniczonym spektrum działań: znajdowanie, klasyfikowanie i prezentowanie informacji, ofert czy dokumentów. Ponadto wirtualni asystenci nie są w stanie samodzielnie podejmować decyzji ani przewidywać rzeczy.
  2. A nie sztuczny, ponieważ byłyby one możliwe bez ludzkiej labelization przez mikro obróbki .

Implikacje etyczne

W 2019 roku francuski socjolog Antonio A. Casilli krytykował sztuczną inteligencję i wirtualnych asystentów w szczególności w następujący sposób:

Na pierwszym poziomie fakt, że konsument dostarcza bezpłatne dane do szkolenia i doskonalenia wirtualnego asystenta, często o tym nie wiedząc, jest etycznie niepokojący.

Ale na drugim poziomie może być jeszcze bardziej niepokojąca etycznie wiedza, w jaki sposób te AI są szkolone na podstawie tych danych.

Ta sztuczna inteligencja jest szkolona za pośrednictwem sieci neuronowych , które wymagają ogromnej ilości oznaczonych danych. Jednak te dane muszą być oznakowane przez ludzki proces, co wyjaśnia wzrost mikropracy w ostatniej dekadzie. Oznacza to zdalne wykorzystanie niektórych osób na całym świecie do wykonywania powtarzalnych i bardzo prostych zadań za kilka centów, takich jak słuchanie danych mowy wirtualnego asystenta i zapisywanie tego, co zostało powiedziane. Mikropraca została skrytykowana za niepewność zatrudnienia, jaką powoduje, oraz za całkowity brak regulacji: średnia pensja w 2010 r. wynosiła 1,38 dolara za godzinę i nie zapewnia ani opieki zdrowotnej, ani świadczeń emerytalnych, zasiłku chorobowego , płacy minimalnej . Dlatego wirtualni asystenci i ich projektanci są kontrowersyjni, jeśli chodzi o wzbudzanie niepewności zatrudnienia, a sztuczna inteligencja, którą proponują, jest nadal ludzki w taki sposób, że nie byłaby możliwa bez mikropracy milionów ludzkich pracowników.

Obawy o prywatność budzi fakt, że polecenia głosowe są dostępne dla dostawców wirtualnych asystentów w postaci niezaszyfrowanej, a zatem mogą być udostępniane osobom trzecim i przetwarzane w sposób nieuprawniony lub nieoczekiwany. Poza treścią językową nagranej mowy, sposób wypowiedzi i cechy głosu użytkownika mogą pośrednio zawierać informacje o jego tożsamości biometrycznej, cechach osobowości, budowie ciała, stanie zdrowia fizycznego i psychicznego, płci, płci, nastrojach i emocjach, statusie społeczno-ekonomicznym i pochodzenie geograficzne.

Platformy programistyczne

Wybitne platformy programistyczne dla wirtualnych asystentów obejmują:

  • Amazon Lex został udostępniony programistom w kwietniu 2017 r. Obejmuje technologię rozumienia języka naturalnego połączoną z automatycznym rozpoznawaniem mowy i został wprowadzony w listopadzie 2016 r.
  • Google udostępnia programistom platformy Actions on Google i Dialogflow do tworzenia „Actions” dla Asystenta Google
  • Apple zapewnia programistom SiriKit do tworzenia rozszerzeń dla Siri
  • IBM „s Watson , a czasami mówi się jako wirtualny asystent jest w rzeczywistości cała sztuczna inteligencja platforma i społeczność zasilania niektórych asystentów wirtualnych chatboty . i wiele innych rodzajów rozwiązań.

Poprzednie pokolenia

W poprzednich generacjach wirtualnych asystentów opartych na czacie tekstowym, asystent był często reprezentowany przez awatara (inaczej interaktywną postać online lub postać automatyczną ) — było to znane jako ucieleśniony agent .

Porównanie wybitnych asystentów

Inteligentny osobisty asystent Deweloper Darmowe oprogramowanie Bezpłatny i otwarty sprzęt HDMI out Zewnętrzne we/wy IOT Integracja z Chromecastem Aplikacja na smartfona Zawsze włączone Jednostka do jednostki kanału głosowego Język umiejętności
Alexa (aka Echo ) Amazon.com Nie Nie Nie Nie tak Nie tak tak ? JavaScript
Alicja Yandex Nie Nie dotyczy Nie dotyczy Nie dotyczy tak Nie tak tak Nie dotyczy ?
AliGenie Grupa Alibaba Nie Nie Nie dotyczy Nie dotyczy tak Nie tak tak Nie dotyczy ?
Asystent Mów do tego Nie Nie dotyczy Nie dotyczy Nie dotyczy Nie Nie tak Nie Nie dotyczy ?
Bixby Elektronika Samsung Nie Nie dotyczy Nie dotyczy Nie dotyczy Nie Nie tak Nie dotyczy Nie dotyczy ?
Asystent BlackBerry BlackBerry Limited Nie Nie dotyczy Nie dotyczy Nie dotyczy Nie Nie tak Nie Nie dotyczy ?
Mózg Brainasoft Nie Nie dotyczy Nie dotyczy Nie dotyczy Nie Nie tak Nie Nie dotyczy ?
Clova Korporacja Naver Nie Nie dotyczy Nie dotyczy Nie dotyczy tak Nie tak tak Nie dotyczy ?
Cortana Microsoft Nie Nie dotyczy Nie dotyczy Nie dotyczy tak Nie tak tak Nie dotyczy ?
Ze względu Baidu
Evi Amazon.com Prawdziwa wiedza Nie Nie dotyczy Nie dotyczy Nie dotyczy Nie Nie tak Nie Nie dotyczy ?
Asystent Google Google Nie Nie dotyczy Nie dotyczy Nie dotyczy tak tak tak tak Nie dotyczy C++
Google Now Google Nie Nie dotyczy Nie dotyczy Nie dotyczy tak tak tak tak Nie dotyczy ?
M (wycofany) Facebook
Mycroft Mycroft AI tak tak tak tak tak tak tak tak tak Pyton
SILVIA Kod poznawczy Nie Nie dotyczy Nie dotyczy Nie dotyczy Nie Nie tak Nie Nie dotyczy ?
Siri Apple Inc. Nie Nie Nie dotyczy Nie dotyczy tak Nie tak tak Nie dotyczy ?
Viv Elektronika Samsung Nie Nie dotyczy Nie dotyczy Nie dotyczy tak Nie tak Nie Nie dotyczy ?
Xiaowei Tencent ?
Celia Huawei Nie Nie Nie dotyczy Nie dotyczy tak Nie tak tak Nie dotyczy ?

Znaczenie gospodarcze

Dla klientów indywidualnych

Doświadczenia cyfrowe zapewniane przez wirtualnych asystentów są uważane za jeden z głównych najnowszych osiągnięć technologicznych i najbardziej obiecujących trendów konsumenckich. Eksperci twierdzą, że cyfrowe doświadczenia osiągną wagę statusu porównywalną z „prawdziwymi” doświadczeniami, jeśli nie staną się bardziej poszukiwane i cenione. Trend ten jest weryfikowany przez dużą liczbę częstych użytkowników i znaczny wzrost liczby użytkowników wirtualnych asystentów cyfrowych na całym świecie. Szacuje się, że w połowie 2017 r. liczba częstych użytkowników cyfrowych wirtualnych asystentów na całym świecie wynosi około 1 miliarda. Ponadto można zauważyć, że technologia wirtualnych asystentów cyfrowych nie jest już ograniczona do aplikacji na smartfony, ale jest obecna w wielu sektorach przemysłu (m.in. motoryzacyjnej , telekomunikacyjnej, detalicznej , opieki zdrowotnej i edukacji). W odpowiedzi na znaczne wydatki na badania i rozwój firm we wszystkich sektorach oraz coraz większe wdrażanie urządzeń mobilnych, przewiduje się, że rynek technologii rozpoznawania mowy wzrośnie na całym świecie o 34,9% CAGR w okresie od 2016 do 2024 r., a tym samym przewyższy rynek globalny wielkość 7,5 miliarda dolarów do 2024 roku. Według badania Ovum , „baza zainstalowanych natywnych asystentów cyfrowych” ma przekroczyć światową populację do 2021 roku, dzięki 7,5 miliardom urządzeń obsługujących aktywną sztuczną inteligencję głosową. Według Ovum do tego czasu „Asystent Google zdominuje rynek urządzeń obsługujących głosową sztuczną inteligencję z 23,3% udziałem w rynku, a następnie Bixby Samsunga (14,5%), Siri Apple (13,1%), Alexa Amazona (3,9%) i Microsoft Cortana (2,3%)."

Biorąc pod uwagę regionalną dystrybucję liderów rynku, oczekuje się, że firmy północnoamerykańskie (np. Nuance Communications , IBM , eGain ) zdominują branżę w ciągu najbliższych lat, ze względu na znaczący wpływ BYOD ( Bring Your Own Device ) i biznes mobilności w przedsiębiorstwie modele. Co więcej, oczekuje się, że rosnące zapotrzebowanie na platformy obsługujące smartfony jeszcze bardziej pobudzi rozwój branży inteligentnych wirtualnych asystentów (IVA) w Ameryce Północnej. Pomimo mniejszych rozmiarów w porównaniu do rynku północnoamerykańskiego, przewiduje się , że branża inteligentnych wirtualnych asystentów z regionu Azji i Pacyfiku , z głównymi graczami zlokalizowanymi w Indiach i Chinach, będzie rozwijać się w tempie 40% rocznego wzrostu (powyżej średniej światowej) w latach 2016–2024.

Szansa gospodarcza dla przedsiębiorstw

Wirtualni asystenci nie powinni być postrzegani jedynie jako gadżet dla osób prywatnych, ponieważ mogą mieć realną użyteczność ekonomiczną dla przedsiębiorstw. Na przykład wirtualny asystent może wcielić się w rolę zawsze dostępnego asystenta z encyklopedyczną wiedzą. I który potrafi organizować spotkania, sprawdzać stany magazynowe, weryfikować informacje. Wirtualni asystenci są tym ważniejsi, że ich integracja w małych i średnich przedsiębiorstwach często polega na łatwym pierwszym kroku poprzez bardziej globalną adaptację i wykorzystanie Internetu Rzeczy (IoT) . Rzeczywiście, technologie IoT są najpierw postrzegane przez małe i średnie przedsiębiorstwa jako technologie o krytycznym znaczeniu, ale zbyt skomplikowane, ryzykowne lub kosztowne, aby można było ich używać.

Bezpieczeństwo

W maju 2018 roku naukowcy z Uniwersytetu Kalifornijskiego w Berkeley opublikowali artykuł, w którym pokazano, że polecenia dźwiękowe niewykrywalne dla ludzkiego ucha mogą być bezpośrednio osadzone w muzyce lub tekście mówionym, manipulując w ten sposób wirtualnymi asystentami w wykonywaniu pewnych czynności bez zwracania na to uwagi użytkownika . Naukowcy dokonali niewielkich zmian w plikach audio, które wyeliminowały wzorce dźwiękowe, które mają wykrywać systemy rozpoznawania mowy. Zostały one zastąpione dźwiękami, które zostałyby inaczej zinterpretowane przez system i nakazywałyby mu wybierać numery telefonów, otwierać strony internetowe, a nawet przelewać pieniądze. Możliwość tego jest znana od 2016 roku i dotyczy urządzeń Apple , Amazon i Google .

Oprócz niezamierzonych działań i nagrywania głosu, innym zagrożeniem bezpieczeństwa i prywatności związanym z inteligentnymi wirtualnymi asystentami są złośliwe polecenia głosowe: osoba atakująca, która podszywa się pod użytkownika i wydaje złośliwe polecenia głosowe, aby na przykład otworzyć inteligentne drzwi, aby uzyskać nieautoryzowany dostęp do do domu lub garażu lub zamawiaj przedmioty online bez wiedzy użytkownika. Chociaż niektóre IVA zapewniają funkcję uczenia głosu, aby zapobiec takiemu podszywaniu się, system może mieć trudności z rozróżnieniem podobnych głosów. W ten sposób złośliwa osoba, która jest w stanie uzyskać dostęp do urządzenia obsługującego IVA, może oszukać system, myśląc, że jest prawdziwym właścicielem i przeprowadzać działania przestępcze lub złośliwe.

Zobacz też

Bibliografia