L'indagine

SosTech. Un amico che non ti delude (quasi) mai: l’assistente vocale

di Giordano Rodda |

Da Alexa a Siri, passando per Cortana e Assistant, le ormai familiari interfacce vocali dei nostri dispositivi digitali hanno smesso di essere soltanto una curiosità e sono entrate a far parte della nostra routine quotidiana.

Rubrica settimanale SosTech, frutto della collaborazione tra Key4biz e SosTariffe. Per consultare gli articoli precedenti, clicca qui.

L’ultimo arrivato – per ora solo in Corea del Sud – si chiama Bixby e sa rappare, fa beatbox nel tempo libero e non ha una grande opinione dei suoi colleghi. Bisognerà aspettare un po’ per vedere quello che è capace di fare: basandosi sul deep learning, l’assistente vocale del nuovo Samsung S8 si adeguerà infatti alle abitudini e alle specifiche caratteristiche dei suoi utenti, poco alla volta. Echo Look, invece, è un tipo più raffinato: creatura di Amazon, ti scatta foto mentre provi gli outfit e poi, come un’amica o una commessa solerte, ti consiglia l’abbigliamento migliore.

 

L’evoluzione della tecnologia vocale

Fino a qualche anno fa gli assistenti vocali (per smartphone, tablet o PC, ma anche stand alone per nuovi prodotti, come per Amazon e Google), sembravano solo una curiosità troppo acerba. Poco reattivi, un po’ duri di comprendonio, limitati nelle capacità, ci obbligavano a pronunce improbabili anche solo per far capire che canzone avevamo voglia di sentire dalla nostra libreria musicale. Ora la situazione è cambiata: Cortana, Alexa, Siri, Assistant (anche noto come “Ok, Google”, visto che a Mountain View sembrano essere meno interessati alla personalizzazione) vengono sempre più interpellati in qualità di segretari virtuali, soprattutto quando non abbiamo le mani libere (ad esempio perché siamo alla guida) o vogliamo gestire sistemi complessi come la domotica casalinga (è il caso di Echo di Amazon e Home di Google). Non solo: il riconoscimento vocale si fa strada anche altrove, dalle Barbie alle Ford, e Starbucks sta addirittura testando un “barista robot” in grado di prendere gli ordini che vengono pronunciati al telefono. Non si tratta, com’è ovvio, di semplice “riconoscimento vocale”, ma della capacità di elaborare le informazioni carpite nel modo più “intelligente” possibile.

graf1.jpg

L’identikit dell’utente: maschio, giovane e benestante

Un interessante rapporto curato da Mindshare e J. Walter Thompson London, intitolato significativamente «Speak Easy», mostra il rapporto degli assistenti vocali e della voice recognition technology con gli utenti inglesi, in un mondo in cui ormai – secondo statistiche messe a disposizione dalla stessa Google – il 20% delle ricerche viene effettuato parlando, e non digitando su una tastiera o su uno schermo.

Attualmente il 37% degli utenti smartphone utilizza almeno una volta al mese il riconoscimento vocale, e il 18% lo fa una volta alla settimana. Ben il 60% dei primi utenti di Amazon Echo ha dichiarato che parlare con Alexa è ormai diventato parte integrante della loro routine quotidiana.

Il mercato è variegato, con la ricerca vocale di Google e Siri di Apple che si contendono il primato, seguiti da una concorrenza che è arrivata un po’ più tardi ma non sembra avere alcuna intenzione di rimanere a guardare. La diffusione ormai capillare di 3G e 4G (su SosTariffe.it si possono cercare le più convenienti offerte per Internet mobile e controllare di persona) ha del resto aumentato, e non di poco, la frequenza con cui accediamo a Internet e alle sue potenzialità anche quando siamo in giro: era destino che gli assistenti vocali ne traessero vantaggio. Non stupisce, in ogni caso, che al momento gli utenti più entusiasti siano giovani e benestanti: la media di chi usa la tecnologia vocale in Inghilterra si aggira intorno al 37%, ma sale al 50% fra i giovani tra i 18 e i 34 anni, al 43% tra gli uomini e al 48% nelle case dove entrano ogni anno più di 50.000 sterline.

Non si vive di solo lavoro

L’abbiamo già intuito con Bixby: gli assistenti sanno essere anche molto frivoli. Non si contano le risposte spiritose a frasi ammiccanti o semplicemente strambe (provate a dire “antani”, “che la Forza sia con te” o “qual è il significato della vita” a Siri, ad esempio). Una perdita di tempo, un giochino da programmatori? Non proprio: l’aspetto ludico, a quanto pare, è fondamentale per chi si interfaccia con un assistente vocale e probabilmente sarebbe un po’ intimidito dalla totale mancanza di complicità. Secondo il rapporto, infatti, il 45% degli utenti abituali usa il riconoscimento vocale perché “è divertente”.

Si tratta, però, di una caratteristica probabilmente destinata a scomparire, una volta rotto il ghiaccio. Al momento, le tre ragioni principali per l’uso della voce sono che è “comodo”, “facile da usare” e “più veloce della scrittura”, considerando che gli uomini sono in grado di pronunciare anche 150 parole al minuto, e un assistente vocale capace di starci dietro sarà probabilmente il futuro della nostra comunicazione.

graf2.jpg

I rischi di un rapporto troppo stretto

È chiaro: ci possono anche essere effetti collaterali. Avere una voce amica, sempre disponibile, paziente, tranquilla, servizievole, porta a conseguenze imprevedibili: Spike Jonze ci ha vinto un Oscar con Her, la storia di uno scrittore, Theodore, interpretato da Joaquin Phoenix, che si innamora del suo assistente vocale, Samantha, con la voce di Scarlett Johannson. (A proposito: provate a chiedere a Siri se lei è Samantha). Fantasia? Mica tanto: secondo il rapporto, il 26% degli utenti regolari ha avuto una fantasia sessuale sul suo assistente vocale; più di un terzo, il 37%, sostiene di amare il suo assistente così tanto da desiderare che fosse una persona vera.

Del resto, il 60% degli utenti smartphone pensa che usarebbe l’assistente vocale in continuazione se fosse in grado di capire il suo “umano” e rispondergli a tono: inevitabile che la tecnologia si muovesse in questa direzione, basando anche le relazioni virtuali sulla fiducia. Basta pensarci: gli assistenti vocali sono il volto di apparecchi che contengono tutti i nostri dati più privati, dalla nostra cronologia su Internet alla password del conto in banca, per non parlare nemmeno di mail, messaggi, fotografie. È inevitabile che per vincere la barriera di chi non vuole saperne degli assistenti vocali si debba puntare molto sulla capacità di fidarsi, che passa per forza di cose dalla familiarità. Addirittura il Gatebox, un apparecchio giapponese simile a Echo di Amazon, prevede anche Hikari, una ragazza olografica alta una decina di centimetri in grado di riconoscere il volto dell’utente e la sua voce. Come ha commentato Martin Reddy, co-fondatore e CTO di PullString, una delle società più attive nel campo della conversazione computerizzata: “È interessante, quando qualcosa agisce in modo naturale e ‘umano’ nel suo rapporto con te, quanto tu sia propenso a farlo diventare senziente, con una personalità umana”.

Fonti: http://www.mindshareworld.com/sites/default/files/Speakeasy.pdf