Pensare a lungo termine in Amazon: l’educazione di Alexa in Italia

Pensare a lungo termine in Amazon: l’educazione di Alexa in Italia

di Selena Mariano
 
Gianmaria Visconti (Alexa country manager Amazon Italia), in occasione del Festival Internazionale del Giornalismo, ha raccontato l’esperienza di Amazon Alexa in Italia. L’incontro è partito da lontano, per aiutare a comprendere al meglio l’evoluzione tecnologica che ha consentito di sviluppare la smart virtual agent famosissima in tutto il mondo.
È stata inizialmente introdotta la legge di Moore (ca. 1960), che definisce la velocità standard (prima 2, adesso 4 anni) alla quale i nanometri dei processori si riducono e se ne aumenta la prestazione. Oggi questa legge non vale più: la potenza computazionale dei microchip non può più migliorare. Per questo l’industria ha cominciato a utilizzarli anche in altri prodotti (lampadine, frigoriferi, etc.), ma serve qualcosa che possa interagire con i chip per dirgli come comportarsi. Si è sviluppata così la IoT: Internet of Things, che consente l’estensione di Internet al mondo degli oggetti e dei luoghi concreti. 
Alexa ha la stessa funzione delle IoT, pur non essendolo. Essa è, infatti, un cloud based voice service il che le consente di interagire con i chip, una volta imparata la lingua in cui le si dice cosa fare.
L’ispirazione di Alexa nasce dai computer ad interfaccia vocale di Star Trek. L’interazione verbale è connaturata all’essere umano, l’uomo parla da quando è sulla terra ed è per questo che oggi si vuole applicare l’interazione verbale anche alle macchine. Siamo passati così, tecnologicamente parlando, da interfacce testuali (CLI) a quelle grafiche (GUI), poi al web, al touch e infine, adesso, al vocale (VUI). 
I capisaldi della tecnologia su cui si basa Alexa sono due: gli algoritmi di machine learning avanzati e il cloud computing, che consente una potenza di calcolo illimitata.
Per insegnare una lingua ad Alexa non si usa un processo di traduzione, ma di localizzazione, e si parte da zero. I tre fattori principali dell’assistente (voce, aspetti culturali e personalità) non riescono a rientrare né ad essere previsti nel processo di traduzione. Insegnare una lingua ad Alexa è possibile tramite il lavoro sinergico tra scienze e discipline umanistiche, in particolare tra ingegneria e linguistica.
Il processo di localizzazione di Alexa passa attraverso cinque punti: comprensione, personalità, riferimenti culturali, voce, skills.
Comprensione – Il punto di partenza è codificare le regole della grammatica ed insegnarle al cloud. Ma una lingua è molto di più della sua grammatica, si veda ad esempio il numero di accenti. Nel caso italiano, sono stati coinvolti clienti con diverse inflessioni a cui è stato fornito un dispositivo Echo da testare. Questo ha consentito in primis di migliorare il riconoscimento vocale, ma anche di avere un feedback esplicito dai consumatori.
Personalità – Alexa di base è cordiale, interessante, talentuosa e spiritosa. Oltre ciò, da paese a paese, seguendo profili editoriali diversi, Alexa presenterà gusti differenti, conoscerà le news locali, avrà le sue opinioni in merito a certi temi, etc.; avrà cioè una personalità “geolocalizzata”.
Riferimenti culturali – Alexa conosce la storia, la geografia, la politica, gli sport, gli eventi delle nazioni in cui è attiva e per ognuna si adatta culturalmente. Tramite la graforiconoscenza, Alexa ha imparato a individuare fonti informative attendibili a cui attingere per raccontare cosa succede nel paese.
Voce – I fonemi della voce di Alexa vengono registrati ex novo, facendo attenzione a tre parametri: tono, ritmo e pronuncia, in modo tale da raggiungere la maggior naturalezza e fluidità possibili.
Skills – In Italia, Alexa ha più di 2.000 skills, che nascono da accordi tra Amazon e aziende e marche italiane, come giornali, radio, etc. per garantire ai consumatori di poter usare le marche che usa sempre.
Tre gli aspetti critici nello sviluppo di Alexa: come accendere un dispositivo con un’interfaccia puramente vocale?; come far riconoscere il linguaggio?; come processare la domanda che viene posta ad Alexa?.
Come ormai ben sappiamo, Alexa si accende solo quando la chiamiamo per nome. Sviluppare le sue capacità è stato poi possibile migliorando gli strumenti di base di Alexa e dandole strumenti migliori per la comprensione del linguaggio naturale.
 
In Italia ha avuto un boom pazzesco: più di 5.000 recensioni, con una media di quattro stelle e mezzo. Un tale successo è stato possibile perché l’interazione con Alexa è così semplice che consente anche a chi non ha particolari competenze tecnologiche e, inoltre, è credibile dal punto di vista affettivo.
 
Photos by: Selena Mariano

Profile picture for user PhonicaNews

Programma radio