Gli assistenti vocali oggi svolgono alcune funzioni che possiamo definire basilari come darci le notizie sul tempo o impostare un timer. Utenti più evoluti li usano per comandare i vari apparati smart della casa come le luci, il condizionatore o le tapparelle. Il vero salto di qualità però sta nell’intelligenza artificiale generativa che li renderà davvero in grado di interagire in forma colloquiale con gli esseri umani, come sta facendo Amazon con Alexa che ha già di fronte il concorrente principale.
Chi non ha mai sentito parlare di assistenti vocali? Sono entrati nell’uso quotidiano di milioni di famiglie e come tutta la tecnologia di cui disponiamo si stanno evolvendo. Dopo il successo dell’intelligenza artificiale generativa di ChatGPT e dei suoi concorrenti, gli assistenti vocali, con cui interagiamo tramite gli smart speaker e gli smartphone, sono di fatto rimasti al palo. Ma c’è un motivo, e Alexa di Amazon ha iniziato a colmare questo vuoto.
Gli assistenti vocali e il loro utilizzo
Innanzitutto, facciamo un breve elenco dei più comuni. Google assistant, Alexa di Amazon e Siri di Apple sono quelli predominanti. Microsoft ha iniziato a dismettere il suo Cortana per scarso utilizzo ma a breve porterà Copilot che invece si doterà di intelligenza artificiale e sarà soprattutto orientato alle soluzioni office.
Da uno studio di Vocalime chiamato “Voice Technology Italia 2022″ emerge che il 90% degli italiani conosce gli assistenti vocali. L’85,4% ha interagito con quelli che riconoscono la voce almeno una volta. Il 66,4% ha avuto modo di usare questa tecnologia nell’ultimo mese. Il rovescio della medaglia è che sono in pochi a ritenerli utili, spesso ci si riduce a chiedere di mettere un timer, soprattutto perché non tutti sono utenti avanzati che usano le app vocali. Le skill di Alexa e Action su Google Assistant ne potenziano le capacità.
Quello che manca quindi agli assistenti vocali è l’implementazione di un sistema che sia in grado di capirci di più e dare risposte più articolate e che interagisca meglio con le nostre ricerche: quello che sta implementando Amazon in Alexa
L’intelligenza artificiale nella nuova Alexa
Durante l’evento annuale di presentazione dei nuovi prodotti Amazon rivela la nuova Alexa. David Limp ,Senior Vice President della divisione dispositivi e servizi di Amazon, sta per andare in pensione ma la sua Alexa ormai è diventata grande.
Limp, ha dichiarato di essere stati per 10 anni al lavoro per migliorare Alexa ma solo con la svolta dell’intelligenza artificiale generativa si è arrivati a un nuovo e potente punto di svolta. La funzione specifica che attiva la IA si chiama “Alexa let’s chat”. Certo, l’intelligenza artificiale era già usata per riconoscere ciò che si chiede, associandola a parole chiave e usando milioni di dati di addestramento che facciamo noi stessi a mano a mano che la utilizziamo. Con l’IA generativa però hanno potuto fare un balzo in avanti esponenziale di cui c’era un gran bisogno per portare l’assistente a un livello decisamente più alto.
L’evoluzione di Alexa
Il problema più grande di Alexa è che “vive” con e persone nelle case e quindi non si può permettere di sbagliare troppo. Inoltre, tra l’elaborazione del testo da parte dell’IA, come facciamo con i vari chatbot e quella del parlato, come facciamo con gli assistenti vocali, si sono molte differenze di ordine tecnico.
Alexa ha bisogno di capire quello che viene chiesto e farlo con una richiesta vocale è più difficile che con un testo scritto. Alexa, quando gli rivolgiamo una domanda traduce la voce in formato testo, la elabora, la ritrasforma in voce e la invia ai nostri smart speaker.
Ora, con l’evoluzione di questa tecnologia Alexa non ha bisogno di essere richiamata ogni volta. Il sistema capisce che si tratta di una conversazione e quindi avvia un interscambio di frasi come se si stesse parlando con una persona, e lo fa senza dover prima trascrivere il parlato.
Un altro limite dell’attuale tecnologia lo ritroviamo nelle riposte piatte e senza enfasi. Il nuovo modello, per ora il lancio è previsto solo negli USA, è in grado di dare tono alla voce ed anche velocità con le sfumature tipiche di una conversazione umana. Ovviamente ci sono vantaggi ma anche svantaggi, ad esempio è sempre bene ricordarsi che stiamo parlando con una macchina che in fin dei conti non capisce, non è veramente intelligente e non prova emozioni. Per approfondire consiglio di leggere il libro di Massimo Chiriatti: Incoscienza artificiale.
ChatGPT non sta a guardare
Non appena Amazon ha rivelato l’integrazione della IA generativa nella sua Alexa, ecco che spunta la novità in casa ChatGPT, che è senza ombra di dubbio il principale riferimento in questo settore. Infatti, da poco è stata inserita l’integrazione vocale. Sulle app per IOS e Android si può dettare quello che viene chiamato prompt, ovvia la richiesta che si desidera fare. A quel punto la risposta non ci viene più data sotto forma di testo ma attraverso una voce. Un altro veloce passo avanti per questi sistemi, considerando che ora ChatGPT è ora anche in grado di cercare informazioni aggiornate sul web, offrendo risposte tratte direttamente da fonti “attuali e autorevoli”, e le cita nelle risposte, superando il limite dell’addestramento fermo al 2021. Funzioni queste, è bene ricordare, riservate agli utenti delle versioni a pagamento. Del resto far funzionare il sistema costa ad OpenAI 1 milione di dollari al giorno.
Il futuro
Cosa dovremo aspettarci nel prossimo futuro? Pier Luigi Pisa, giornalista di Repubblica ha pubblicato un articolo sull’argomento e sul suo post di Linkedin afferma: “I nuovi speaker – di Amazon ma anche di Google – ora usano i dati biometrici (i contorni di un volto ma anche il linguaggio del corpo) per capire meglio il contesto e il tono di una conversazione. È una svolta epocale, perché l’AI generativa imparerà, in un certo senso, come stare al mondo.
Tutto questo conduce al salto definitivo verso i robot. E probabilmente verso macchine senzienti.”
La fantascienza di “Io Robot “di Asimov si farà realtà? Nel frattempo, quando arriverà nel nostro paese, inizieremo a provare questa nuova funzione e tentare a trarne vantaggio anche sul lavoro.