Come l’intelligenza artificiale cambierà le competenze linguistiche

Al giorno d’oggi, uno degli argomenti più dibattuti nel mondo digitale e non solo è quello dell’intelligenza artificiale, che abbiamo imparato ad apprezzare con software come Siri o Alexa, ma che negli ultimi tempi hanno iniziato a farsi strada in sempre più ambiti, pur con le loro limitazioni, creando un grande dibattito intorno ad esse. In questo articolo, quindi, vedremo come si sviluppano i software per l’apprendimento linguistico basati sull’intelligenza artificiale, quali sono le ultime novità in merito, e quali sono i limiti delle intelligenze artificiali nell’insegnamento e nell’apprendimento delle lingue.

Come sono strutturati i software di apprendimento linguistico

L’interfaccia utente grafica classica (+ riconoscimento vocale) è utilizzata dagli studenti di lingua per completare compiti digitali tramite il clic del mouse, in modo simile a come si farebbe con i tradizionali libri di esercizi. I vocaboli possono essere associati alle immagini tramite il drag and drop o vengono eseguiti esercizi di riempi-gli-spazi. Tuttavia, questa modalità didattica non si concentra sull’intelligenza artificiale (IA), ma piuttosto sull’ambiente desktop convenzionale.

Dal punto di vista della psicologia dell’apprendimento, il problema è che gli elementi di testo predefiniti vengono spostati avanti e indietro senza dare all’utente l’opportunità di esercitarsi nella creazione di formulazioni creative e spontanee. Molte applicazioni commerciali di apprendimento linguistico funzionano in questo modo, a volte in una sola lingua (come Rosetta Stone), altre volte con la traduzione (come Babbel). Dal punto di vista didattico, anche i leader del settore di queste app si affidano a concezioni datate come il metodo di traduzione o le esercitazioni ripetitive, poiché è più facile adattare formati estremamente strutturati alla tecnologia attuale.

Alcune di queste applicazioni sono integrate con un software di riconoscimento vocale che può identificare le risposte vocali dell’utente, ma talvolta fallisce se la pronuncia è errata. Questa funzione chiaramente non sostituisce la lezione di fonetica, poiché la valutazione dei dati audio da parte della tecnologia si basa su criteri completamente diversi, come la valutazione della probabilità di una determinata combinazione di suoni. Il riconoscimento vocale può essere influenzato da una pronuncia poco chiara, sussurri o rumori di sottofondo, e addirittura può essere intenzionalmente alterato dagli studenti. Inoltre, le app non forniscono un feedback individuale sull’articolazione. La ripetizione dell’input vocale da parte dello studente, seguita da un messaggio di errore da parte del dispositivo, genera frustrazione e non contribuisce al miglioramento della pronuncia.

Interfaccia linguistica con funzione interattiva: Questo tipo di interfaccia cerca di simulare l’interazione linguistica naturale con un tutor virtuale e può essere considerato IA nel senso più stretto. Questi sistemi di dialogo si basano sul principio dei chatbot elementari, consentendo una comunicazione intuitiva in linguaggio naturale. Gli studenti possono inserire liberamente contributi vocali o scritti, e il programma riconosce eventuali parole chiave predefinite. Se l’utente utilizza la parola chiave corretta, il dispositivo seleziona e fornisce una risposta predefinita adeguata che viene recitata dal tutor artificiale. L’input e l’output linguistici possono avvenire sia per iscritto che vocalmente.

Ad esempio, la versione in inglese dell’app di apprendimento linguistico Duolingo utilizza un chatbot basato sulla scrittura. In questo contesto, il problema principale è che la maggior parte dei sistemi risponde solo a parole chiave semplici e ha difficoltà nell’valutare la correttezza grammaticale o l’adeguatezza contestuale dell’input. I sistemi dei tutor artificiali interattivi funzionano solo in scenari chiaramente definiti, con dialoghi e fonti di errore prevedibili. Entro questi limiti, sono in grado di fornire contenuti didattici con una progressione predefinita (ideale se selezionabile dall’utente), porre domande e fornire feedback. Tuttavia, l’applicazione di questa tecnologia nella mediazione delle lingue straniere è ancora lontana dalle sue promesse. Tuttavia, viene già utilizzata sporadicamente negli studi universitari, ad esempio nei gruppi di studio di linguistica, grammatica e ortografia tedesca con l’aiuto dell’affascinante tutor El Lingo presso l’Università Leibniz di Hannover.

Ambienti didattici virtuali con sistemi agenti pedagogici: I sistemi con avatar complessi, che includono gesti e personificazione (embodiment), sono considerati i più avanzati. Ad esempio, presso l’Università di Bielefeld, è in corso lo sviluppo di un agente pedagogico chiamato Max, una guida museale virtuale. Gli utenti possono interagire con lui riguardo agli oggetti esposti, ma solo se si attengono al copione dei dialoghi predefiniti e si comportano in modo cooperativo.

Il problema nell’insegnamento delle lingue straniere è che l’interazione con il sistema agente avviene senza problemi solo se gli studenti pongono domande e forniscono risposte previste dagli sviluppatori del software. Tuttavia, sappiamo che il comportamento umano non è sempre prevedibile, e quindi i dialoghi con chatbot e sistemi agenti possono risultare discontinui, incoerenti e rischiano di generare inconvenienti non appena si esce dai limiti del copione. Pertanto, non possono fungere da modelli affidabili per gli studenti di lingue straniere.

Il contributo di Google all’apprendimento linguistico con l’intelligenza artificiale

Google sta facendo progressi rapidi in un progetto chiamato Universal Speech Model (USM), un modello linguistico che mira a supportare mille diverse lingue di tutto il mondo. Questo progetto fa parte dell’iniziativa denominata 1000 Languages Initiative, annunciata lo scorso novembre e ora in fase di importanti aggiornamenti. L’obiettivo di questa iniziativa è costruire un’intelligenza artificiale in grado di supportare mille lingue, “portando una maggiore inclusione a miliardi di persone nelle comunità emarginate in tutto il mondo“, come spiegato da Jeff Dean, vicepresidente senior della Ricerca di Google, al momento dell’annuncio.

Il programma presenta diverse caratteristiche rilevanti. In primo luogo, renderebbe accessibili alle grandi masse le potenzialità dei sistemi di intelligenza artificiale di Mountain View e tutti gli strumenti infiniti che questi andranno ad arricchire. In secondo luogo, tra le varie possibilità, consentirebbe la traduzione perfetta tra oltre mille lingue, trasformando questo modello linguistico in un certo senso in un traduttore universale senza ostacoli. Non è un caso, infatti, che tra i più di 20 prodotti potenziati dall’intelligenza artificiale che saranno presentati quest’anno alla conferenza per gli sviluppatori di Google, I/O, in programma il 10 maggio, ci si aspetti una prima evoluzione significativa di Google Translate. Anche in un recente incontro con la stampa a Parigi, Google ha confermato che le lingue rappresentano uno dei fronti più interessanti per lo sviluppo di nuovi servizi basati sull’intelligenza artificiale.

USM rappresenta il massimo livello di sviluppo di un modello linguistico, che è stato creato includendo due miliardi di parametri addestrati su 12 milioni di ore di parlato (corpus orale) e 28 miliardi di frasi in 300 lingue. È già utilizzato su diverse piattaforme: Alphabet lo utilizza su YouTube per generare automaticamente i sottotitoli e supporta anche il riconoscimento vocale automatico con risultati significativi. Si comprende che se questi strumenti diventeranno utilizzabili in oltre mille lingue, si creerà una piattaforma che diventerà di per sé una sorta di esperanto, un punto di connessione cruciale da integrare in applicazioni e piattaforme per comunicare nel mondo senza conoscere le altre lingue, con sistemi di traduzione automatica ancora più efficienti rispetto all’attuale Google Translate o ad altri strumenti simili integrati in alcune app di uso comune, come ad esempio nella chat di Vinted.

Tuttavia, alcune di queste lingue sono parlate da meno di venti milioni di persone. Sebbene possano sembrare moltissime, sono ancora poche per consentire alle attuali intelligenze artificiali di disporre di materiale sufficiente per un addestramento adeguato. Pertanto, lo sviluppo di meccanismi di machine learning sempre più avanzati e potenti è fondamentale per raggiungere una vera inclusività linguistica nell’ambito dell’intelligenza artificiale.

Anche ChatGPT, interrogata sulla questione, conferma di poter “comunicare in qualsiasi lingua per la quale ci siano abbastanza dati disponibili nel mio database di apprendimento automatico. Tuttavia, la mia capacità di supportare una lingua specifica dipende dalla disponibilità di dati di lingua naturale e dalla mia capacità di apprendere e comprendere la struttura grammaticale e lessicale della lingua“.

USM, come menzionato in precedenza, viene utilizzato su YouTube e “può eseguire il riconoscimento vocale automatico non solo per lingue ampiamente parlate come l’inglese e il mandarino, ma anche per lingue con risorse limitate come l’amarico, il cebuano, l’assamese e l’azero, per citarne alcune“, come affermato in un post sul blog ufficiale di Google dedicato all’intelligenza artificiale.

In uno studio intitolato “Google USM: Scaling Automatic Speech Recognition Beyond 100 Languages“, il gigante tecnologico ha dimostrato una capacità fondamentale della sua intelligenza artificiale: l’utilizzo di un ampio set di dati multilingue non etichettati per pre-addestrare l’encoder del modello e il successivo tuning su un set più piccolo di dati etichettati consente di riconoscere le lingue sottorappresentate. Inoltre, il processo di addestramento del modello è efficace nell’adattarsi a nuove lingue e nuovi dati. In altre parole, si tratta di un sistema che, imparando da un insieme poliglotta di dati, riesce poi sorprendentemente a specializzarsi in lingue per le quali si dispone di meno materiale. E continua a progredire in modo rapido verso la capacità di apprendere una lingua sfruttando le informazioni provenienti da altre lingue.

Attualmente, lo Universal Speech Model supporta circa 100 lingue, ma rappresenta solo l’inizio di una vasta piattaforma di traduzione automatica alimentata dall’intelligenza artificiale. Anche Meta sta lavorando su un progetto simile, sebbene con risultati finora meno efficaci in termini di tempistiche e successi.

Limiti e potenzialità dell’intelligenza artificiale per l’apprendimento linguistico

Le potenzialità e i limiti delle intelligenze artificiali (IA) sono un argomento di interesse e dibattito. Gli aspetti problematici dell’interazione con i sistemi AI derivano dalla loro impostazione deterministica, in cui seguono un programma predefinito e hanno accesso a risorse limitate di conoscenza sociale e culturale. Al contrario, la comunicazione umana si basa su presupposti di conoscenza condivisa e si adatta in modo flessibile alle situazioni interattive, trasmettendo solo le informazioni rilevanti in modo efficiente. Le IA attuali non sono in grado di replicare completamente questa capacità comunicativa a causa della mancanza di consapevolezza cognitiva.

Nel futuro, è probabile che i libri didattici analogici siano sostituiti da applicazioni di e-learning con un’interfaccia utente grafica. Tuttavia, l’IA non sostituirà completamente gli insegnanti, almeno nel prossimo futuro. Le applicazioni di e-learning con tutori artificiali possono fungere da strumenti innovativi di supporto all’autoapprendimento, ma non possono sostituire le lezioni in presenza. Per alcuni studenti, l’interazione con un agente pedagogico virtuale o l’utilizzo di giochi linguistici con personaggi virtuali possono essere molto stimolanti. Altri studenti apprendono meglio attraverso l’interazione sociale in un gruppo di lavoro reale, con un insegnante fisico che monitora i progressi.

I sistemi interattivi di apprendimento linguistico possono colmare un vuoto quando non è possibile partecipare a una lezione in presenza, ad esempio per lavoratori impegnati che non hanno tempo per frequentare corsi tradizionali, consentendo loro di acquisire conoscenze linguistiche di base per viaggiare all’estero. Inoltre, le applicazioni di apprendimento linguistico possono essere utili per i migranti che desiderano acquisire una conoscenza linguistica di base mentre aspettano l’autorizzazione a partecipare a un programma di integrazione. Tuttavia, queste tecnologie sono principalmente indicate per principianti e come preparazione alle lezioni in presenza con un insegnante umano come quelli di The Language Center.

Via Mazzini 18 06059

Todi (PG) Italy

P.Iva 02551710540

Ente accreditato MIUR e ISO 9001

Certificazioni

Pagine utili

Torna sù