Risulta difficile immaginare il virtuale mondo di internet senza la lingua italiana, tuttavia è proprio quello che potrebbe accadere tra qualche anno. La sciagurata prospettiva non riguarda solo il nostro idioma nazionale, a rischio estinzione la maggioranza delle lingue europee.
A lanciare l’allarme i ricercatori dell’Istituto di linguistica computazionale del Consiglio nazionale delle ricerche di Pisa (Ilc-Cnr), che nel rapporto ‘La lingua italiana nell’era digitale’ hanno raccolto il lavoro di oltre 200 esperti. A minacciare la sopravvivenza delle lingue nostrane le tecnologie linguistiche usate in rete che si basano su metodi statistici che rilevano una maggiore presenza delle lingue dei paesi in via di sviluppo.
“La percentuale di pagine web in italiano a livello mondiale è raddoppiata passando dall’1,5% nel 1998 al 3,05% nel 2005” – spiega Nicoletta Calzolari dell’Ilc-Cnr. “È stato stimato che nel 2004 in tutto il mondo ci fossero 30,4 milioni di parlanti italiani online. Al di fuori dei confini dell’Unione Europea, parlano italiano 520.000 americani, 200.000 svizzeri e 100.000 australiani. Il numero di navigatori italiani negli ultimi cinque anni è però rimasto stabile, contrariamente il numero di quelli dei paesi in via di sviluppo aumenta notevolmente, cosicché la proporzione di coloro che parlano la nostra lingua subirà una forte diminuzione e potremmo andare incontro a un rischio di sotto-rappresentazione, specialmente in confronto all’inglese”. Secondo i dati raccolti dai ricercatori, la penetrazione del web in Italia si attesta al 51,7%, con 30 milioni di internauti (circa il 6,3% di quelli dell’Ue) su 58 milioni di cittadini: la loro crescita è stata del 127,5% tra il 2000 e il 2010.
Se questo è il quadro per la nostra lingua, possiamo immaginare quale sia per quelle che hanno un numero di parlanti molto inferiore. “Il dato è preoccupante”, prosegue Claudia Soria dell’Ilc-Cnr, “perché dal momento che le tecnologie linguistiche usate in Internet si basano su approcci statistici, se i dati messi a disposizione in una lingua sono pochi, si innesta un circolo vizioso: pochi dati, tecnologie di bassa qualità, ulteriore limitazione dell’uso di quella lingua”.
Lo studio condotto dall’Istituto Cnr e dalla Fondazione Bruno Kessler (Bernardo Magnini e Manuela Speranza) fa parte della ricerca Meta-Net cui hanno lavorato più di 200 esperti e documentata in 30 volumi della Collana di libri bianchi di Meta-Net (disponibile a stampa da Springer e online all’indirizzo http://www.meta-net.eu/whitepapers): “21 lingue su 30 analizzate si collocano al livello più basso, con un supporto digitale ‘debole o assente’ in almeno una delle aree tecnologiche prese in esame (correttori ortografici e grammaticali, assistenti personali interattivi su smartphones, sistemi di traduzione automatica, motori di ricerca, etc.)”, spiega Soria. “L’islandese, il lituano, il lettone e il maltese ottengono questo voto per tutte le aree. Anche basco, bulgaro, catalano, greco, ungherese e polacco, con ‘supporto frammentario’, si collocano tra le lingue ad alto rischio. All’estremo opposto si trova l’inglese, seguito da olandese, francese, tedesco, italiano e spagnolo, con ‘supporto modesto’. Nessuna lingua, però, ottiene ‘supporto eccellente’”.
“Sono risultati allarmanti” – conclude Hans Uszkoreit – coordinatore di Meta-Net. “La maggior parte delle lingue europee non dispone di risorse sufficienti e alcune sono quasi completamente ignorate. Molte di esse non hanno futuro”.
Ferdinando Fontanella