Le biblioteche digitali del futuro parlano italiano

http://www.cacaoproject.eu/NLP4DL09
Si terrà a Viareggio il 15 giugno prossimo il primo convegno mondiale su “Natural Language Processing for Digital Libraries” . Il convegno, sponsorizzato dal progetto CACAO (finanziato dalla commissione Europea nell’ambito del programma eContentplus) e da CELI ha come scopo di mettere in relazione i maggiori esperti europei sul tema delle relazioni tra lingue naturali e biblioteche digitali.
, 20/04/2009 (informazione.it - comunicati stampa) Si terrà a Viareggio il 15 giugno prossimo il primo convegno mondiale su “Natural Language Processing for Digital Libraries” . Il convegno, sponsorizzato dal progetto CACAO (finanziato dalla commissione Europea nell’ambito del programma eContentplus) e da CELI ha come scopo di mettere in relazione i maggiori esperti europei sul tema delle relazioni tra lingue naturali e biblioteche digitali.

Negli ultimi due anni, iniziative come “Google Book Search” e “Europeana” hanno fatto comprendere come una delle prossime sfide sul web sarà la messa in linea dei contenuti digitali immagazzinati presso biblioteche, archivi, redazioni,ecc.. Attualmente le attività di digitalizzazione e messa on-line di contenuti stanno procedendo a ritmo sostenuto, anche grazie anche ai contributi provenienti da iniziative europea quali EcontenPlus (60 milioni di euro). Il tema centrale del convegno NLP4DL è il seguente: una volta che queste risorse sono disponibili, qual è la maniera più semplice ed intuitiva per cercarle? L’assunto di base degli organizzatori del convegno è che la maniera più facile per trovare risorse in archivi digitali resti l’uso del linguaggio naturale. E’ un fatto che la maggior parte degli oggetti digitali disponibili contengono possibili chiavi di accesso codificate tramite la lingua: tali chiavi possono essere i cosiddetti “metadati” (informazione sull’oggetto digitale: ad esempio autore, titolo, descrizione, riassunto), informazione non strutturata comunque “connessa” (tags e commenti generati dagli utenti, links a pagine di critica, ...), fino al contenuto digitalizzato e trasformato (qualora la natura dell’opera lo consenta) in testo comprensibile da parte del computer. E’ naturale che a tutte queste informazioni codificate come “linguistiche” l’utente possa accedere utilizzando uno degli strumenti che conosce meglio, ovvero la lingua nativa. Tuttavia, e questa è una delle sfide principali di NLP4DL e la linea di ricerca predominante in CACAO, esistono tante lingue nel mondo, ed è di fondamentale importanza garantire a tutte le lingue uguale accesso al tesoro digitale on-line che va costituendosi. L’obiettivo di progetti quali CACAO ed EuropeanaConnect, che vedono la partecipazione attiva di CELI, (azienda italiana da 10 anni attiva nel campo della ricerca sull’analisi automatica del linguaggio naturale) in consorzi di portata Europea è dunque semplice: permettere ad un utente di scrivere una ricerca nella propria lingua e ricevere tutti i risultati rilevanti a prescindere dalla codifica linguistica. Ad esempio sarà possibile ad un utente italiano accedere a stampe settecentesche della planimetria di Parigi conservate presso la Bibliothèque Nationale de France, semplicemente digitando “carta di Parigi secolo diciassettesimo”, nonostante il fatto che tutta l’informazione correlata a tali oggetti digitali sia integralmente in francese.

Il convegno, ospitato presso l’Hotel Esplanade di Viareggio, comprende tanto la presenza di oratori scelti sulla base di contributi “peer reviewed” quanto una selezione di “invited talk” a cura dei più apprezzati esperti europei nel campo.


Approfondimenti
Riferimenti Contatto
Ufficio Stampa
Luca Dini
CELI
Corso Moncalieri 21
10131 Torino Italia
dini@celi.it
0116600814
Allegati
Non disponibili