La Toscana digitalizza 26 600 documenti di Oriana Fallaci entro il 2025, potenziando l’accesso culturale e aprendo al valore analitico della linguistica computazionale.

Il Consiglio regionale toscano avvierà entro fine 2025 la digitalizzazione del Fondo Oriana Fallaci, comprendente manoscritti, appunti, interviste e fotografie . Questo archivio verrà arricchito con metadati e strumenti di interrogazione, ponendosi come base ideale per applicazioni di linguistica computazionale e filologia digitale.
Digitalizzazione e democratizzazione della cultura
Il progetto, annunciato nella Sala delle Feste a Palazzo Bastogi dal presidente Antonio Mazzeo e dalla Soprintendenza archivistica, punta a conservare e rendere immediatamente consultabili 26 600 documenti e circa 2 000 volumi. La conversione in formato digitale non è limitata alla mera gestione dell’immagine: prevede l’associazione di metadati strutturati e l’integrazione in una piattaforma dedicata, distinguendosi come esempio di filologia digitale, dove i documenti diventano oggetti vivi, interrogabili, remixabili. In questo modo, la memoria di Oriana Fallaci – tra le più amate e discusse firme del Novecento italiano e internazionale – diventa patrimonio condiviso, superando vincoli spaziali, cronologici e fisici. La Toscana si conferma apripista, perché digitalizzare vuol dire costruire memoria, democratizzare la cultura e renderla accessibile a tutti.

Linguistica computazionale al servizio dell’archivio
Una volta digitalizzati, testi e materiali del Fondo diventano perfetti candidati per sperimentazioni di linguistica computazionale. Processi come l’OCR e l’analisi semantica ne tracciano la struttura testuale, mentre tecniche di named entity recognition (NER) e annotazioni tematiche abiliteranno l’estrazione di entità, luoghi, date e persone in modo sistematico. Esperienze analoghe, come lo studio delle annotazioni nel fondo Leopoldiano di Leopardi, dimostrano che già modelli BERT generalisti faticano con testi storici, mentre modelli RNN o LLM specifici ottengono risultati più precisi . Appunti manoscritti, bozze, corrispondenza privata e registrazioni digitali potranno così generare corpora annotati, utili per analisi quantitative – ad esempio, frequenze lessicali o reti tematiche – e analisi qualitative basate su metadati contestualizzati. Questo tipo di approccio favorisce una filologia computazionale capace di rivelare attitudini stilistiche, evoluzioni ideologiche e pattern narrativi nella produzione fallaciana.
Opportunità e criticità tecnologiche
L’implementazione di un archivio digitale su larga scala richiede solide infrastrutture tecnologiche e scientifiche: la qualità dell’OCR (in particolare su materiali manoscritti o dattiloscritti), la gestione dei metadati, la protezione tramite watermarking e la corredata disponibilità a livello internazionale . Ma non è tutto: servono competenze interdisciplinari per costruire corpora linguistici di alta qualità, annotati con cura e implementati con algoritmi di NLP avanzati. Qui entra in gioco la collaborazione con team di linguisti computazionali, data scientist e archivisti digitali: solo così l’archivio diventa un ambiente vivo e interrogabile. L’obiettivo non è solo preservare, ma dare forma a un “laboratorio digitale”: il Fondo Fallaci può diventare materia prima per ricerche sull’evoluzione del linguaggio giornalistico, sull’analisi sentimentale o sulla ricostruzione retorica dei testi.
Con questo impianto, la Toscana non soltanto conserva un patrimonio irrinunciabile, ma apre una finestra sul futuro delle digital humanities: filologia, tecnologia e linguistica computazionale convergono per costruire strumenti che potenziano la ricerca, stimolano la creatività e rendono la cultura patrimonio comune, accessibile e interrogabile in ogni tempo e luogo.