Conservare i documenti digitali

Conservare i documenti digitali

Breve introduzione al modello OAIS

Il PNRR e la digitalizzazione

La prima missione del Piano Nazionale di Ripresa e di Resilienza (PNRR) italiano riguarda la digitalizzazione, l’innovazione, la competitività, la cultura e il turismo, missione per la quale sono stanziati 40,32 miliardi[1] di euro. Le componenti di questa missione sono tre: le prime due riguardano la digitalizzazione, l’innovazione e la sicurezza nella Pubblica Amministrazione, a cui sono dedicati 9,75 miliardi; la terza componente riguarda la digitalizzazione, l’innovazione e la competitività del sistema produttivo, a cui sono destinati 23,89 miliardi[2].

La grande attenzione data alla digitalizzazione nel PNRR, in particolare quella riguardante la Pubblica Amministrazione, fa scaturire una domanda: chi conserverà in futuro l’immensa mole di documenti digitali che saranno prodotti?

Il PNRR risponde solo in parte a tale quesito. Infatti, oltre a una serie di interventi quali la rimozione delle barriere architettoniche negli archivi per consentire l’accessibilità[3], gli archivi edilizi relativi al superbonus[4], una generale digitalizzazione del patrimonio di archivi, biblioteche e musei[5], un archivio centrale dei documenti sanitari relativi al fascicolo sanitario elettronico[6], e varie spese nell’ambito dei beni culturali[7], il Piano Nazionale di Ripresa e Resilienza prevede, in merito all’investimento “Strategie e piattaforme digitali per il patrimonio culturale”, un progetto denominato “Polo di conservazione degli archivi storici digitali della Pubblica amministrazione”. Il soggetto attuatore individuato è l’Archivio Centrale dello Stato, il cui ruolo era già stato rafforzato dal Piano triennale per l’informatica nella Pubblica Amministrazione dell’Agenzia per l’Italia digitale[8].

Le suddette iniziative rappresentano un primo passo verso le importantissime sfide sulla conservazione dei documenti digitali dei prossimi anni e, d’altra parte, investimenti economici per la conservazione dei documenti digitali sono necessari. Difatti, esistono standard internazionali che contengono indicazioni precise su come conservare documenti digitali, e tali standard richiedono infrastrutture precise. Questo articolo si concentrerà sull’analisi del principale standard internazionale in tema di conservazione digitale.


La nascita del modello OAIS

Il modello di riferimento per la conservazione a lungo termine di oggetti digitali, tra cui figurano anche i documenti digitali, è il modello Open Archival Information System, comunemente noto come modello OAIS.

La nascita di questo modello risale al 1982, quando venne istituito il Consultive Committee for Space Data System (CCSDS)[9]. Il CCSDS[10] è un comitato di “coordinamento tra le agenzie spaziali nazionali interessate allo sviluppo cooperativo di standard per la gestione dei dati relativi alla ricerca spaziale”[11]; tale comitato ha avviato dal 1990 una collaborazione con l’International Standard Organization (ISO)[12], con l’obiettivo di far riconoscere le proprie raccomandazioni come standard internazionali[13] proprio dall’organizzazione che più di ogni altra si occupa di elaborare e approvare standard sui temi più disparati, e di diffonderli poi su larga scala dal momento che i Paesi membri[14] sono centosessantacinque.

In tale contesto di collaborazione, l’ISO ha chiesto al CCSDS di lavorare a uno standard pensato per la sola conservazione dei dati digitali generati dalle osservazioni geospaziali[15]. Immediatamente, però, il CCSDS si accorse che non vi era alcuna base da cui partire per l’elaborazione dello standard: mancavano la descrizione delle funzioni, la definizione degli attributi degli oggetti informativi da conservare, una consapevolezza dei bisogni e dei requisiti necessari a un sistema di conservazione dei dati digitali[16]. Per questo motivo, il CCSDS dovette lavorare a uno standard partendo da zero, e nel 1995 organizzò un seminario internazionale per sviluppare “un modello di riferimento per un sistema informativo aperto per l’archiviazione”[17].

Il modello di riferimento che venne fuori dal seminario fu sviluppato utilizzando una terminologia neutra, non propria cioè di un settore specifico, e presto ci si accorse che la sua portata poteva andare ben oltre l’ambito limitato dei dati della ricerca spaziale. L’obiettivo fu dunque allargato alla gestione e alla conservazione di ogni tipo di risorsa digitale[18]. Su queste basi, nel 1997 arrivò la prima bozza dello standard, mentre nel 2003 ci fu l’approvazione definitiva come standard ISO con il nome di ISO 14721:2003[19].


I principi e l’ambiente di OAIS

ISO 14721 si fonda su alcuni principi fondamentali che caratterizzano il modello OAIS. Sarà bene partire dalla definizione che si fa di sistema informativo aperto per l’archiviazione (appunto, OAIS): “un archivio, inteso come struttura organizzata di persone e sistemi, che accetti la responsabilità di conservare l’informazione e renderla disponibile per una comunità di riferimento”[20].

Anzitutto, quindi, vi è la conservazione dell’informazione, che deve essere a lungo termine. Tale dicitura, che sarebbe aleatoria, è legata all’obsolescenza tecnologica, e quindi riguarda un arco temporale sufficientemente ampio da includere al suo interno cambiamenti, anche rilevanti, nelle tecnologie[21], così come negli interessi e nelle conoscenze della comunità di riferimento. Proprio la comunità di riferimento è l’altro grande tema di OAIS. Non essendo stato pensato per un dominio specifico, il modello può essere adattabile alla comunità di cui ci si occupa, sia utilizzando una terminologia di settore, ma anche studiando in modo preliminare le esigenze specifiche dei potenziali utenti[22]. Rivolgendosi a una comunità specifica individuata, i contenuti presenti nell’archivio digitale devono essere autonomamente intellegibili dagli utenti membri della specifica comunità, e ciò comporta che le risorse debbano essere corredate delle informazioni necessarie che ne consentano l’identificazione univoca e la loro consultazione[23].

Detto ciò, per comprendere il funzionamento del modello OAIS si devono conoscere le entità che vi intervengono. Anzitutto, vi sono tre soggetti fondamentali per il corretto funzionamento del deposito: il produttore, l’utente e il responsabile. Il produttore deposita gli oggetti digitali da conservare secondo i termini stabiliti in un accordo formale (detto submission agreement), che fissa in particolare quali debbano essere le informazioni che accompagnano l’oggetto digitale al momento del trasferimento presso il deposito OAIS, così come le modalità del trasferimento stesso.[24] Il responsabile si occupa “delle politiche complessive di un OAIS e ne determina l’ambito di sviluppo e le competenze”[25]. I suoi compiti principali, dunque, riguardano la pianificazione strategica, la ricerca delle necessarie risorse finanziare, la definizione dell’ambito degli oggetti da conservare, ma può anche assumere il ruolo di supervisore; tale figura, però, non si occupa delle attività di gestione e di amministrazione ordinaria e quotidiana del deposito[26]. Degli utenti si è già parlato in relazione alla comunità di riferimento. D’altro canto, è bene ribadire che la conoscenza della comunità di riferimento è un elemento fondamentale per una gestione corretta e utile del deposito, e per fare in modo che i suoi membri possano effettivamente usare in modo autonomo le risorse digitali conservate[27].

Ambiente del modello OAIS. Fonte: Mathieualexhache (originale); Mess/Wikimedia Commons


Gli oggetti informativi e i pacchetti

Il nucleo centrale del modello OAIS è costituito dall’oggetto informativo (information object) che viene conservato nel deposito[28]. Esso si compone di due elementi: i dati, che prendono la forma di sequenza di bit (data object); le informazioni, che rappresentano tali dati e che sono necessarie per interpretarli (representation information)[29]. E dunque, le informazioni associate ai dati sono metadati[30]. A un singolo oggetto può essere associata una sola informazione, o molte; non solo: i metadati stessi possono richiedere ulteriori informazioni esplicative, creando così una sorta di sistema concentrico attorno all’oggetto digitale da conservare, sistema che termina quando si raggiunge il livello autosufficiente di comprensibilità per la comunità di riferimento[31]. Le informazioni da includere sempre sono quelle di struttura e semantiche: le prime (structure information) sono dedicate soprattutto alle specifiche del formato elettronico, mentre le seconde (semantic information) riguardano il significato dei termini utilizzati; ci sono poi altre informazioni di rappresentazione, ovvero tutte quelle che non sono né strutturali né semantiche[32].

A essere fondamentali sono soprattutto le informazioni sulla conservazione (preservation description information – PDI). Esse includono le informazioni che consentono l’identificazione univoca della risorsa, le informazioni sulla provenienza che documentano la storia della risorsa e le sue trasformazioni, le informazioni sul contesto di produzione del contenuto dell’oggetto digitale, e le informazioni di integrità, le quali riportano i meccanismi per verificare che le informazioni non siano state manomesse o alterate in alcun modo[33]. Ci sono poi le informazioni sui diritti di accesso, sui limiti previsti all’accesso degli oggetti digitali[34].

Le PDI compongono, insieme al contenuto informativo (content information, rappresenta l’oggetto sottoposto al processo di conservazione) il pacchetto informativo[35] (information package), che è un altro degli elementi fondamentali del modello OAIS. È dunque il pacchetto informativo a essere conservato, e non solo l’oggetto digitale, dal momento che, senza le informazioni necessarie alla conservazione, sarebbe impossibile rendere disponibile, integro e autentico il documento per un lungo periodo di tempo.

Schematizzazione del pacchetto informativo OAIS. Fonte: Mess/Wikimedia Commons

I pacchetti informativi possono essere divisi in tre categorie, a seconda della fase di gestione. Il primo pacchetto informativo che si incontra è il pacchetto di versamento (submission information package – SIP). Il suddetto viene predisposto dal soggetto produttore dell’oggetto digitale e viene gestito in fase di acquisizione[36]; è fondamentale, come visto, che ci sia un accordo tra il deposito OAIS e i vari soggetti produttori che versano il proprio materiale, accordo che regoli sia le modalità di versamento che le informazioni da inserire all’interno del pacchetto[37]. I SIP sono analizzati dal deposito, verificando che ci siano tutte le informazioni necessarie[38], e vengono quindi trasformati in pacchetti di archiviazione (archival information package – AIP). I pacchetti di archiviazione aggregano quattro tipi di oggetti informativi: due sono quelli che compongono anche i SIP, e cioè il contenuto e le PDI. Vi sono poi, all’interno degli AIP, le informazioni di impacchettamento (packaging information) e le informazioni descrittive (decriptive information), che hanno la funzione di sostenere l’accesso al contenuto informativo consentendo, con i giusti strumenti, la ricerca e il recupero[39]. I pacchetti conservati all’interno del deposito OAIS a lungo termine possono essere di due tipi: larchival information unit (AIU), che è un singolo AIP; l’archival information collection (AIC), che risulta invece composto da vari AIP legati tra loro, e che è molto utile, in campo archivistico, per rappresentare un fascicolo o un’altra aggregazione documentaria[40]. L’ultima tipologia è rappresentata dal pacchetto di distribuzione (dissemination information package – DIP), il quale viene trasferito all’utente che ne ha fatto richiesta di accesso[41].


Le funzioni del modello OAIS

Sui pacchetti informativi di ogni tipo si esercitano le funzioni previste dal modello OAIS. Lo standard, in realtà, approfondisce solo le funzioni relative ai pacchetti di archiviazione, considerata la loro grande importanza nei processi conservativi a lungo termine degli oggetti digitali[42]. Le funzioni sono “descritte in termini di flusso e di responsabilità dato che le caratteristiche peculiari di ciascuna vanno stabilite nella fase di concreta implementazione del modello”[43].

La prima funzione è quella dell’acquisizione (ingest). La suddetta si concretizza, come suggerisce il nome, nell’acquisizione dei pacchetti di versamento trasferiti dal soggetto produttore al deposito, e nella loro preparazione per l’archiviazione[44]. La funzione di acquisizione ha una serie di fasi (o sotto-funzioni) e, in particolar modo: la presa in carico delle risorse versate; il controllo del materiale ricevuto con attenzione alle informazioni presenti; gli interventi per rendere gli oggetti digitali arrivati compatibili con il modello OAIS e, quindi, gestibili dal deposito; la generazione dei metadati finalizzati alla ricerca e al recupero delle risorse; il trasferimento del pacchetto al sistema di archiviazione[45].

La seconda funzione è quella di archiviazione (archival storage). È la funzione che consente “la memorizzazione, la tenuta e il recupero delle risorse già elaborate nella fase di acquisizione”[46]. Tra le attività svolte dal deposito, in questa fase, si annoverano la sostituzione periodica dei supporti, il controllo degli errori e la verifica dell’integrità delle risorse digitali, la prevenzione dei danni in caso di disastro mediante la creazione di un back-up delle risorse da conservare in altro luogo, e la capacità di recupero dopo un disastro (disaster recovery), la fornitura delle copie delle risorse a seguito di richieste di accesso[47].

Vi è poi la funzione di gestione dei dati (data management), particolarmente importante per il funzionamento stesso di un deposito OAIS. Difatti, è grazie al data management che si gestisce e si controlla il database contenente sia i metadati descrittivi (che consentono l’identificazione e la ricerca delle risorse digitali conservati), sia quelli concernenti l’amministrazione interna del deposito[48].

Dal momento che la conservazione di oggetti digitali non si può improvvisare, è fondamentale anche la funzione della pianificazione della conservazione (preservation planning). Con essa si pianificano le strategie che guidano la conservazione delle risorse, si programmano le attività di monitoraggio[49], ma si controlla anche periodicamente la comunità di riferimento, sia per assicurarsi che i risultati del deposito siano effettivamente coerenti con le aspettative degli utenti[50], sia per valutare eventuali cambiamenti all’interno della comunità, e poter quindi adattare l’attività del deposito alle nuove esigenze[51]. Inoltre, nella pianificazione della conservazione si controllano anche le tecnologie, con l’obiettivo di monitorare lo stato di obsolescenza tecnologica degli applicativi in uso e si sviluppano i piani di migrazione[52] delle risorse[53].

Alla fine del processo, si trova l’ultima funzione di un deposito costruito secondo il modello OAIS, ovvero quella di accesso (access). Tale funzione consente agli utenti di trovare le informazioni sulle risorse conservate e di richiederne una copia per la consultazione, la quale è corredata di tutti i metadati utili, e che è prodotta nei modi adatti a garantirne una corretta rappresentazione[54].

Infine, vi è un’ulteriore funzione prevista dal modello OAIS, quella dell’amministrazione (administration), responsabile della gestione quotidiana e ordinaria del deposito, sia della gestione delle interazioni tra deposito, produttori e utenti che del coordinamento delle attività delle altre funzioni precedentemente analizzate[55].


Conclusioni

Il modello OAIS ha molto influenzato le iniziative di conservazione delle risorse digitali che sono state implementate nel corso degli anni sia in Italia che a livello internazionale, e ha anche stimolato una serie di studi e progetti che si sono occupati di definire, in modo più preciso e conformemente con OAIS, alcuni aspetti[56]. Su tutti, si ricorda lo standard Premis[57], che ha l’obiettivo di “identificare le informazioni necessarie ai depositi digitali […] per la conservazione degli oggetti digitali di qualunque tipologia”[58], occupandosi dunque dei metadati, i quali, come detto, costituiscono un aspetto fondamentale della conservazione digitale a lungo termine.

Relativamente all’Italia, il modello OAIS è stato individuato come standard di riferimento per la conservazione degli archivi digitali dalla normativa, con le regole tecniche del 2013[59],  che hanno anche introdotto la figura dei conservatori accreditati[60]. L’Agenzia per l’Italia Digitale[61] si è occupata dell’accreditamento delle strutture conservative che ne fanno richiesta fino al 2021 – quando le Linee Guida AgID sul documento informatico hanno eliminato l’accreditamento dei conservatori. Questi dovevano dimostrare di: essere affidabili dal punto di vista organizzativo, tecnico e finanziario; avere un personale qualificato e competente; usare procedure e metodi di gestione adeguati; utilizzare sistemi affidabili di conservazione conformi agli standard e alla normativa, in particolar modo alle disposizioni del Codice dell’amministrazione digitale[62];  adottare le misure necessarie soprattutto a garantire l’integrità, l’autenticità, l’affidabilità e la fruibilità dei documenti nel tempo[63].

La situazione più preoccupante è quella relativa ai documenti statali. Gli uffici centrali e periferici dello Stato, difatti, devono versare dopo trent’anni dalla chiusura dell’affare i propri documenti all’Archivio Centrale dello Stato o all’Archivio di Stato competente per territorio[64], e ciò vale anche per i documenti informatici[65]. A questo punto ci si deve porre una domanda fondamentale: gli Archivi di Stato sono pronti a conservare le ingenti masse di documenti informatici che saranno versate dai vari uffici, dal momento che si è oramai arrivati alla soglia dei trenta anni da quando la Pubblica Amministrazione ha cominciato a produrre documenti digitali?

Anche l’esito della documentazione degli uffici pubblici non statali è altrettanto preoccupante. Però, in questo caso la situazione è variabile, a seconda della regione presa in considerazione. Molte regioni, difatti, hanno fatto avviare iniziative più o meno importanti per la conservazione a lungo termine dei documenti digitali; a dimostrazione di ciò, si può segnalare che le regioni accreditate dall’AgID come “conservatori” sono tre: Toscana, Marche, Emilia-Romagna[66].

È certo, però, che il nodo della conservazione a lungo termine dei documenti digitali è oramai giunto al pettine, e va affrontato subito, senza più rinviare, pena il rischio di perdere ingenti masse di patrimonio documentario. I fondi destinati a questo fine dal PNRR sono un primo importante passo, ma non definitivo. Non resta che aspettare gli sviluppi futuri, auspicando che si possano trovare rapidamente soluzioni per una situazione che al momento, pur se ancora recuperabile, non può essere considerata del tutto positiva.

Emanuele Del Ferraro per www.policlic.it


Riferimenti bibliografici

[1] Piano Nazionale di Ripresa e di Resilienza, p. 83 (Ultima consultazione 20-08-2021).

[2] Ibidem.

[3] Ivi, pp. 41 e 106.

[4] Ivi, p. 68.

[5] Ivi, p. 106.

[6] Ivi, p. 230.

[7] Ivi, p. 250.

[8] Determina a contrarre n. 118/A/2021 (Ultima consultazione 6-2-2022).

[9] G. Michetti, Il modello OAIS, in “Digitalia: Rivista del digitale nei beni culturali”, I (2008), p. 34 (Ultima consultazione 28-08-2021).

[10] Qui il sito ufficiale https://public.ccsds.org/default.aspx (Ultima consultazione 24-08-2021).

[11] B. F. Lavoie, Il modello di riferimento per un Sistema informativo aperto per l’archiviazione, p. 2.

[12] Qui il sito ufficiale https://www.iso.org/home.html (Ultima consultazione 24-08-2021).

[13] G. Michetti, op. cit., p. 35.

[14] https://www.iso.org/members.html (Ultima consultazione 24-08-2021).

[15] G. Michetti, op. cit., p. 35.

[16] B. F. Lavoie, op. cit,, p. 3.

[17] Ibidem.

[18] Ivi, p. 4.

[19] G. Michetti, op. cit., p. 35.

[20] Ibidem.

[21] S. Pigliapoco, Progetto archivio digitale: Metodologia Sistemi Professionalità, Civita Editoriale, Lucca 2018, p. 151.

[22] Ibidem.

[23] M. Guercio, Conservare il digitale: Principi, metodi e procedure per la conservazione a lungo termine di documenti digitali, Laterza, Roma-Bari 2013, p. 59.

[24] G. Michetti, op. cit., p. 37.

[25] Ivi, pp. 37-38.

[26] B. F. Lavoie, op. cit., p. 8.

[27] Ivi, p. 10.

[28] S. Pigliapoco, op. cit., p. 152.

[29] M. Guercio, op. cit., p. 59.

[30] “Nell’ambito degli archivi digitali i metadati sono le informazioni di cui bisogna dotare il documento informatico per poterlo correttamente formare, gestire e conservare nel tempo”, https://www.archivibiblioteche.it/2019/04/07/che-cosa-sono-i-metadati/ (Ultima consultazione 27-08-2021).

[31] G. Michetti, op. cit., pp. 41-42.

[32] S. Pigliapoco, op. cit., p. 153.

[33] M. Guercio, op. cit., pp. 60-61.

[34] S. Pigliapoco, op. cit., p. 155.

[35] Ivi, p.154.

[36] G. Michetti, op. cit., p. 43.

[37] Ivi, p. 35.

[38] S. Pigliapoco, op. cit., p. 155.

[39] M. Guercio, op. cit., p. 62.

[40] S. Pigliapoco, op. cit., p. 157.

[41] M. Guercio, op. cit., p. 62.

[42] Ibidem.

[43] Ibidem.

[44] B. F. Lavoie, op. cit., p. 12.

[45] G. Michetti, op. cit., p. 39.

[46] Ibidem.

[47] Ivi, pp. 39-40; B. F. Lavoie, op. cit., p. 13.

[48] G. Michetti, op. cit., p. 40.

[49] M. Guercio, op. cit., p. 63.

[50] Ibidem.

[51] G. Michetti, op. cit., p. 40.

[52] La migrazione consiste in “attività che trasferiscano i dati da una piattaforma di elaborazione a un’altra, assicurando che gli utenti possano utilizzare gli oggetti digitali migrati anche nei nuovi ambienti tecnologici. Consiste nel processo di convertire una componente digitale da un formato originale in un nuovo formato facilmente accessibile senza bisogno di conservare il software e l’hardware”. M. Guercio, op. cit., p. 40.

[53] G. Michetti, op. cit., p. 40.

[54] Ibidem.

[55] B. F. Lavoie, op. cit., p. 15.

[56] M. Guercio, op. cit., p. 66.

[57] Per i vari documenti di Premis, si veda http://www.loc.gov/standards/premis/ (Ultima consultazione 28-08-2021).

[58] M. Guercio, op. cit., p. 78.

[59] Linee Guida sulla formazione, gestione e conservazione dei documenti informatici, maggio 2021(Ultima consultazione 06-02-2021).

[60] S. Pigliapoco, op. cit., p. 168.

[61] Qui il sito: https://www.agid.gov.it/ (Ultima consultazione 29-08-2021).

[62] D. l. 7 marzo 2005, n. 82 e successive modifiche, Codice dell’amministrazione digitale, (Ultima consultazione 28-08-2021).

[63] Requisiti per l’erogazione del servizio di conservazione per conto delle Pubbliche Amministrazioni, Allegato A al Regolamento sui criteri per la fornitura dei servizi di conservazione dei documenti informatici, 2021 (Ultima consultazione 06-02-2022).

[64] Il sistema archivistico italiano è caratterizzato dal policentrismo conservativo. I documenti prodotti dagli uffici centrali dello Stato sono conservati presso l’Archivio Centrale dello Stato (con l’eccezione dei documenti del Ministero degli Esteri, della Presidenza della Repubblica, del Parlamento, della Corte Costituzionale e degli uffici tecnici degli Stati maggiori del Ministero della Difesa, che conservano presso sé stessi la loro documentazione storica), mentre quelli degli uffici periferici dello Stato vengono versati all’Archivio di Stato competente per territorio (ce ne è uno a provincia, con sede nel capoluogo, più alcune Sezioni di Archivio di Stato); i documenti degli altri enti pubblici territoriali e non sono conservati presso gli enti stessi, che istituiscono una sezione separata di archivio storico; su questi ultimi il Ministero della Cultura vigila tramite le Soprintendenze Archivistiche e Bibliografiche regionali. Per un approfondimento si veda L. Giuva, Gli archivi storici in Italia: la mappa della conservazione, in L. Giuva e M. Guercio, Archivistica: teorie, metodi e pratiche, Carocci, Roma 2014.

[65] S. Pigliapoco, op. cit., p. 97.

[66] https://www.agid.gov.it/it/piattaforme/conservazione/conservatori-accreditati (Ultima consultazione 28-08-2021).

Gli spettacoli di caccia nell’antica Roma

Gli spettacoli di caccia nell’antica Roma

Fra gli spettacoli che nell’antica Roma ottennero maggiore diffusione e apprezzamento si annoverano le venationes, ovvero le “cacce”, anche se al riguardo le fonti letterarie sono discordanti: il termine venatio, infatti, indica...

Il giurista del Regime

Il giurista del Regime

3 gennaio 1925 Il 3 gennaio 1925, l’allora Presidente del Consiglio dei ministri Benito Mussolini pronunciò alla Camera dei deputati uno dei suoi discorsi[1] più celebri e importanti. Con tale discorso Mussolini sancì la fine dello Stato...