Glossario

Molti termini del presente glossario riprendono, riadattandole, definizioni riportate nei documenti di cui alla sezione “Bibliografia e Standard”, dando precedenza, laddove possibile, alle definizioni riportate negli standard internazionali. I termini necessari per discutere di DP e PCA sono molti: in questa sezione sono presenti solo quelli più tecnici, riportati nel rapporto, al fine di chiarirne l’accezione con cui sono stati usati. I termini seguono una successione logica, per cui non sono ordinati alfabeticamente.

Conservazione a lungo termine (Digital Preservation o DP o Long term preservation). Gli atti (i processi e le procedure) necessari per mantenere le informazioni in un formato comprensibile nel lungo termine, ossia un periodo di tempo tanto lungo quanto è necessario perché ci si trovi nelle condizioni di dover superare problemi derivanti dai limiti di storage, dai fallimenti dei media o dai cambiamenti tecnologici. La DP non è ad esclusivo vantaggio delle biblioteche che sottoscrivono contenuti a pagamento quanto un’attività a vantaggio della società nel suo insieme, poiché tende ad assicurare che il materiale digitale continui ad essere accessibile alle future generazioni.

Accesso perpetuo (o Post cancellation access PCA o Post termination access PTA, o perpetual access). Il diritto di un sottoscrittore e dei suoi utenti ad avere l’accesso permanente ai materiali elettronici per i quali si è pagato. Il PCA entra in gioco quando una biblioteca ha necessità di tutelare se stessa e i propri utenti per mantenere l’accesso ai contenuti pagati e per i quali ha negoziato un diritto di accesso perpetuo come nel modello analogico.

Deposito Legale Digitale (o Digital Legal Deposit o DLD). Il Deposito legale è una importante invenzione legislativa che accompagna l’età moderna dal XVI secolo e consiste nell’obbligo (in Italia in capo agli stampatori) di consegnare una copia (in Italia più copie) del materiale pubblicato nella nazione di riferimento (nel nostro caso l’Italia) alla Biblioteca Nazionale. Il Deposito legale ha sostanzialmente due finalità: conservare l’eredità culturale di un paese; consentire a tutti i cittadini di avere accesso ai documenti quale base fondamentale per esercitare i diritti di cittadinanza. Con la rivoluzione dell’editoria elettronica distribuita via web questo importante istituto richiede interventi legislativi e innovazioni organizzative e tecniche. Solitamente i materiali pubblicati in edizione elettronica devono essere consegnati alla Biblioteca Nazionale e l’accesso deve essere consentito ai cittadini usando apposite macchine ubicate in edifici dedicati della Biblioteca Nazionale. In Italia il deposito legale digitale è disciplinato dal D.P.R. 252/2006 e ha nella Biblioteca Nazionale Centrale di Firenze l’attore impegnato in prima linea. Ogni altra informazione è disponibile alla URL: <http://www.depositolegale.it/ >.

Long term. Un periodo di tempo lungo abbastanza per cui si incorre nella necessità di far fronte all’impatto di cambiamenti nelle tecnologie (incluso il supporto per nuovi media e formato di dati), oppure al cambio della comunità degli utenti per fare in modo che le informazioni in archivio digitale continuino ad essere accessibili.

Trigger event. Questo termine è usato di norma per determinare i casi al verificarsi dei quali si rende necessario attivare l’accesso sull’archivio digitale. I trigger event sono riconducibili a casi dipendenti a) dall’editore o b) dal sottoscrittore.

    • a) Nel primo caso, sulla base dell’esperienza maturata fino ad oggi, si possono verificare quattro tipologie di casi:
        • 1) un editore ha deciso di non continuare più la sua attività economica;
        • 2) il singolo particolare contenuto non è più reso disponibile;
        • 3) i back files di un contenuto corrente (anche ad esempio i contenuti pubblicati sotto un altro titolo o dentro una diversa collection) non sono più resi disponibili per ragioni commerciali o tecniche (si pensi alle risorse che mettono a disposizione le ultime 10 annate di un periodico: ogni anno se ne perderebbe una);
        • 4) una continuata e permanente impossibilità e incapacità dell’editore di ripristinare l’accesso alla piattaforma editoriale.
  • b) I casi dipendenti dal sottoscrittore sono due:
      • 1) quando per ragioni economiche o di altro tipo il sottoscrittore decide di non rinnovare i suoi abbonamenti;
      • 2) oppure quando le sottoscrizioni sono state rinnovate, ma in generale il sottoscrittore ritiene importante – nell’ipotesi che possa sempre accadere un evento nuovo causa di un disservizio agli utenti – mantenere un accesso alternativo e concorrente ai contenuti per i quali ha acquisito un diritto di accesso perpetuo, offrendo ai propri utenti l’accesso alternativo sui server dell’archivio digitale. I trigger event devono essere identificati e disciplinati in modo chiaro e rigoroso nei testi contrattuali con i titolari dei diritti, per chiarire quando l’accesso all’Archivio Digitale è consentito.

Archivio Digitale (Digital Archive o Digital Repository). Un’organizzazione che intende conservare le informazioni digitali per l’accesso e l’uso da parte di un Comunità Designata. Ai fini del tipo di archivi trattati nel presente report si possono distinguere almeno tre differenti tipi di Archivio Digitale in base ai trigger event che determinano l’attivazione dell’accesso sui server dell’Archivio digitale.

  • Dark Archive. Un Archivio digitale che non è accessibile al pubblico se non quando i contenuti conservati nell’archivio sono soggetti ad uno dei Trigger Event dipendenti dall’editore. I contenuti soggetti a Trigger Event vengono allora resi accessibili alla Comunità Designata secondo determinate regole. Un Dark Archive serve per la conservazione a lungo termine. CLOCKSS, Rede Cariniana e Portico sono un esempio di Dark Archive.
  • Dim Archive. Un Archivio digitale che dà l’accesso ai contenuti sottoscritti al verificarsi dei Trigger Event dipendenti dall’editore o dal sottoscrittore, limitatamente al caso b1). Un Dim Archive serve sia per la DP ma soprattutto per il PCA, e ha la caratteristica di fornire un accesso ai contenuti sottoscritti nel momento in cui non si rinnova l’abbonamento e non si vuole più pagare l’editore per avere l’accesso sui suoi server. Ne sono un esempio Global LOCKSS Network e Portico (limitatamente a quegli editori che hanno firmato con Portico un accordo che preveda anche il PCA).
  • Light Archive. Il Dim Archive diventa Light Archive quando si attiva, oltre che nei casi del Dim Archive, anche nel caso b2) ossia quando l’archivio offre un accesso alternativo concorrente sempre funzionante, ossia quando il Dim Archive offre sempre agli utenti autorizzati un accesso alternativo e concorrente rispetto all’accesso sul sito degli editori, anche in presenza di un abbonamento corrente e con una piattaforma editoriale perfettamente funzionante. Questo è il caso di Scholars Portal; era il caso di SDOS ed Emeroteca Virtuale.

Comunità Designata (o Comunità di riferimento o Designated Community). Un identificato gruppo di utenti potenziali che dovrebbero essere in grado di comprendere un determinato set di informazioni e che è servito dall’Archivio digitale. La Comunità Designata può essere composta da una pluralità di comunità utenti che si uniscono a formare la Comunità Designata servita dall’Archivio in generale.

Archivio OAIS (OAIS Archive). Acronimo che sta per Open Archival Information System. Si tratta di uno Standard ISO nella sua seconda edizione (ISO 14721:2012; prima edizione del 2003) sviluppato dal Consultative Committee for Space data Systems per l’acquisizione, la conservazione, la diffusione dei contenuti digitali. Un Archivio OAIS è un’organizzazione di persone e sistemi che ha accettato la responsabilità di conservare le informazioni e di renderle disponibili per una Comunità Designata seguendo il modello logico-funzionale delineato dallo standard. In particolare un Archivio OAIS deve far fronte alle responsabilità definite nella sezione 3.1 dello standard ISO 14721:2012.

Archivio digitale affidabile (Trustworthy Digital Repository). Un archivio digitale affidabile è un archivio che ha conseguito la certificazione di affidabilità rilasciata da un ente abilitato (standard ISO sugli enti certificatori, ISO 16919:2014) utilizzando lo standard ISO 16363:2012. Questo standard si basa sul documento TRAC pubblicato da RLG e NARA nel 2003, oggi mantenuto da una task force internazionale. L’ultima edizione di TRAC ha il copyright di CRL e OCLC. CRL si sta accreditando (soprattutto in USA) come ente certificatore di fatto usando TRAC.

Accordo per la consegna dei dati e dei metadati (Submission Agreement). L’accordo tra l’Archivio digitale e l’editore che disciplina le modalità di consegna dei metadati e dei contenuti. L’accordo può riflettere diverse modalità.

Archivio con approccio harvesting. Si tratta di un Archivio che conserva i contenuti così come sono pubblicati sulla piattaforma dell’editore (“look and feel”). La tecnologia LOCKSS adotta questo approccio utilizzando due modalità: facendo l’harvesting dei metadati e dei contenuti direttamente dal sito dell’editore; oppure facendosi consegnare dall’editore i source files del suo sito web mediante FTP.

Archivio con un approccio di normalizzazione o di standardizzazione. L’archivio normalizza i datafeeds che riceve dall’editore e li ripubblica nell’archivio medesimo. È l’approccio seguito ad esempio da Portico.

Migrazione. Il processo di conversione di un file da un formato diventato (o a rischio di diventare) obsoleto ad un altro formato in uso corrente (non obsoleto). La migrazione può essere realizzata in diversi modi: Portico e LOCKSS ad esempio effettuano le migrazioni di formato in modi differenti.

Emulazione. Una soluzione che ricostruisce l’ambiente software (e talvolta anche hardware) che rende possibile la rappresentazione delle informazioni che si trovano in un formato obsoleto.

Conservazione digitale distribuita (Distributed Digital Preservation DDP). Il processo di creare copie di file digitali e di conservazione degli stessi in ubicazioni distribuite geograficamente per i propositi della conservazione a lungo termine. Le best practice in DDP sono:

        • I luoghi di conservazione (siti) non devono trovarsi in un raggio di azione compreso tra 120-200 km l’uno dall’altro:
        • I siti devono essere distribuiti in aree geografiche al di fuori dei conosciuti percorsi interessati da disastri naturali (alluvioni, terremoti, uragani, tornado, ecc);
        • I siti devono essere distribuiti in luoghi serviti da differenti reti elettriche;
        • I siti devono essere sotto il controllo di differenti system administrator;
        • I contenuti conservati nei siti distribuiti devono essere in linea e devono essere controllati regolarmente  per bit-rot e da ogni altro punto di vista tecnico.
        • I siti di conservazione devono essere come minimo tre, scelti secondo le specifiche di cui ai punti precedenti.

Backup. Il processo di backup serve per realizzare copie di dati che possono essere usati per il ripristino dei file originali persi a causa del verificarsi di un evento. Il backup dei contenuti dei server è una procedura standard usata da molto tempo nelle pratiche di amministrazione dei sistemi. Il backup semplice tuttavia non è sufficiente per accreditare un Archivio Digitale come OAIS compliant e certificato secondo lo standard ISO 16363:2012. Ad esempio è sempre necessario il coinvolgimento di un altro ente a cui affidare copie dell’archivio (siano esse online che offline).

Local Hosting (o LH o Local Loading o LL). Il Local Loading è la copia in locale dei metadati e dei contenuti per i quali è stato acquisito un diritto di accesso perpetuo. Il local loading può essere fatto da una singola istituzione (ad esempio quanto fa la Techinical University of Denmark, cfr. Charles Beagrie, Consultancy report…, p. 12) o da più istituzioni associate (ad esempio i servizi SDOS ed Emeroteca Virtuale).

National Hosting (o NH). Il National Hosting è una forma di Local Loading ma con una rilevanza nazionale, ossia un archivio digitale ai cui servizi, soprattutto di PCA, possono rivolgersi le organizzazioni di una determinata nazione. Il progetto francese ISTEX è una forma di National Hosting; il progetto britannico SafeNet lavora in una prospettiva di National Hosting; Scholars Portal è una forma di Local Hosting che evolverà in National Hosting una volta raggiunto un accordo tra OCUL e CRKN.

Text Mining e Data Mining (o TDM). Il TDM è un processo di ricerca che, attraverso l’uso di software dedicati e di tecniche di analisi e di estrazione di contenuti e di dati, è in grado di ricombinare le informazioni permettendo di dentificare nuovi modelli, ipotesi, tendenze, creando nuova conoscenza. Se per esempio ci si riferisce ai periodici e ai libri elettronici, è importante che la ricerca venga effettuata su una gran quantità di documenti a testo completo, pubblicati da diversi editori, incrociando diversi campi. Queste attività stanno assumendo un’importanza crescente per i ricercatori. In base a questa definizione si comprende come gli Archivi Digitali per la DP, per il PCA, per il DLD, curando la conservazione a testo completo di diverse migliaia di documenti editi da diversi editori, si prestano a fungere come base documentale su cui applicare tool di TDM. La posizione dei diversi archivi oggetto dell’indagine è differente e per i dettagli si rimanda al contenuto del rapporto.