Controllo di integrità file del Repository Documentale

Da wiki.maggioli.it.
Versione del 21 dic 2009 alle 10:41 di imported>Root (→‎Possibili problemi)
Jump to navigation Jump to search

La maschera di controllo integrità permette di effettuare una verifica di consistenza tra i dati presenti nel database e i file presenti nel file system.

Come e' strutturata una libreria di repository

Ogni libreria di repository è composta da due elementi principali: la tabella di definizione dei documenti, presente nel database e la cartella dei file fisici dei documenti presente nel file system. Si noti che la certella dei file fisici è una cartella con un percorso relativo al server applicativo e non al client che si sta utilizzando. Infatti l'accesso ai file fisici viene sempre mediato dal server applicativo, che preleva i file per inviarli al client oppure riceve i nuovi file dal client e li scrive nel file system. Il client non ha mai accesso diretto al file fisico.

La definizione dei documenti, presente nel database, contiene informazioni sul nome e la descrizione del documento, sugli attributi di creazione, sui metadati associati, sui documenti correlati, sui diritti di accesso e via dicendo. In sostanza tutte le informazioni "satellite" associate al documento sono presenti nel database. Il file vero e proprio del documento invece è memorizzato fuori dal database, per questioni di performance legate all'archivio.

Il driver di repository si prende carico di mantenere allineate le informazioni presenti nel database e i file presenti nel file system. E' tuttavia possibile, a causa di molteplici motivi (principalmente legati a problemi di amministrazione) che le informazioni presenti nel database e i file presenti nel file system vengano disallineati.

Questa funzione ha lo scopo di controllare la consistenza delle informazioni e, se possibile, di effettuare delle operazioni per riportare le informazioni ad uno stato consistente.

Tipi di analisi

Sono presenti due modalità di analisi dei problemi: La modalità di analisi semplificata e la modalità di analisi completa.

Analisi semplificata

L'analisi semplificata rileva eventuali problemi e li riporta a video. Se l'analisi semplificata non riporta problemi allora la libreria è consistente. Nel caso di problemi l'analisi semplificata non è in grado di suggerire correzioni.

Analisi completa

L'analisi completa rileva la stessa tipologia di problemi dell'analisi semplificata. La differenza sta nel fatto che in caso di problemi l'analisi completa potrebbe suggerire delle operazioni di correzione mentre nel caso precedente questo non accade.

Quale tipo di analisi utilizzare?

E' necessario capire un concetto fondamentale: entrambe le modalità di analisi trovano gli stessi problemi, se esistono problemi. Non è quindi opportuno lanciare sempre l'analisi completa "perchè non si sa mai". La modalità completa richiede una quantità di risorse enormemente maggiore rispetto alla modalità semplificata e non sempre questo "sfondare la porta con un carroarmato" e' necessario.

Dove sta la differenza tra modalità semplificata e completa? La differenza è solamente la seguente: Se ci sono dei problemi di disallineamento, la modalità semplificata si limita a segnalare il problema mentre la completa segnala anche possibili soluzioni.

Quindi: Se si vuole effettuare un semplice controllo che vada tutto bene, si suggerisce di usare la modalità semplificata. Solo in caso di problemi si suggerisce di approfondire!

Successivamente vengono elencati tutti i possibili problemi rilevati dalla procedura. Inoltre viene indicato anche se il problema è risolvibile tramite l'analisi completa o meno.

Possibili problemi

Per semplicità espositiva chiameremo documento l'informazione presente nel database e file l'informazione presente nel file system. Quindi ad ogni documento corrisponde un file. Quando un documento è stato memorizzato tenendo traccia delle versioni, è possibile che ad ogni documento corrispondano uno o più file (il file corrente e le vecchie versioni).

Il file non e' presente nel database e non e' recuperabile

E' stato trovato un file che non ha corrispondenza nel database. Questo questo accade, il sistema cerca informazioni di recupero in un file satellite che normalmente è presente nella stessa cartella del file principale. Questo file satellite contiene un insieme di informazioni di base che permettono di reinserire alcune informazioni (non tutte) nel database e quindi di ricollegare il file al sistema. Vengono recuperate informazioni quali nome del file e descrizione, ma non vengono recuperate informazioni relative ai metadati oppure ai permessi di accesso. Se il file di recuper non viene trovato, si verifica questo problema.

Il file non e' presente nel database ma e' recuperabile parzialmente

Si è verificata una situazione simile alla precedente, solo che in questo caso il file di recupero è stato trovato e quindi si può procedere alla ricostruzione delle informazioni sul database.

Non e' stato possibile recuperare il file a causa di problemi nel file di recupero

(e' stato modificato a mano? Problemi di formato UNICODE?)

Il documento non punta ad alcun file

Il documento punta ad un file inesistente e non esistono altri file compatibili

Il documento punta ad un file inesistente, ma un altro file ha la stessa firma

Il documento punta ad un file con firma non coincidente

Un documento condivide il file con altri documenti

Il file viene utilizzato da un'altra libreria