Differenze tra le versioni di "Controllo di integrità file del Repository Documentale"

Da wiki.maggioli.it.
Jump to navigation Jump to search
imported>Root
imported>Root
Riga 2: Riga 2:


==Come e' strutturata una libreria di repository==
==Come e' strutturata una libreria di repository==
Ogni libreria di repository è composta da due elementi principali: la tabella di definizione dei documenti, presente nel database e la cartella dei file fisici dei documenti.
Ogni libreria di repository è composta da due elementi principali: la tabella di definizione dei documenti, presente nel database e la cartella dei file fisici dei documenti presente nel file system. Si noti che la certella dei file fisici è una cartella con un percorso relativo al server applicativo e non al client che si sta utilizzando. Infatti l'accesso ai file fisici viene sempre mediato dal server applicativo, che preleva i file per inviarli al client oppure riceve i nuovi file dal client e li scrive nel file system. Il client non ha '''mai''' accesso diretto al file fisico.


La definizione dei documenti, presente nel database, contiene informazioni sul nome e la descrizione del documento, sugli attributi di creazione, sui metadati associati, sui documenti correlati, sui diritti di accesso e via dicendo. In sostanza tutte le informazioni "satellite" associate al documento sono presenti nel database. Il file vero e proprio del documento invece è memorizzato fuori dal database, per questioni di performance legate all'archivio.
La definizione dei documenti, presente nel database, contiene informazioni sul nome e la descrizione del documento, sugli attributi di creazione, sui metadati associati, sui documenti correlati, sui diritti di accesso e via dicendo. In sostanza tutte le informazioni "satellite" associate al documento sono presenti nel database. Il file vero e proprio del documento invece è memorizzato fuori dal database, per questioni di performance legate all'archivio.
Riga 22: Riga 22:


==Possibili problemi==
==Possibili problemi==
===E' presente un documento nel database ma il file ad esso collegato
Per semplicità espositiva chiameremo '''documento''' l'informazione presente nel database e '''file''' l'informazione presente nel file system. Quindi ad ogni documento corrisponde un file. Quando un documento è stato memorizzato tenendo traccia delle versioni, è possibile che ad ogni documento corrisponda uno o più file (il file corrente e le vecchie versioni).
 
===Un documento condivide il file con altri documenti===
 
===Non e' stato possibile recuperare il file a causa di problemi nel file di recupero===
(e' stato modificato a mano? Problemi di formato UNICODE?)
 
===Il file non e' presente nel database ma e' recuperabile parzialmente===
 
===Il file non e' presente nel database e non e' recuperabile===
 
===Il documento punta ad un file con firma non coincidente===
 
===Il documento non punta ad alcun file===
 
===Il documento punta ad un file inesistente, ma un altro file ha la stessa firma===
 
===Il documento punta ad un file inesistente e non esistono altri file compatibili===
 
===Il file viene utilizzato da un'altra libreria===

Versione delle 10:30, 21 dic 2009

La maschera di controllo integrità permette di effettuare una verifica di consistenza tra i dati presenti nel database e i file presenti nel file system.

Come e' strutturata una libreria di repository

Ogni libreria di repository è composta da due elementi principali: la tabella di definizione dei documenti, presente nel database e la cartella dei file fisici dei documenti presente nel file system. Si noti che la certella dei file fisici è una cartella con un percorso relativo al server applicativo e non al client che si sta utilizzando. Infatti l'accesso ai file fisici viene sempre mediato dal server applicativo, che preleva i file per inviarli al client oppure riceve i nuovi file dal client e li scrive nel file system. Il client non ha mai accesso diretto al file fisico.

La definizione dei documenti, presente nel database, contiene informazioni sul nome e la descrizione del documento, sugli attributi di creazione, sui metadati associati, sui documenti correlati, sui diritti di accesso e via dicendo. In sostanza tutte le informazioni "satellite" associate al documento sono presenti nel database. Il file vero e proprio del documento invece è memorizzato fuori dal database, per questioni di performance legate all'archivio.

Il driver di repository si prende carico di mantenere allineate le informazioni presenti nel database e i file presenti nel file system. E' tuttavia possibile, a causa di molteplici motivi (principalmente legati a problemi di amministrazione) che le informazioni presenti nel database e i file presenti nel file system vengano disallineati.

Questa funzione ha lo scopo di controllare la consistenza delle informazioni e, se possibile, di effettuare delle operazioni per riportare le informazioni ad uno stato consistente.

Tipi di analisi

Sono presenti due modalità di analisi dei problemi: La modalità di analisi semplificata e la modalità di analisi completa.

E' necessario capire un concetto fondamentale: entrambe le modalità di analisi trovano gli stessi problemi, se esistono problemi. Non è quindi opportuno lanciare sempre l'analisi completa "perchè non si sa mai". La modalità completa richiede una quantità di risorse enormemente maggiore rispetto alla modalità semplificata e non sempre questo "sfondare la porta con un carroarmato" e' necessario.

Dove sta la differenza tra modalità semplificata e completa? La differenza è solamente la seguente: Se ci sono dei problemi di disallineamento, la modalità semplificata si limita a segnalare il problema mentre la completa segnala anche possibili soluzioni.

Quindi: Se si vuole effettuare un semplice controllo che vada tutto bene, si suggerisce di usare la modalità semplificata. Solo in caso di problemi si suggerisce di approfondire!

Successivamente vengono elencati tutti i possibili problemi rilevati dalla procedura. Inoltre viene indicato anche se il problema è risolvibile tramite l'analisi completa o meno.

Possibili problemi

Per semplicità espositiva chiameremo documento l'informazione presente nel database e file l'informazione presente nel file system. Quindi ad ogni documento corrisponde un file. Quando un documento è stato memorizzato tenendo traccia delle versioni, è possibile che ad ogni documento corrisponda uno o più file (il file corrente e le vecchie versioni).

Un documento condivide il file con altri documenti

Non e' stato possibile recuperare il file a causa di problemi nel file di recupero

(e' stato modificato a mano? Problemi di formato UNICODE?)

Il file non e' presente nel database ma e' recuperabile parzialmente

Il file non e' presente nel database e non e' recuperabile

Il documento punta ad un file con firma non coincidente

Il documento non punta ad alcun file

Il documento punta ad un file inesistente, ma un altro file ha la stessa firma

Il documento punta ad un file inesistente e non esistono altri file compatibili

Il file viene utilizzato da un'altra libreria