Wdoc
Tecnologia Soluzioni Contatti
      Cos'è> Architettura applicativa      
Presentazione
Cos'e' Wdoc
Architettura Applicativa
Il formato Djvu
Caratteristiche tecniche

Architettura applicativa

Il sistema WDOC è composto da moduli software e hardware separati e indipendenti. Questa caratteristica consente di offrire soluzioni adattabili alle attuali esigenze del progetto e scalabili in base a future esigenze di crescita e di potenziamento.

I moduli sono:


Moduli documenti

E’ il gruppo di moduli che definisce per quali tipi di documenti il sistema è abilitato. Per ogni tipo documento il sistema viene configurato per importare e gestire i dati in base a specifici requisiti formali.
I moduli attualmente disponibili sono:

  • modulo periodici
  • modulo quotidiani
I moduli in fase di realizzazione sono:
  • modulo “libri”
Top



Moduli funzionali

Moduli importazione

E’ il gruppo di moduli che regola il processo di importazione (da CD-ROM, DVD o altri supporti magnetici) e trasformazione dei file immagine e che crea la base dati necessaria per organizzare le pagine dei documenti nei vari oggetti informativi (per i periodici, ad esempio, testata, volume e fascicolo).
Modalità di importazione differenti possono essere studiate in base a esigenze specifiche.

Importazione da nome file
Si occupa di importare i file immagine estrapolando i dati di archiviazione (numerici, cronologici e di pagina) dal codice del nome del file, attribuito in fase di digitalizzazione sulla base di una specifica regola di codifica che viene fornita per ogni tipo di documento.

Importazione da file XML
Si occupa di importare i file immagine estrapolando i dati di archiviazione (numerici, cronologici) da un file XML di descrizione prodotto durante la fase di digitalizzazione o successivamente.

Trasformazione immagini nel formato di distribuzione
Si occupa di trasformare i file immagine nel formato ottimizzato per la distribuzione via rete. WDOC propone il formato DjVu® di LizardTech. E’ tuttavia possibile scegliere formati di distribuzione diversi (per es. PDF, TIFF e JPEG).

Generazione contenuto testuale (OCR)
Si occupa di interpretare il file immagine per generare il contenuto testuale in formato ASCII tramite processo detto di OCR. Il testo così prodotto viene indicizzato da un apposito processo e messo a disposizione per la ricerca full-text.

Gestione processo
Si occupa di gestire il processo di conversione e di importazione dati. Mette a disposizione una serie di strumenti di configurazione del processo.

Moduli gestione dati catalografici
E’ il gruppo di moduli che consente di inserire e modificare i dati catalografici dei documenti importati.

Gestione scheda catalografica
Consente di inserire e modificare le aree informative della scheda catalografica richieste dallo standard ISBD. Per il modulo “pubblicazioni in serie”, è disponibile un’apposita funzione che consente di associare le schede al fine di creare la “storia” di una testata.

Gestione spogli
Consente di creare gli spogli di un documento (tipicamente un periodico o un quotidiano). Lo spoglio rende il documento accessibile per un ulteriore oggetto informativo (per i periodici, ad esempio, è l’articolo).

Gestione metadati oggetti informativi
Consente di associare metadati (ad es. parole chiave o note) ai vari oggetti informativi nei quali è organizzato il documento (es. volume, fascicolo, articolo, pagina).

Moduli gestione utente
E’ il gruppo di moduli (registrazione e login, pagamento, amministrazione) che consente di gestire gli accessi degli utenti alla digital libray, vincolandoli alla registrazione (ed all’eventuale pagamento di un abbonamento). Il sistema prevede la possibilità di escludere dalla visualizzazione agli utenti non registrati anche una sola parte dei documenti dell’archivio. I dati degli utenti registrarti sono gestiti tramite un’apposita interfaccia di amministrazione.

Moduli navigazione
E’ il gruppo dei moduli che costituisce l’interfaccia di accesso all’archivio documenti della digital library. E’ possibile personalizzare l’ambiente di navigazione con logo e colori del cliente.

Consultazione gerarchica
Consente all’utente di sfogliare l’archivio secondo uno schema gerarchico che inizia dalla selezione di un titolo da un indice alfabetico e prosegue con le selezioni di unità organizzative successive, fino ad arrivare al documento che può essere acceduto da qualsiasi punto della navigazione.

Ricerca campi database
Consente la ricerca di una parola chiave all’interno dei campi informativi del database. Viene personalizzato per ogni tipo di documento presente in archivio.

Ricerca full-text
Consente la ricerca di una stringa di testo all’interno dei contenuti testuali dei documenti dell’archivio, estrapolati dai file immagine attraverso il processo di OCR.

Top




Moduli Hardware

I servizi della piattaforma sono erogati da due PC server e da un sistema di disk array dedicati rispettivamente, all’importazione dati & conversione file (Application server), alla distribuzione dei contenuti (Web & DB server) e allo storage dei documenti.
Sono inoltre disponibili due moduli opzionali che aumentano la sicurezza e la stabilità del sistema:

  • modulo backup: prevede l’installazione di unità di backup su nastro di tipo DAT;
  • modulo UPS: prevede l’installazione di un sistema di gruppi di continuità;


Stampa Top
Cos'è | Showcase | Soluzioni | Contatti | P. IVA 12594410156