|
La realizzazione dell’innovativo modello
Tesauro di digitalizzazione, produzione, conservazione e diffusione del
libro antico ha richiesto una lunga e impegnativa fase di ricerca. La
sperimentazione è stata condotta su un corpus
di duecento volumi del XVII secolo scelti tra quelli già catalogati
in SBN e appartenenti
alle biblioteche partner del Progetto.
Primo significativo risultato della ricerca è stata l’acquisizione digitale
delle seicentine attraverso un sistema di scansione non traumatica
Digibook che, non alterando gli originali, li rende disponibili in
rete e pronti per un processo di produzione massiva di ristampa
anastatica con il Docutech.
Il momento di maggiore criticità della ricerca si è raggiunto
nel processo di trasformazione delle seicentine da file
immagine a file
di testo (manipolabile allo stesso modo di un file documento). Infatti
il sistema OCR, inizialmente
scelto per la ricognizione ottica dei caratteri tipografici delle seicentine,
ha dovuto cedere il passo al più ‘intelligente’ sistema ICR.
Il gruppo di ricerca Tesauro ha ‘insegnato’ alla rete neurale ICR a riconoscere
gli svariati caratteri a stampa del Seicento, costruendo un ambiente operativo
ad hoc per la ricognizione automatica dei testi antichi.
Così il sistema Tesauro ha potuto: trasformare le seicentine in ipertesti;
creare la Biblioteca Digitale
Tesauro, formata dalle duecento seicentine del corpus di sperimentazione
e dai testi che via via saranno richiesti dai navigatori; integrarsi
con l’OPAC SBN
e con banche dati enciclopediche; gettare le basi per un futuro dizionario
del Seicento, fondamentale strumento per gli studiosi di tutto il mondo.
|