faq
newsletter
mappa
contatti
La Ricerca  
La Biblioteca Digitale
Perché Tesauro
La Rete
Il Progetto
   


La Ricerca
La Formazione
Comitato
Scientifico

La realizzazione dell’innovativo modello Tesauro di digitalizzazione, produzione, conservazione e diffusione del libro antico ha richiesto una lunga e impegnativa fase di ricerca. La sperimentazione è stata condotta su un corpus di duecento volumi del XVII secolo scelti tra quelli già catalogati in SBN e appartenenti alle biblioteche partner del Progetto.
Primo significativo risultato della ricerca è stata l’acquisizione digitale delle seicentine attraverso un sistema di scansione non traumatica Digibook che, non alterando gli originali, li rende disponibili in rete e pronti per un processo di produzione massiva di ristampa anastatica con il Docutech.
Il momento di maggiore criticità della ricerca si è raggiunto nel processo di trasformazione delle seicentine da file immagine a file di testo (manipolabile allo stesso modo di un file documento). Infatti il sistema OCR, inizialmente scelto per la ricognizione ottica dei caratteri tipografici delle seicentine, ha dovuto cedere il passo al più ‘intelligente’ sistema ICR. Il gruppo di ricerca Tesauro ha ‘insegnato’ alla rete neurale ICR a riconoscere gli svariati caratteri a stampa del Seicento, costruendo un ambiente operativo ad hoc per la ricognizione automatica dei testi antichi.
Così il sistema Tesauro ha potuto: trasformare le seicentine in ipertesti; creare la Biblioteca Digitale Tesauro, formata dalle duecento seicentine del corpus di sperimentazione e dai testi che via via saranno richiesti dai navigatori; integrarsi con l’OPAC SBN e con banche dati enciclopediche; gettare le basi per un futuro dizionario del Seicento, fondamentale strumento per gli studiosi di tutto il mondo.

Rete Tesauro - Prodotti e servizi per il libro antico