IIIF ADD-ONS
IIIF ADD – ONS
Uno standard internazionale per la gestione delle collezioni di immagini.
Accesso e riutilizzo di immagini in alta definizione
Gestione di oggetti digitali complessi (sequenze, capitoli, sezioni, etc.)
Supporto di un grande numero di formati: JPG, JPG2000, TIFF, PNG, BMP, RAW, …
Download progressivo, zoom, rotazione e scale diverse, photo-editing
… e molto altro ancora insieme a un’esperienza di navigazione straordinaria!
IIIF Image Viewer
L’ecosistema IIIF (International Image Interoperability Framework), da diversi anni supportato dalle estensioni di DSpace sviluppate da 4Science, promuove e sostiene come obiettivo prioritario l’interoperabilità.
Utilizzando tale tecnologia è molto semplice, ad esempio visualizzare affiancate su un desktop virtuale sia immagini contenute nello stesso repository, sia importate da altre applicazioni che implementano lo standard IIIF per confrontare documenti e oggetti. In questo modo l’utente può sperimentare un “viaggio immersivo” anche al di fuori dei confini della propria applicazione.
Gli strumenti adottati favoriscono, dunque, la creazione di un ambiente di navigazione empatico e coinvolgente. Il risultato è quindi una fruizione di qualità e la possibilità di avvicinare anche pubblici non legati esclusivamente allo studio e alla ricerca.
Per la fruizione e la navigazione, in particolare, è utilizzato, nell’attuale versione standard, Mirador3.
Con il visualizzatore IIIF si offre una navigazione di qualità:
- immagini multiple,
- fruizione dell’immagine a singola pagina, a doppia pagina, con la galleria di miniature possibilità di condividere come URL il livello di zoom o la rotazione. Questo facilita l’inserimento di collegamenti precisi anche all’interno dei contributi scientifici.
Con Mirador3, inoltre, è possibile confrontare documenti digitali contenuti nello stesso repository o in altri repository IIIF compliant.
Nell’esempio, Melodie della Traviata e Album di Danze conservati nella digital library del Conservatorio di Milano, la Traviata rintracciata nella Digital Library PAVIA e il documento “Oeuvres pour le piano. , La traviata : fantaisie élégante : [pour piano] à 4 mains” che fa parte del patrimonio di BNF-Gallica.
Con IIIF Image Viewer si può fornire a categorie di pubblici prestabilite, l’accesso a formati diversi (JPG, PDF, …) del documento digitale. Questo può consentire la protezione di immagini ad alta risoluzione o l’adozione di politiche di sfruttamento anche economico dei contenuti.
La possibilità di gestire i permessi legati alle risorse digitali è uno degli aspetti fondamentali per chi gestisce collezioni digitali e digital libraries. In questo senso la perfetta integrazione tra le applicazioni sviluppate da 4Science e l’Image Viewer permette di autorizzare o inibire lo scarico delle immagini a seconda delle necessità o di permettere l’accesso all’immagine solo a determinate categorie di utenti.
Mediante questo modulo è possibile, infine, generare un file PDF multipagina a bassa risoluzione scaricabile dagli utenti.
Image Viewer IIIF insieme a OCR & Transcription e Document Viewer
Il IIIF Image Viewer può essere esteso e arricchito con altre componenti sviluppate da 4Science: OCR & Transcription e Document Viewer mettendo così a disposizione funzionalità aggiuntive.
Il Document Viewer permette l’accesso al pdf direttamente nel browser con una esperienza di navigazione ottimizzata coerente con le caratteristiche e dimensioni del file.
Per i PDF che supportano l’estrazione dei contenuti testuali il Document Viewer consente la ricerca “nel libro”. Inoltre, se utilizzato insieme a OCR &Transcription è possibile abilitare le funzionalità di lettura tramite OCR anche per PDF di sole immagini frutto di fascicolazione di digitalizzazioni.
L’integrazione con OCR & Transcription, infatti, offre la possibilità di effettuare ricerche all’interno del testo direttamente dall’Image Viewer.
L’analisi di un testo è molto importante, ad esempio per lo studio, l’analisi dei documenti e anche per una divulgazione assistita dei suoi contenuti. Per questo 4Scienda ha integrato DSpace con un software OCR esterno: il software open source Tesseract. La piattaforma prevede la possibilità di integrare anche altri motori OCR molto diffusi.
Tesseract supporta una varietà molto ampia di lingue e caratteri:
- alfabeti latini (italiano, francese, spagnolo, tedesco),
- la scrittura da destra a sinistra (arabo) e ideografica (cinese)
lingue slave (russo, polacco, …)
hindi e molte altre lingue.
Il motore OCR può anche essere istruito con i file di training personalizzati per riconoscere caratteri e lingue specifiche.
Molto utile è la possibilità di effettuare ricerche all’interno delle immagini evidenziando con un colore i termini della ricerca sull’immagine stessa (highlighting). Il risultato è la possibilità di rintracciare con facilità quanto cercato. L’integrazione fra OCR e IIIF Image Viewer permette, inoltre, di navigare fra i risultati, in modo semplice e fluido.
Infine, utilizzando la rappresentazione del testo estratto in formato standard OCR è possibile l’indicizzazione full-text nel motore di ricerca di DSpace (SOLR).