Il Tagged Image File Format , o TIFF , serve come una scelta frequente per il salvataggio dei file non compressi bitmap , tra cui le immagini acquisite dalla scansione di materiale stampato . È possibile creare file TIFF ed eseguire il riconoscimento ottico dei caratteri sulle pagine del tipo che si desidera catturare come testo dal vivo. Se il file TIFF non soddisfa le specifiche di OCR , il software OCR viene visualizzato un messaggio di errore che avvisa che il file non può essere elaborato correttamente o affatto. Compressione
Il formato di file TIFF TIFF consente di applicare la compressione dell'immagine senza perdita di dati quando si salva i documenti in un programma software che incorpora il supporto per sistemi di compressione . Queste opzioni possono ridurre le dimensioni del file , ma non tutti i programmi OCR supportare tutti , o qualsiasi , tipi di compressione TIFF . Per ottenere i migliori risultati , salvare i file TIFF senza compressione per renderli il più facile da usare possibile.
Bassa risoluzione
Se si ha familiarità con la risoluzione utilizzata per le bitmap nelle pagine Web , si potrebbe chiedere perché un file di 72 pixel per pollice che guarda bene quando lo si visualizza in un browser Web produce risultati di scarsa qualità nel programma OCR . Questo perché il software OCR ha bisogno di un file che dedica abbastanza pixel per ogni carattere del testo per renderlo riconoscibile dagli algoritmi che elaborano le scansioni . Per ottenere i migliori risultati, è necessario almeno una scansione a 150 ppi , se non superiore . Apertura di una scansione di 72 ppi e ricampionamento a 300 ppi fa solo il file più grande, senza migliorare la qualità dell'immagine. Per ottenere i migliori risultati , iniziare con alta risoluzione o una nuova scansione per raggiungerlo.
Immagini Crooked
E ' difficile fissare un pezzo di carta sul ponte di imaging di uno scanner senza il foglio alla deriva un po 'storto sulla superficie in vetro . I momenti si spende riposizionando il foglio in modo da poter ottenere una scansione di buona qualità pagare in migliori risultati OCR . Anche una nitida e chiara scansione storto mette un maggiore sforzo sul vostro programma OCR che uno che ha catturato verso l'alto e verso il basso . Per ottenere i migliori risultati , abbassare il coperchio dello scanner lentamente così il movimento dell'aria non disturberà il vostro giornale .
Altre considerazioni
seconda del programma OCR che si utilizza, è possibile riscontrare messaggi di errore , perché i file TIFF utilizzano una modalità di colore che il software OCR non supporta . Per esempio, se hai catturato una ad alta risoluzione , il file RGB a 16 bit per l'utilizzo in un progetto di ritocco , il programma OCR può fermava per la dimensione del file o la sua profondità di bit . Scansioni di pagine che includono fotografie o disegni risultare fastidioso per alcuni software OCR , che può presentare un messaggio di errore che riflette il contenuto della pagina , non il formato di file . Infine , se la scansione rappresenta il testo su un foglio di carta colorata , si può avere difficoltà a catturare il suo testo perché manca un sufficiente contrasto rispetto allo sfondo .