La US Postal Service utilizza la tecnologia di riconoscimento ottico dei caratteri ( OCR ) per leggere gli indirizzi su pezzi di posta . Per la posta di essere leggibile da un sorter di posta OCR , tuttavia , gli indirizzi ei caratteri devono essere formattati in un certo modo . Il software OCR è utile per la conversione di immagini scansionate di documenti digitati o scritti a mano in testi elettronici , ma presenta degli svantaggi che limitano le sue applicazioni . Documenti limitati
OCR funziona meglio con buoni documenti digitati qualità. Documenti scritti a mano non possono essere facilmente letti da software OCR . Allo stesso modo , i caratteri digitati che assomigliano scrittura - così come caratteri non latini - creano molti errori durante il processo OCR . Se il documento è scarso contrasto , viene piegato o sporco , o il testo e lo sfondo sono simili nelle tenebre , poi OCR non può funzionare bene . OCR ha difficoltà con i documenti che hanno due immagini e testo . Fogli di calcolo produrrà anche più errori .
Precisione
Nessun software OCR è accurato al 100 per cento . Il numero di errori dipende dalla qualità e dal tipo di documento, comprese il carattere utilizzato . Gli errori che si verificano durante l'OCR includono lettere lettura errata , saltando le lettere che sono illeggibili , oppure mescolando insieme il testo da colonne adiacenti o le didascalie delle immagini. Se è richiesta un'elevata precisione - come con la conversione di libri digitali in formato elettronico - poi un clean-up del testo elettronico saranno necessari
work-around
< br . >
OCR ha difficoltà a distinguere tra caratteri , come ad esempio il numero zero e un capitale "O. " Per ovviare a questo , un carattere speciale OCR può essere utilizzato , come ad esempio la scrittura di zero. Tuttavia, questo funziona solo per i documenti creati con OCR in mente , come ad esempio questionari . Durante la creazione di questionari che saranno scritti a mano , i ricercatori utilizzano anche scatole per ogni lettera .
Lavoro aggiuntivo
Anche se l'immagine digitalizzata del documento originale è alta di qualità, ulteriori passaggi devono avvenire per ripulire il testo OCR . È molto laboriosa per correggere gli errori creati da OCR . Una persona deve confrontare manualmente il documento originale e il testo elettronico . La gente anche fare degli errori durante la digitazione di testo da un documento , ma a volte è più veloce a saltare la fase OCR .