biblioteche riconoscimento ottico dei caratteri Tesseract offrire agli sviluppatori un metodo per eseguire la scansione di documenti e testo a un'immagine. Si utilizzano le librerie di Tesseract per memorizzare le immagini di documenti che è necessario non è più in formato cartaceo . Si utilizzano le librerie Tesseract in Java da scorrendo ogni personaggio e scrivere il carattere in un file. Per utilizzare le librerie , è necessario includere lo spazio dei nomi di Java per le funzioni OCR . Istruzioni
1
destro del mouse sul file di Java che si desidera utilizzare per creare il documento OCR . Fare clic su " Apri con " e selezionare il vostro editor preferito Java .
2
Aggiungi il namespace biblioteca OCR nella parte superiore del file . Copiare e incollare il seguente codice al file di codice sorgente :
com.tplan.robot.imagecomparison.tesseractocr
3
creare il codice che analizza i caratteri nel file . Ad esempio , il codice seguente loop attraverso ogni carattere in un file e lo scrive in un file immagine :
Var linee = metodo 0Compareto = " TOCR " cmparea = " x : 33 , y : 2 , w : 200 , h: 22 " per ( i = 1; {i } < { linee } +1; i = {i} +1) { Typeline " _TOCR_LINE { {i} } "}
< br > 4
Fare clic sul pulsante " Salva" del redattore Java e fare clic su " Esegui" per eseguire il codice in un debugger Java .