Articles

Come usare Tesseract su Windows

Il Gennaio 14, 2022 da admin

Tesseract è un software di riconoscimento ottico dei caratteri sviluppato da Google. È uno strumento OCR open source. Ci sono molte versioni di Tesseract, ma noi useremo la versione 4.0.

Nella versione 4, Tesseract ha implementato un motore di riconoscimento basato sulla Long Short Term Memory (LSTM). LSTM è un tipo di rete neurale ricorrente (RNN). Il riconoscimento basato su LSTM funziona molto più efficacemente dei vecchi processi di riconoscimento (basati su CNN).

Grazie a tesseract, saremo in grado di salvare il contenuto delle nostre immagini come file di testo.

Installazione

L’installazione dipende dal vostro sistema operativo. Ora passiamo alle finestre. Per prima cosa, scarichiamo e installiamo Tesseract attraverso questo link. (Scarica un file exe.) Impostiamo il file exe facilmente.

Dopo di che dovremmo aggiungere un PATH alle variabili di sistema di windows. In realtà è un passo facile. Per prima cosa troviamo e copiamo la cartella principale dell’installazione di Tesseract. Dovrebbe essere così :

C:\Program Files\Tesseract-OCR

E poi nella barra di ricerca di windows Impostazioni di sistema avanzate

Impostazioni di sistema avanzate > Avanzate > Variabili d’ambiente > PATH > Nuovo

Incolliamo il percorso di origine che abbiamo copiato e salviamo questa configurazione. Dopo questo passo il computer deve essere riavviato per applicare le configurazioni.

L’installazione di tesseract è completata. È possibile confermare l’installazione dalla riga di comando. Quando eseguiamo il comando tesseract sulla linea di comando, dovrebbe darci informazioni sul programma.

Archivi

Categorie

Come usare Tesseract su Windows

Installazione

Codifica

Importazione delle librerie

Impostazione del valore DPI dell’immagine

Applicazione di alcune tecniche per rendere l’immagine più pulita

Eseguire Tesseract

Salvataggio dell’output

Lascia un commento Annulla risposta

Archivi

Meta