Come usare Tesseract su Windows
Il Gennaio 14, 2022 da adminTesseract è un software di riconoscimento ottico dei caratteri sviluppato da Google. È uno strumento OCR open source. Ci sono molte versioni di Tesseract, ma noi useremo la versione 4.0.
Nella versione 4, Tesseract ha implementato un motore di riconoscimento basato sulla Long Short Term Memory (LSTM). LSTM è un tipo di rete neurale ricorrente (RNN). Il riconoscimento basato su LSTM funziona molto più efficacemente dei vecchi processi di riconoscimento (basati su CNN).
Grazie a tesseract, saremo in grado di salvare il contenuto delle nostre immagini come file di testo.
Installazione
L’installazione dipende dal vostro sistema operativo. Ora passiamo alle finestre. Per prima cosa, scarichiamo e installiamo Tesseract attraverso questo link. (Scarica un file exe.) Impostiamo il file exe facilmente.
Dopo di che dovremmo aggiungere un PATH alle variabili di sistema di windows. In realtà è un passo facile. Per prima cosa troviamo e copiamo la cartella principale dell’installazione di Tesseract. Dovrebbe essere così :
C:\Program Files\Tesseract-OCR
E poi nella barra di ricerca di windows Impostazioni di sistema avanzate
Impostazioni di sistema avanzate > Avanzate > Variabili d’ambiente > PATH > Nuovo
Incolliamo il percorso di origine che abbiamo copiato e salviamo questa configurazione. Dopo questo passo il computer deve essere riavviato per applicare le configurazioni.
L’installazione di tesseract è completata. È possibile confermare l’installazione dalla riga di comando. Quando eseguiamo il comando tesseract sulla linea di comando, dovrebbe darci informazioni sul programma.
Lascia un commento