2014-05-21 17 views
6

Sto tentando di installare Tesseract-OCR sul mio server, tuttavia quando installo tutto ciò che ritengo sia il repository corretto. Quando provo ad installarlo il pacchetto non viene trovatoInstallazione di Tesseract-OCR su CentOS 6

Ho provato ad aggiungere rpmforge ma senza successo. Qualche idea da qualcuno che ha già fatto o che ha familiarità con l'aggiunta e la ricerca attraverso i repository?

risposta

5

ho usato questo istruzioni e lavorato correttamente in CentOS

Installare librerie Tesseract OCR da fonti in CentOS

  1. Scarica Leptonica e Teseract fonti:

    $ wget http://www.leptonica.org/source/leptonica-1.69.tar.gz
    $ wget https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz

  2. .210
  3. Configurare, compilare, installare librerie:

    $ tar xzvf leptonica-1.69.tar.gz
    $ cd leptonica-1.69
    $ ./configure $ rendono $ sudo make install

    $ tar xzf tesseract-OCR-3.02.02.tar.gz $ cd tesseract-3.01 $ ./autogen.sh $ ./configure $ rendono $ sudo make install $ sudo ldconfig

  4. Scarica lingue (inglese) e copiare a tessdata cartella:

    $ wget http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.eng.tar.gz
    $ tar xzf tesseract-OCR-3.02.eng.tar.gz
    $ sudo cp tesseract-OCR/tessdata/*/usr/local/share/tessdata

e godere;)

+0

ottenere questo in redhad linux ./configure $ make $ sudo make install configure: ATTENZIONE: dovresti usare --build, --host, --target configure: ATTENZIONE: tipo di host non valido: $ configure: ATTENZIONE: tu dovrebbe usare --build, --host, --target configure: ATTENZIONE: dovresti usare --build, --host, --target configure: ATTENZIONE: tipo di host non valido: $ verifica il tipo di sistema di compilazione ... '$ ': Macchina' $' non riconosciuta '$ ': macchina' $' non riconosciuta configure: errore:/bin/sh config/config.sub $ fallito – Aadam

+0

Link https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02. 02.tar.gz e http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.eng.tar.gz dando 404 –

+0

Per i link di rilascio di Tesseract è possibile utilizzare questo p età: https://github.com/tesseract-ocr/tesseract/releases –

4

Si consiglia di provare l'installazione da rpm qui: http://pkgs.org/download/tesseract Ci sono anche diverse dipendenze: libpng-devel, libjpeg-devel, libtiff-devel, zlib e leptonica. Gli ultimi 2 si possono trovare anche sul sito RPM

-4

Ho finito per passare a Ubuntu. Tesseract è supportato splendidamente e si installa senza problemi.

apt-get install tesseract-ocr 
+3

ha detto chiaramente Centos 6, non Ubuntu ... – KnF

+0

Beh, lo so. Anche CentOS è stata la mia prima scelta, ma dopo aver affrontato un'installazione molto dolorosa ho pensato di condividere la mia soluzione. L'installazione di Ubuntu è semplicemente incredibilmente semplice. –

+1

Oh, capisco .. anche se personalmente apprezzo il tuo contributo (per l'unico motivo per cui hai impiegato alcuni secondi del tuo tempo per aiutare gli altri) non è ancora una risposta valida. Ma per favore, non fraintendermi, non sto criticando te o la tua risposta, è solo che a volte le mod chiudono la domanda originaria a causa di risposte imprecise come questa. E ancora, grazie per aver trovato il tempo di rispondere, immagino che tutta la comunità lo apprezzi. – KnF

3

questo ha funzionato per me:

/usr/bin/yum --enablerepo epel-testing install tesseract.x86_64 tesseract-langpack-fra.noarch 

Tesseract non è nel repository EPEL ma alla strega repo EPEL-test non è attivata per impostazione predefinita.

2

ho scritto uno script bash per l'installazione Tesseract 3.05 su CentOS 7. Questo recupera e installa tutte le dipendenze e installa anche i file di lingua per inglese, hindi, bengalese e tailandese.

codice disponibile su GitHub

https://github.com/EisenVault/install-tesseract-redhat-centos

Spero che questo aiuti.