Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
tesseract-ocr [Le 29/10/2018, 16:40]
bcag2 [Utilisation] note sur préférer le format tiff
tesseract-ocr [Le 11/02/2019, 07:10] (Version actuelle)
harlock1 [En ligne de commande] pdf image
Ligne 40: Ligne 40:
 Pour traiter plusieurs fichiers, vous pouvez faire : Pour traiter plusieurs fichiers, vous pouvez faire :
 <​code>​for i in *.jpg ; do tesseract -l fra $i $i.txt; ​ done;</​code>​ <​code>​for i in *.jpg ; do tesseract -l fra $i $i.txt; ​ done;</​code>​
 +
 +Pour traiter un pdf image de plusieurs pages :
 +<​code>​pdftoppm -r 300 -tiff texte.pdf texte
 +for f in *.tif;do tesseract $f $f -l fra;done
 +cat *.txt > document.txt</​code>​
 +
  
 ==== Les options de langues ==== ==== Les options de langues ====
  • tesseract-ocr.txt
  • Dernière modification: Le 11/02/2019, 07:10
  • par harlock1