Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente | Prochaine révision Les deux révisions suivantes | ||
tesseract-ocr [Le 29/10/2018, 16:40] bcag2 [Utilisation] note sur préférer le format tiff |
tesseract-ocr [Le 11/02/2019, 07:10] harlock1 [En ligne de commande] pdf image |
||
---|---|---|---|
Ligne 40: | Ligne 40: | ||
Pour traiter plusieurs fichiers, vous pouvez faire : | Pour traiter plusieurs fichiers, vous pouvez faire : | ||
<code>for i in *.jpg ; do tesseract -l fra $i $i.txt; done;</code> | <code>for i in *.jpg ; do tesseract -l fra $i $i.txt; done;</code> | ||
+ | |||
+ | Pour traiter un pdf image de plusieurs pages : | ||
+ | <code>pdftoppm -r 300 -tiff texte.pdf texte | ||
+ | for f in *.tif;do tesseract $f $f -l fra;done | ||
+ | cat *.txt > document.txt</code> | ||
+ | |||
==== Les options de langues ==== | ==== Les options de langues ==== |