Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
tesseract-ocr [Le 29/10/2018, 16:40]
bcag2 [Utilisation] note sur préférer le format tiff
tesseract-ocr [Le 07/03/2019, 10:14]
RolandG [Pour une reconnaissance optique directe dans LibreOffice Writer de fichiers PNG ou JPG] correction ortografic mineure
Ligne 40: Ligne 40:
 Pour traiter plusieurs fichiers, vous pouvez faire : Pour traiter plusieurs fichiers, vous pouvez faire :
 <​code>​for i in *.jpg ; do tesseract -l fra $i $i.txt; ​ done;</​code>​ <​code>​for i in *.jpg ; do tesseract -l fra $i $i.txt; ​ done;</​code>​
 +
 +Pour traiter un pdf image de plusieurs pages :
 +<​code>​pdftoppm -r 300 -tiff texte.pdf texte
 +for f in *.tif;do tesseract $f $f -l fra;done
 +cat *.txt > document.txt</​code>​
 +
  
 ==== Les options de langues ==== ==== Les options de langues ====
Ligne 108: Ligne 114:
   - Placez sur le bureau vos fichiers numérisés au format PNG (le mieux est un PNG en valeurs de gris et 300 dpi avec Xsane, mais vous pouvez essayer avec d'​autres PNG déjà numérisés),​   - Placez sur le bureau vos fichiers numérisés au format PNG (le mieux est un PNG en valeurs de gris et 300 dpi avec Xsane, mais vous pouvez essayer avec d'​autres PNG déjà numérisés),​
   - Vous pouvez placer sur le bureau plusieurs fichiers PNG sur lesquels vous voulez procéder à la reconnaissance optique, mais ne dépassez pas 3-4 fichiers si vous voulez une opération relativement rapide. \\ Les contenus des différents fichiers seront placés les uns à la suite des autres dans un même document Libreoffice.   - Vous pouvez placer sur le bureau plusieurs fichiers PNG sur lesquels vous voulez procéder à la reconnaissance optique, mais ne dépassez pas 3-4 fichiers si vous voulez une opération relativement rapide. \\ Les contenus des différents fichiers seront placés les uns à la suite des autres dans un même document Libreoffice.
-  - Cliquez sur le raccourci précédemment créé ou directement sur le script... patientez un peu... Libreoffice s'​ouvrira avec le contenue ​du texte tel qu'il a été reconnu+  - Cliquez sur le raccourci précédemment créé ou directement sur le script... patientez un peu... Libreoffice s'​ouvrira avec le contenu ​du texte tel qu'il a été reconnu
   - Il vous reste a effectuer les corrections orthographiques et la mise en page.   - Il vous reste a effectuer les corrections orthographiques et la mise en page.
  
  • tesseract-ocr.txt
  • Dernière modification: Le 04/08/2023, 19:43
  • par lyondif02