Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
ocr [Le 20/12/2021, 22:30]
wiki-corrector-bot passage de http à https sur les liens externes (détecté et corrigé via le bot wiki-corrector (https://forum.ubuntu-fr.org/viewtopic.php?id=2067892)
ocr [Le 28/09/2022, 20:49]
Amiralgaby [Cuneiform] amélioration du code shell - repéré grâce à wiki-corrector
Ligne 1: Ligne 1:
- 
 {{tag>​bureautique portail}} {{tag>​bureautique portail}}
  
Ligne 21: Ligne 20:
 [[http://​cognitiveforms.com/​ru/​products_and_services/​Cuneiform.html#​1189-Cuneiform|cuneiform]] (en russe, ou en [[http://​en.cognitiveforms.ru/​products/​cuneiform/​|anglais]]) est un OCR multi-plateforme,​ qui supporte 20 langues, dont le français. Pour les textes en français et les images propres et lisibles, il donne des résultats très satisfaisants avec une marge d'​erreur entre 2 et 3 %. De plus, il semble être le seul à supporter (de façon basique) la mise en forme du texte. Ainsi, il reconnaît les textes soulignés, gras, en italique, et les images. Le texte qu'il ne réussit pas à traiter est également importé sous forme d'​image. Il supporte les fichiers images en bmp, jpg, png, tiff,  Il peut exporter en format texte, html, rtf, et d'​autres. [[http://​cognitiveforms.com/​ru/​products_and_services/​Cuneiform.html#​1189-Cuneiform|cuneiform]] (en russe, ou en [[http://​en.cognitiveforms.ru/​products/​cuneiform/​|anglais]]) est un OCR multi-plateforme,​ qui supporte 20 langues, dont le français. Pour les textes en français et les images propres et lisibles, il donne des résultats très satisfaisants avec une marge d'​erreur entre 2 et 3 %. De plus, il semble être le seul à supporter (de façon basique) la mise en forme du texte. Ainsi, il reconnaît les textes soulignés, gras, en italique, et les images. Le texte qu'il ne réussit pas à traiter est également importé sous forme d'​image. Il supporte les fichiers images en bmp, jpg, png, tiff,  Il peut exporter en format texte, html, rtf, et d'​autres.
  
-Le projet est en attente de nouveaux développeurs depuis mai 2011 (([[https://​code.launchpad.net/​cuneiform-linux|Stepping down as maintainer]])). Il dispose toujours d'une [[https://​launchpad.net/​cuneiform-linux|page Launchpad]] qui héberge le code et est maintenue. ​+Le projet est en attente de nouveaux développeurs depuis mai 2011 (([[https://​code.launchpad.net/​cuneiform-linux|Stepping down as maintainer]])). Il dispose toujours d'une [[https://​launchpad.net/​cuneiform-linux|page Launchpad]] qui héberge le code et est maintenue.
  
 Voir la  [[http://​wiki.ubuntuusers.de/​Cuneiform-Linux?​highlight=cuneiform#​Einbindung-in-XSane|documentation]] en allemand où on trouve un fichier de commande pour xsane du genre de celui de tesseract. Voir la  [[http://​wiki.ubuntuusers.de/​Cuneiform-Linux?​highlight=cuneiform#​Einbindung-in-XSane|documentation]] en allemand où on trouve un fichier de commande pour xsane du genre de celui de tesseract.
Ligne 30: Ligne 29:
 <file bash>#​!/​bin/​sh <file bash>#​!/​bin/​sh
  
-printf %s "​$NAUTILUS_SCRIPT_SELECTED_FILE_PATHS"​ | +printf %s "​$NAUTILUS_SCRIPT_SELECTED_FILE_PATHS"​ |
 while read -r arg while read -r arg
 do do
- convert -colorspace GRAY $arg tmp.tiff + convert -colorspace GRAY "$arg" ​tmp.tiff 
- cuneiform -l fra -f rtf -o $arg.rtf tmp.tiff+ cuneiform -l fra -f rtf -o "$arg".rtf tmp.tiff
  rm tmp.tiff  rm tmp.tiff
 done</​file>​ done</​file>​
Ligne 57: Ligne 56:
  
 ==== Gocr ==== ==== Gocr ====
-Logiciel qui donne des résultats de qualité médiocre, entre 7 et 8 % d'​erreur par document. ​+Logiciel qui donne des résultats de qualité médiocre, entre 7 et 8 % d'​erreur par document.
  
 Installez le paquet **[[apt>​gocr]]** et **[[apt>​gocr-tk]]** pour avoir une interface graphique. Ce qu'il sait faire : Installez le paquet **[[apt>​gocr]]** et **[[apt>​gocr-tk]]** pour avoir une interface graphique. Ce qu'il sait faire :
Ligne 79: Ligne 78:
  
 Pour faire de la ROC avec Xsane il faut : Pour faire de la ROC avec Xsane il faut :
-  * Choisir son moteur d'OCR : ouvrir Xsane et dans //​Préférence -> Configuration -> OCR// il faut, dans la commande OCR, remplacer **gocr** par : +  * Choisir son moteur d'OCR : ouvrir Xsane et dans //​Préférence -> Configuration -> OCR// il faut, dans la commande OCR, remplacer **gocr** par :
       * pour  **gocr** avec la reconnaissance des caractères accentués <​code>​gocr -f UTF8</​code>​       * pour  **gocr** avec la reconnaissance des caractères accentués <​code>​gocr -f UTF8</​code>​
       * pour **tesseract** <code >​xsane2tess -l fra</​code>​       * pour **tesseract** <code >​xsane2tess -l fra</​code>​
Ligne 191: Ligne 190:
   * [[https://​appdb.winehq.org/​objectManager.php?​sClass=application&​iId=7180|Fiche de Myscript Note (reconnaissance écriture) sur WineHQ.org]]   * [[https://​appdb.winehq.org/​objectManager.php?​sClass=application&​iId=7180|Fiche de Myscript Note (reconnaissance écriture) sur WineHQ.org]]
   * [[https://​appdb.winehq.org/​objectManager.php?​sClass=application&​iId=8569|Fiche de Myscript Stylus (logiciel interactif) sur WineHQ.org]] ([[http://​www.visionobjects.com/​handwriting_recognition/​downloadstylus3.htm#​Linux|existe pour GNU/Linux]] ), reconnaît l'​écriture attachée   * [[https://​appdb.winehq.org/​objectManager.php?​sClass=application&​iId=8569|Fiche de Myscript Stylus (logiciel interactif) sur WineHQ.org]] ([[http://​www.visionobjects.com/​handwriting_recognition/​downloadstylus3.htm#​Linux|existe pour GNU/Linux]] ), reconnaît l'​écriture attachée
-Non libre, [[http://​www.visionobjects.com/​handwriting_recognition/​onlinestore.htm|versions d'​évaluation 30 jours]] des logiciels sur le site officiel. ​+Non libre, [[http://​www.visionobjects.com/​handwriting_recognition/​onlinestore.htm|versions d'​évaluation 30 jours]] des logiciels sur le site officiel.
  
 ===== Voir aussi ===== ===== Voir aussi =====
  • ocr.txt
  • Dernière modification: Le 09/04/2024, 20:21
  • par UntuJLuc