Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
synthese_vocale [Le 07/09/2015, 15:49] 89.84.216.221 sinon ça ne passe pas par mbrola |
synthese_vocale [Le 08/09/2024, 12:30] (Version actuelle) moths-art suppression d'un titre qui n'a aucun sens |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | {{tag>portail accessibilité audio multimédia}} | + | {{tag>portail accessibilité audio multimédia synthèse vocale tts}} |
---- | ---- | ||
Ligne 9: | Ligne 9: | ||
La synthèse vocale procède en trois temps : | La synthèse vocale procède en trois temps : | ||
- transformation du texte en [[wpfr>Phonème|phonèmes]] ; | - transformation du texte en [[wpfr>Phonème|phonèmes]] ; | ||
- | - [[wpfr>Prosodie|prosodie]] (ajout d'informations de prononciation : accents toniques, indication de durée, etc.) ; | + | - [[wpfr>Prosodie]] (ajout d'informations de prononciation : accents toniques, indication de durée, etc.) ; |
- assembler des sons pré-enregistrés en suivant les règles établies par les deux premières étapes. | - assembler des sons pré-enregistrés en suivant les règles établies par les deux premières étapes. | ||
- | Pour en savoir plus : [[wpfr>Synthèse_vocale|Wikipedia]] (fr), [[http://download.gna.org/lliaphon/devguide.pdf|Llia_Phon]] (fr). | + | Pour en savoir plus : [[wpfr>Synthèse_vocale|Wikipedia]] (fr), [[http://download.gna.org/lliaphon/devguide.pdf|Llia-Phon]] (fr). |
- | Ce document a pour but de présenter la mise en œuvre de quelques solutions. | + | Ce document a pour but de présenter la mise en œuvre de quelques solutions. |
- | Comme la [[reconnaissance vocale]] va de pair avec la **synthèse vocale** vous serez sans doute intéressé par le site [[http://www.voxforge.org/fr|VoxForge.org]]. Vous pouvez y enregistrer un texte qui permettra d'intégrer votre voix dans les modèles de reconnaissance vocale, et ainsi les améliorer. | + | Comme la [[:reconnaissance vocale]] va de pair avec la **synthèse vocale** vous serez sans doute intéressé par le site [[http://www.voxforge.org/fr|VoxForge.org]]. Vous pouvez y enregistrer un texte qui permettra d'intégrer votre voix dans les modèles de reconnaissance vocale, et ainsi les améliorer. |
- | <note tip>Certains logiciels open source sont compatibles avec les voix windows (dont certaines peuvent être libres, ou gratuites pour une utilisation non commerciale, voir [[:synthese_vocale#ressources_des_voix|ressources]] ). | + | <note tip>Certains logiciels libres sont compatibles avec les voix Windows (dont certaines peuvent être libres, ou gratuites pour une utilisation non commerciale, voir [[:synthese_vocale#ressources_des_voix|ressources]]). |
</note> | </note> | ||
- | <note tip>Il serait utile de continuer la page dans une vision simple en tirant les idées manquantes de : | + | ===== Logiciels de synthèse vocale ==== |
- | * [[http://blinuxman.net/edu/fr/EduVocale.txt|La fiche EDU pour une solution vocale en Français sous la console GNU/Linux]] | + | ====Svoxpico==== |
- | * [[http://vinux.org.uk/|Vinux- distribution et live CD destiné au déficient visuel]]. | + | [[:Svoxpico]]: le lecteur vocal d'Android, de loin celui qui donne les meilleurs résultats, permet de lire n'importe quelle sélection. |
- | * [[http://www.culte.org/projets/biglux/install/lao/festival.shtml|projet biglux]] | + | |
- | </note> | + | |
- | ===== Intégration dans des logiciels ===== | + | ====gSpeech==== |
- | ==== Logiciels avec synthèse vocale ==== | + | {{ :applications:gspeech.png?50}} |
- | Il ne s'agit en fait souvent que d'interface se basant sur un moteur de synthèse vocale (festival, espeak, etc.) : | + | **gSpeech** est une GUI par dessus **Svoxpico** tout en améliorant sa prononciation sur les mots/expressions les plus courantes. |
- | * [[:Orca]] : outil par défaut d'Ubuntu, fonctionne avec les programmes couramment utilisés (Navigateur web, Office, Client mail, terminal, etc.) | + | Une description de **gSpeech** est disponible ici : [[https://wiki.primtux.fr/doku.php/gspeech|présentation de gSpeech]]. |
- | * [[:abuledu-volubil|Volubil]] : outil destiné aux enfants. | + | Un descriptif plus technique de l'avancement est également disponible sur [[https://linuxfr.org/news/gspeech-passe-en-0-10|linuxfr]] |
- | * [[:gespeaker|Gespeaker]] : Faire lire ou lire le texte que vous tapez dans une case texte. | + | ===Via un ppa=== |
- | * [[http://forum.ubuntu-fr.org/viewtopic.php?id=108430|Pico]] | + | Vous pouvez installer gSpeech en ajoutant un ppa : |
- | * [[http://linuxinnovations.blogspot.fr/2012/05/jspeak-ultimate-in-linux-text-to-speach.html|Jspeak, lecteur de presse-papier (GPLv3)]] | + | * [[:PPA|Ajouter le PPA]] **ppa:jerem-ferry/tts**((https://launchpad.net/~jerem-ferry/+archive/ubuntu/tts)) dans vos sources de logiciels; |
- | * [[http://www.letime.net/vocale]] : destiné aux enfants pour jouer avec la musique. Il donne aussi la possibilité de modifier la voix en fichier texte. | + | * [[:tutoriel:comment_installer_un_paquet|Installer le paquet]] **[[apt>gspeech]]**. |
- | ==== Synthèse vocale dans Pidgin (simple) ==== | + | Vous pouvez trouver les sources sur [[https://github.com/mothsart/gSpeech.git|Github]]. |
+ | ====eSpeak==== | ||
+ | * [[:Espeak]] est disponible dans les dépôts, il propose une voix plutôt "robotique", mais combiné avec mbrola, il peut donner de bons résultats. | ||
- | La synthèse vocale dans Pidgin avec : | ||
- | * [[apt://pidgin-festival|pidgin-festival]] : s'installe en 1 clic (installe Festival et Pidgin s'ils ne sont pas déjà installés). Vous pouvez déjà activer le plugin dans Pidgin, mais vous n'aurez qu'une voix anglaise. Il vous reste donc à installer une voix française et la sélectionner. | ||
+ | ====Festival==== | ||
+ | * **[[https://www.cstr.ed.ac.uk/projects/festival/|Festival]]** est un synthétiseur vocal, pour lequel il n'existe apparemment pas de voix française directement pour l'instant ([[http://phantomsdad.blogspot.com/2005/06/ktts-and-french-connection.html|avis aux amateurs]]...). | ||
+ | Mais il existe un [[wpfr>Fork (développement logiciel)|fork]] pour festival afin d'avoir les voix françaises : Où ? | ||
+ | De même festival peut utiliser les voix françaises de Mbrola - (et Sapi).\\ | ||
+ | Il peut fonctionner en mode interactif, même si ça n'a pas l'air très intuitif de prime abord...\\ | ||
+ | Pour l'installer, il suffit d'[[:tutoriel:comment_installer_un_paquet|installer le paquet]] **[[apt>festival]]**, et [[apt>festvox-rablpc16k|d'autres voix anglaises]]. (voir également [[wpfr>Festival Speech Synthesis System|plus d'information relative sur wikipedia]]) | ||
- | ==== Dans le dictionnaire Stardict (simple) ==== | + | Pour l'utiliser entrez la commande suivante dans un [[terminal]] : |
+ | <code>echo "That's really a pity I'm not able to speak French" | festival --tts</code> | ||
- | Vous pouvez installer : | + | Pour connaître les options : <code>festival --help</code> |
- | * [[apt://stardict-plugin-festival|le plugin Festival]] | + | <note important>Si vous obtenez une erreur du type ''can't open /dev/dsp'', réessayez après avoir fermé toutes les applications (y compris les pages internet nécessitant certains plugins) utilisant le son. |
- | * [[apt://stardict-plugin-espeak|le plugin Espeak]] | + | On peut éviter le ''can't open /dev/dsp'' en redirigeant le son vers ALSA. Pour cela, on demande à festival de sortir le son avec aplay. On [[:tutoriel:comment_modifier_un_fichier|Créez le fichier]] [[:fichier_cache|caché]] **.festivalrc** dans votre **Dossier personnel** avec le contenu suivant : |
+ | <file> | ||
+ | (Parameter.set 'Audio_Command "aplay -t wav -r $SR $FILE") | ||
+ | (Parameter.set 'Audio_Method 'Audio_Command) | ||
+ | (Parameter.set 'Audio_Required_Format 'wav) | ||
+ | </file> | ||
+ | </note> | ||
- | ====Synthèse vocale dans LibreOffice ou Apache Openoffice (simple) ==== | + | ==== MBROLA ==== |
- | Il suffit d'installer l'[[http://extensions.services.openoffice.org/project/Read_Text|extension readtext]] (compatible Festival, Pico et Espeak). | + | Le projet **[[http://tcts.fpms.ac.be/synthesis/mbrola.html|MBROLA]]** a été développé à l'Université de Mons ([[https://web.umons.ac.be/numediart/fr/|Institut NUMEDIART]]), et comporte un grand nombre de langages/voix. |
- | Voir [[:libreoffice#installer_une_extension|comment installer une extension dans Libreoffice]]. | + | En 2019, **MBROLA a été rendu disponible en [[https://github.com/numediart/MBROLA|open source sur github]] sous license GNU GPL3 Afero.** |
+ | Pour l'installer, il suffit d'[[:tutoriel:comment_installer_un_paquet|installer le paquet]] **[[apt>mbrola]]**. | ||
- | ====Synthèse vocale dans Firefox ==== | + | Un certain nombre de voix pour Mbrola - pour diverses langues - sont présentes dans les [[:depots|dépôts officiels]], pour les installer faites une recherche dans votre [[:gestionnaire de paquets]] avec le mot clé **Mbrola**.\\ |
+ | Mbrola ne fait pas directement la transformation de texte en voix. Il traite des fichiers de phonèmes. Une autre application, capable de décomposer du texte en phonèmes est donc nécessaire, comme [[:eSpeak]]. | ||
+ | Les voix de Mbrola donnent un rendu plus naturel que celles de eSpeak (lesquelles sont très "robotiques"), d'où l'intérêt de combiner les deux. | ||
+ | Par défaut les voix de Mbrola s'installent dans **/usr/share/mbrola/**. Pour le français il existe fr1, une voix masculine, et fr4 une voix féminine.\\ | ||
+ | Si vous les mettez ailleurs, [[:eSpeak]] ne les trouvera pas. | ||
+ | Si vous souhaitez ajouter d'autres voix, elles sont téléchargeables depuis le [[https://github.com/numediart/MBROLA-Voices|site github]]. [[[[:archivage#graphiquement|Extraire]] le fichier zip dans **/usr/share/mbrola/**. | ||
+ | Les voix françaises de [[https://github.com/numediart/MBROLA|mbrola]] (non libres à ce jour, mais en cours d'ouverture): | ||
+ | * [[https://github.com/numediart/MBROLA-voices/blob/master/data/fr1/fr1?raw=true|Voix Mbrola FR1]] : homme, Faculte Polytech. De Mons. | ||
+ | * [[https://github.com/numediart/MBROLA-voices/blob/master/data/fr2/fr2?raw=true|Voix Mbrola FR2]] : Femme, Celine Egea | ||
+ | * [[https://github.com/numediart/MBROLA-voices/blob/master/data/fr3/fr3?raw=true|Voix Mbrola FR3]] : homme, Babel Technology | ||
+ | * [[https://github.com/numediart/MBROLA-voices/blob/master/data/fr4/fr4?raw=true|Voix Mbrola FR4]] : femme, Babel Technology | ||
+ | * [[https://github.com/numediart/MBROLA-voices/blob/master/data/fr5/fr5?raw=true|Voix Mbrola FR5]] : homme, belge, Faculte Polytech. De Mons | ||
+ | * [[https://github.com/numediart/MBROLA-voices/blob/master/data/fr6/fr6?raw=true|Voix Mbrola FR6]] : homme, Faculte Polytech. De Mons | ||
+ | * [[https://github.com/numediart/MBROLA-voices/blob/master/data/fr7/fr7?raw=true|Voix Mbrola FR7]] : homme belge , Faculte Polytech. De Mons, | ||
+ | * [[https://github.com/numediart/MBROLA-voices/blob/master/data/ca1/ca1?raw=true|Voix québecois 1]] : homme,Vincent Arnaud, | ||
+ | * [[https://github.com/numediart/MBROLA-voices/blob/master/data/ca2/ca2?raw=true|Voix québecois 2]] : homme, Silex Creations Inc. | ||
- | [[http://www.firevox.clcworld.net/clc-4-tts_bundle_v4.0_release.xpi|Cliquer ici pour installer l'extension FIREVOX, pour firefox]] (clicspeak y est intégré) | ||
- | Basé sur [[http://clickspeak.clcworld.net/installation_linux.html|Clickspeak]]. | + | MBROLA est également disponible sous forme de fichiers binaires téléchargeables [[http://tcts.fpms.ac.be/synthesis/mbrola/mbrcopybin.html|première partie de la page]]. ((Il y a aussi des « .deb » [[http://tcts.fpms.ac.be/synthesis/mbrola/mbrcopybin.html|ici]] (troisième ligne linux)...)) On extrait le fichier qui correspond à son [[:architecture matérielle|architecture]] dans un répertoire au choix, de préférence /usr/share/mbrola (là où se fait l'installation par les dépôts). |
- | Compatible :SAPI 5, Java FreeTTS, et ORCA | + | ====Autres==== |
+ | * [[:Orca]] : outil par défaut d'Ubuntu, fonctionne avec les programmes couramment utilisés (Navigateur web, Office, Client mail, terminal, etc.) | ||
+ | * [[https://github.com/BullShark/JSpeak|Jspeak (GPLv3)]] lecteur de presse-papier écrit en [[:java]], attention peut faire planter votre session!! | ||
+ | * [[http://www.letime.net/vocale|Im3jo]] synthétiseur musical et vocal, une application sur le temps jo fixe a deux octets par front, un exemple d'étude sur un système à 2 dimensions. Destiné aux enfants pour jouer avec la musique, il donne aussi la possibilité de modifier la voix en fichier texte. | ||
+ | ==== Logiciels en console ==== | ||
+ | * **[[apt>yasr]]** : Yasr est un lecteur d'écran polyvalent en console pour GNU/Linux et d'autres systèmes d'exploitation de style Unix, | ||
+ | * **[[apt>eflite]]** (emacspeak) s'utilise avec Festival, donc seulement en anglais pour l'instant. | ||
- | Voir le forum Ubuntu anglais pour l'installation de [[http://ubuntuforums.org/archive/index.php/t-363915.html|clicspeak]] : et mettre à jour cette partie. Merci. | + | =====Synthèse vocale intégrée à certaines applications===== |
+ | ==== Synthèse vocale dans Pidgin==== | ||
- | Vous pouvez également utiliser Mathspeak pour la lecture de formule mathématique. | + | La synthèse vocale dans Pidgin avec : |
+ | * [[apt://pidgin-festival|pidgin-festival]] : s'installe en 1 clic (installe Festival et Pidgin s'ils ne sont pas déjà installés). Vous pouvez déjà activer le plugin dans Pidgin, mais vous n'aurez qu'une voix anglaise. Il vous reste donc à installer une voix française et la sélectionner. | ||
- | ===== Intégration dans l'environnement de bureau ===== | + | ==== Dans le dictionnaire Stardict==== |
- | Il est possible d'intégrer ces solutions dans votre environnement de bureau, afin de faire lire le contenu des répertoires ou des pages internet par exemple. | + | Vous pouvez installer : |
- | ==== Pour Gnome - avec des scripts (utilisateur avancé)==== | + | * [[apt>stardict-plugin-festival|le plugin Festival]] |
+ | * [[apt>stardict-plugin-espeak|le plugin Espeak]] | ||
+ | ==== Dans le dictionnaire Goldendict==== | ||
+ | [[:Goldendict]] est un peu le remplaçant de [[:Stardict]] il permet aussi, dans sa dernière version, d'intégrer un synthétiseur vocale, Pour cela : | ||
+ | * Installez [[:eSpeak]] et éventuellement [[#Mbrola]] | ||
+ | * Appuyer sur F3 pour ouvrir la fenêtre des dictionnaires | ||
+ | * Dans l'onglet //Sources// selectionnez //Programmes// | ||
+ | * Cliquez sur //Ajouter//, dans //Type// mettez //Audio// et dans //Ligne de commande// ''espeak -v f %GDWORD%'' ou ''espeak -v mb/mb-fr1 -f %GDWORD%'' si vous souhaitez utiliser Mbrola. | ||
+ | * Fermez et rouvrez Goldendict, vous trouverez maintenant une catégorie dans vos dictionnaires avec un icône d'haut-parleur devant le mot recherché. | ||
- | Voici quelques exemples d'intégration pour l'environnement Gnome. Pensez à adapter la configuration du script à votre convenance. | + | Si vous souhaitez ajouter la lecture en d'autres langues, modifiez la commande **f** par celle de la langue souhaitée. |
- | === Lire le texte sélectionné à l'écran === | ||
- | <note important>L'utilisation du premier script décrit ci-dessous nécessite l'activation de Compiz. | + | ====Synthèse vocale dans LibreOffice ou Apache Openoffice ==== |
- | Vous pouvez néanmoins utiliser comme alternative un lanceur intégré au tableau de bord.</note> | + | |
- | Pour faire marcher ce script, enregistrez-le où vous voulez et rendez-le exécutable. Il faut [[:tutoriel:comment_installer_un_paquet|installer le paquet]] **[[apt://xclip|xclip]]**. | + | Il suffit d'installer l'extension [[http://extensions.libreoffice.org/extension-center/read-text|readtext]] ou [[https://extensions.openoffice.org/fr/node/17608|PicoSvoxOOo]] pour Apache Openoffice. Il fonctionne avec [[:Svoxpico]] mais est compatible avec Festival et Espeak. |
- | Ensuite, aller dans les préférences générales de Compiz (Menu S//ystème → Préférences → Advanced Desktop Effects Settings → General Option//). Sous l'onglet « Commands », choisissez une ligne vide et rentrez-y le chemin vers votre script, sous la forme « /chemin/vers/le/script/nom_du_script ». | + | Une fois [[:libreoffice#installer_une_extension|l'extension installée dans LibreOffice]], vous trouverez une icône dans votre barre d'outils en haut à gauche: |
- | Ensuite, sous l'onglet « Actions » et la sous-partie « Commands », éditez le raccourci correspondant à la ligne où vous avez rentré le script (personnellement, j'utilise Ctrl--D en raccourci clavier, mais c'est vous qui voyez). | + | |
- | L'utilisation est simple, vous sélectionnez du texte à l'écran, puis vous tapez votre raccourci. Une seconde pression sur le raccourci pendant la lecture l'interrompt. | + | |
- | <code bash>#!/bin/bash | + | {{:accessibilite:readtext.png}} |
- | ######### Début de la section de configuration ######### | + | Pour l'utiliser, sélectionner le texte à lire, cliquez sur l'icône (la bulle noire), une fenêtre s'ouvre, cliquez sur **OK**. |
- | # définition de la voix à utiliser par Mbrola, à adapter selon la voix choisie et son chemin | + | ====Synthèse vocale dans Firefox ==== |
- | VOIX=/opt/fr2/fr2 | + | Avec [[:Svoxpico]] l'ajout d'une extension est inutile, **Pico** faisant déjà le travail de lecture.\\ |
- | # TYPE=mb/mb-fr4 # à décommenter si vous avez téléchargé une voix de femme | + | Cependant sachez qu'il existe différents modules qui permettent la synthèse vocale des pages consultées : |
- | # TYPE=mb/mb-fr1 # à décommenter si vous avez téléchargé une voix d'homme | + | * [[https://addons.cdn.mozilla.net/user-media/addons/9759/foxvox-1.7.9.1-fx-linux.xpi?filehash=sha256%3Acd1ca1aeefa654065390af9b680d00d375d43a4bdc871b9ea719565af20dc8bd|foxvox]] |
+ | * [[https://addons.cdn.mozilla.net/user-media/addons/91405/text_to_voice-1.15-fx.xpi?filehash=sha256%3A26dd98884c6cc97dff5c665ac5dc77914530b5ce2dff0aef3b0fef310a9e9f5d|Text to voice]] | ||
- | ######### Fin de la section de configuration ######### | + | Depuis la version 49, le mode Lecture s'agrémente de la parole intégrée dans le navigateur et s'appuyant sur la distribution, etc : Détails sur [[https://blog.mozfr.org/post/2016/09/Mozilla-Firefox-49|le Blog de MozFr]] ; |
- | # on teste si la lecture est en cours, pour l'arrêter le cas échéant | + | Vous pouvez également utiliser Mathspeak pour la lecture de formule mathématique.\\ |
- | if [ ! -z $(ps -A | grep mbrola | awk '{ print $1 }' ) ]; then | + | Faites une recherche dans les modules complémentaires pour voir les différents choix possibles. |
- | kill $(ps -A | grep mbrola | awk '{ print $1 }' ) | + | |
- | else | + | ====Synthèse vocale dans Chromium ==== |
- | # On traduit la sélection en phonèmes grâce à espeak, et on l'envoie à Mbrola | + | Avec [[:Svoxpico]] l'ajout d'une extension est inutile, **Pico** faisant déjà le travail de lecture.\\ |
- | xclip -o | espeak -v $TYPE -s 150 -p 40 "$@" | mbrola $VOIX - -.au | aplay | + | Cependant sachez qu'il existe différentes extensions qui permettent la synthèse vocale des pages consultées : |
- | fi</code> | + | Installez l'extension [[https://chrome.google.com/webstore/detail/speak-text/dchmahpmnpogmfofejmdndonfljkjhdm?hl=fr|SpeakIt]] ou claroRead Chrome. |
- | Edit d'un autre utilisateur : Ou bien ci-dessous, une alternative avec un menu Zenity pour choisir la langue. Il faut bien sûr ne pas oublier de télécharger cette langue (us1 dans mon exemple) comme vous l'avez fait pour la langue fr4. | + | Faites une recherche dans les extensions Chrome pour voir les différents choix possibles. |
- | J'ai aussi changé la boucle "if-else" pour un meilleur fonctionnement si Mbrola est déjà en cours. | + | ===== Intégration dans l'environnement de bureau ===== |
+ | |||
+ | Il est possible d'intégrer ces solutions dans votre environnement de bureau, afin de faire lire le contenu des répertoires ou des pages internet par exemple. | ||
+ | ==== Sous Unity et Gnome==== | ||
+ | Par défaut sous [[:Unity]] et [[:Gnome]] en général, [[:Orca]] permet de lire le contenu affiché à l'écran. | ||
+ | Ce qui suit sont des alternatives, à travers des scripts à intégrer à l'environnement Gnome. Pensez à adapter la configuration du script à votre convenance. Les scripts qui suivent doivent être intégrés à [[:nautilus_scripts|nautilus-scripts]] pour leur utilisation. | ||
+ | FIXME Comment les arrêter? Refaire cette opération pendant la lecture en cours interrompra la lecture. | ||
+ | * Lire le texte sélectionné à l'écran : | ||
+ | FIXME Semble ne pas fonctionner ? | ||
+ | Pour utiliser ce script, il faut [[:tutoriel:comment_installer_un_paquet|installer le paquet]] **[[apt>xclip]]**, puis l'enregistrez selon les indications de cette [[:nautilus_scripts|page]] en lui donnant le nom ''LecteurdeSelection.sh'': | ||
- | <code bash>#!/bin/bash | + | <file bash ~/.local/share/nautilus/scripts/LecteurdeSelection.sh>#!/bin/bash |
##### Affiche le menu Zenity ##### | ##### Affiche le menu Zenity ##### | ||
Ligne 120: | Ligne 167: | ||
2 anglais ` | 2 anglais ` | ||
- | ##### Sélection automatique de la langue choisie dans le menu Zenity ##### | + | ##### Sélection automatique de la langue choisie dans le menu Zenity ##### |
case $choix in | case $choix in | ||
- | 1 ) VOIX=/opt/fr2/fr2 && TYPE=mb/mb-fr4 ;; # pour une voix de femme en français | + | 1 ) VOIX=/usr/share/mbrola/fr4/fr4 && TYPE=mb/mb-fr4 ;; # pour une voix de femme en français |
- | 2 ) VOIX=/opt/us1/us1 && TYPE=mb/mb-us1 ;; # pour une voix de femme en anglais | + | 2 ) VOIX=/usr/share/mbrola/us1/us1 && TYPE=mb/mb-us1 ;; # pour une voix de femme en anglais |
esac | esac | ||
Ligne 135: | Ligne 182: | ||
xclip -o | espeak -v $TYPE -s 150 -p 40 "$@" | mbrola $VOIX - -.au | aplay | xclip -o | espeak -v $TYPE -s 150 -p 40 "$@" | mbrola $VOIX - -.au | aplay | ||
- | </code> | + | </file> |
- | === Lire le contenu d'un fichier texte === | + | * Lire le contenu d'un fichier texte : Pour lire le contenu d'un fichier, enregistrez ce qui suit selon les indications de cette [[:nautilus_scripts|page]] en lui donnant le nom ''Readfile.sh'': |
- | Placez ce script dans « /home/VOTRE_LOGIN/.gnome2/nautilus-scripts/ » et le rendre exécutable. Il permet, par un clic droit sur un fichier, menu //Scripts → nom_de_votre_script//, de lire le contenu de ce fichier. Refaire cette opération pendant la lecture en cours interrompra la lecture. | + | <file bash ~/.local/share/nautilus/scripts/Readfile.sh>#!/bin/bash |
- | + | ||
- | <code bash>#!/bin/bash | + | |
######### Début de la section de configuration ######### | ######### Début de la section de configuration ######### | ||
# définition de la voix à utiliser par Mbrola, à adapter selon la voix choisie et son chemin : | # définition de la voix à utiliser par Mbrola, à adapter selon la voix choisie et son chemin : | ||
- | VOIX=/opt/fr2/fr2 | + | VOIX=/usr/share/mbrola/fr4/fr4 |
+ | #VOIX=/usr/share/mbrola/fr1/fr1 # à décommenter si vous vous voulez une voix d'homme | ||
TYPE=mb/mb-fr4 | TYPE=mb/mb-fr4 | ||
- | # TYPE=mb/mb-fr1 # à décommenter si vous avez téléchargé une voix d'homme | + | # TYPE=mb/mb-fr1 # à décommenter si vous vous voulez une voix d'homme |
######### Fin de la section de configuration ######### | ######### Fin de la section de configuration ######### | ||
Ligne 159: | Ligne 205: | ||
# On traduit le fichier en phonèmes grâce à espeak, et on l'envoie à Mbrola | # On traduit le fichier en phonèmes grâce à espeak, et on l'envoie à Mbrola | ||
espeak -v $TYPE -s 150 -f "$@" | mbrola $VOIX - -.au | aplay | espeak -v $TYPE -s 150 -f "$@" | mbrola $VOIX - -.au | aplay | ||
- | fi</code> | + | fi</file> |
- | === Lire la liste des éléments contenus dans un répertoire === | + | * Lire la liste des éléments contenus dans un dossier : Pour lire le contenu d'un fichier, enregistrez ce qui suit selon les indications de cette [[:nautilus_scripts|page]] en lui donnant le nom ''ReadFolder.sh'': |
- | Placez ce script dans /home/VOTRE_LOGIN/.gnome2/nautilus-scripts/ et le rendre exécutable. Il permet par un clic droit sur un répertoire, menu scripts / nom_de_votre_script de lire le contenu de ce répertoire. Refaire cette opération pendant la lecture en cours interrompra la lecture. | + | <file bash ~/.local/share/nautilus/scripts/ReadFolder.sh>#!/bin/bash |
- | + | ||
- | <code bash>#!/bin/bash | + | |
######### Début de la section de configuration ######### | ######### Début de la section de configuration ######### | ||
# définition de la voix à utiliser par Mbrola, à adapter selon la voix choisie et son chemin | # définition de la voix à utiliser par Mbrola, à adapter selon la voix choisie et son chemin | ||
- | VOIX=/opt/fr2/fr2 | + | VOIX=/usr/share/mbrola/fr4/fr4 |
- | # TYPE=mb/mb-fr4 # à décommenter si vous avez téléchargé une voix de femme | + | TYPE=mb/mb-fr4 # si vous avez téléchargé une voix de femme |
- | # TYPE=mb/mb-fr1 # à décommenter si vous avez téléchargé une voix d'homme | + | # TYPE=mb/mb-fr1 # à décommenter si vous vous voulez une voix d'homme |
######### Fin de la section de configuration ######### | ######### Fin de la section de configuration ######### | ||
Ligne 192: | Ligne 236: | ||
done | done | ||
- | fi</code> | + | fi</file> |
- | === Lire le contenu du presse papier === | + | * Lire le contenu du presse papier ou de la sélection à l'aide d'un raccourci clavier : FIXME ne semble pas fonctionner? |
- | (ou de la sélection, à l'aide d'un raccourci clavier) | + | * [[:tutoriel:comment_installer_un_paquet|installez les paquets]] **[[apt>xclip,recode,xbindkeys|xclip recode xbindkeys]]**. |
- | + | * Enregistrez le script [[http://forum.ubuntu-fr.org/viewtopic.php?pid=3686193#p3686193|suivant]], toujours avec [[:Nautilus_scripts|Nautilus-scripts]] | |
- | == Version améliorée, sans besoin de Compiz == | + | |
- | + | ||
- | Au préalable, [[:tutoriel:comment_installer_un_paquet|installez les paquets]] **[[apt://xclip,recode,xbindkeys|xclip recode xbindkeys]]** | + | |
- | + | ||
- | Ensuite [[#Installation du script diphorect]] <=cliquez ici, ou voir plus haut | + | |
- | + | ||
- | Une fois ces paquets et le script installé, faites : | + | |
- | gedit "$HOME/.gnome2/nautilus-scripts/Lit le presse papier par synthèse vocale" | + | |
- | Copiez-y le script suivant : | + | |
- | [[http://forum.ubuntu-fr.org/viewtopic.php?pid=3686193#p3686193|Lien vers le forum]] | + | |
- | + | ||
- | Sauvegardez et rendez le script exécutable par un : | + | |
- | sudo chmod +X "$HOME/.gnome2/nautilus-scripts/Lit le presse papier par synthèse vocale" | + | |
À partir de là vous pouvez faire lire votre sélection de texte ou le contenu du presse-papier (texte copié par [Ctrl+C] par exemple) en cliquant avec le bouton droit sur le bureau ou une fenêtre nautilus et en choisissant "scripts / lit le contenu..." | À partir de là vous pouvez faire lire votre sélection de texte ou le contenu du presse-papier (texte copié par [Ctrl+C] par exemple) en cliquant avec le bouton droit sur le bureau ou une fenêtre nautilus et en choisissant "scripts / lit le contenu..." | ||
- | Pour définir un raccourci clavier regardez la section xbindkeys de la page [[//tutoriel/comment_creer_raccourcis_clavier]] | + | Pour définir un raccourci clavier reportez-vous à la page [[:xbindkeys]]. |
- | Pour utiliser par exemple [ctrl+F12] pour démarrer arrêter la lecture, utilisez : | + | |
- | <code>"$HOME'/.gnome2/nautilus-scripts/Lit le presse papier par synthèse vocale'" | + | |
- | Control+Mod2 + F12</code> dans le fichier de configuration de xbindkeys. | + | |
- | Et voilà, en principe tout marche ! | + | Voici une liste de fil traitant de divers scripts comportant tous une synthèse vocale : |
- | Que ce soit pour me le faire savoir ou parce qu'au contraire vous avez un problème... N'hésitez pas à m'envoyer un message par ici : [[:utilisateurs:mysteroid]]. | + | * [[https://forum.ubuntu-fr.org/viewtopic.php?id=413946|Script de diction de l'heure]] |
+ | * [[https://forum.ubuntu-fr.org/viewtopic.php?id=413943|Script de diction du pourcentage de batterie restant]] | ||
+ | * [[https://forum.ubuntu-fr.org/viewtopic.php?id=413944|Réglage du volume avec assistance vocale]] | ||
+ | * [[https://forum.ubuntu-fr.org/viewtopic.php?id=413945|Consultation de la boite Gmail]] | ||
+ | * [[https://forum.ubuntu-fr.org/viewtopic.php?id=413950|Aide à la navigation Nautilus]] | ||
+ | ==== Sous KDE ==== | ||
- | Voici une liste de fil traitant de divers scripts comportant tous une synthèse vocale. | + | Grâce à **kttsd** KDE offre une manière élégante et simple de lire du texte affiché à l'écran mais par défaut il utilise [[#Festival]], il n'y a donc pas de français, c'est pourquoi il faudra aussi installer **[[:eSpeak]]**. |
- | === Script de diction de l'heure === | + | Pour le mettre en place il suffit d'[[:tutoriel:comment_installer_un_paquet|installer le paquet]] **[[apt>espeak]]** et **[[apt>kttsd]]** qui contient: |
- | [[http://forum.ubuntu-fr.org/viewtopic.php?id=413946]] | + | * le démon kttsd, |
+ | * Jovie, une application permettant de lire un document copié ou que l'on tape. | ||
+ | * La synthèse vocale sera également intégrée dans [[:Konqueror]] et dans [[:Kate]]. | ||
- | === Script de diction du pourcentage de batterie restant === | + | Pour configurer la synthèse vocale: |
- | [[http://forum.ubuntu-fr.org/viewtopic.php?id=413943]] | + | * Faites un clic droit sur l'icône dans le tableau de bord sur l'icône Jovie, //Configurer Jovie//, dans l'onglet //Locuteurs// entrez un nom, choisissez le locuteur français cliquez sur Ajouter, |
+ | * Pour lire du texte sélectionner du texte et cliquer sur l'icône Jovie ou clic droit, //Lire le contenue du presse-papier//.\\ | ||
+ | * Lorsque vous utilisez le navigateur [[:Konqueror]] de KDE, vous pouvez entendre le texte de la page web affichée. Pour ce faire, assurez-vous que Jovie est lancé. Sélectionnez le texte que vous voulez entendre et choisissez //Outils → Prononcer le texte// dans le menu principal. Après un moment, le texte sélectionné devrait être prononcé. | ||
+ | * Pour prononcer du texte depuis l'éditeur de texte [[:Kate]], assurez-vous que Jovie est lancé et activez l'extension **Synthèse vocale Jovie** de KTextEditor dans la fenêtre de configuration de Kate. Sélectionnez le texte que vous voulez entendre puis choisissez //Outils → Énoncer le texte//. Après un moment, le texte sélectionné devrait être prononcé.\\ | ||
+ | Il n'est pas indispensable de sélectionner du texte. Si vous ne le faites pas, tout le fichier sera prononcé. | ||
- | === Réglage du volume avec assistance vocale === | ||
- | [[http://forum.ubuntu-fr.org/viewtopic.php?id=413944]] | ||
- | |||
- | === Consultation de la boite Gmail === | ||
- | [[http://forum.ubuntu-fr.org/viewtopic.php?id=413945]] | ||
- | |||
- | === Aide à la navigation Nautilus === | ||
- | [[http://forum.ubuntu-fr.org/viewtopic.php?id=413950]] | ||
- | |||
- | |||
- | Voilà en espérant que tout cela pourra servir à d'autre... | ||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | ==== Pour KDE ==== | ||
- | |||
- | KDE offre une manière élégante et simple ((comme toujours))((référence nécessaire !)) de lire du texte affiché à l'écran : KTTS . | ||
- | |||
- | Pour le mettre en place il suffit d'[[:tutoriel:comment_installer_un_paquet|installer les paquets]] **[[apt://kttsd,ksayit|kttsd ksayit]]**. | ||
- | |||
- | * kttsd est le démon. | ||
- | * KSayIt une application permettant de lire un document copié ou que l'on tape. | ||
- | * La synthèse vocale sera également intégrée dans Konqueror et dans Kate[3] | ||
- | |||
- | Commençons par créer un script qui enchaîne les différentes étapes, créer /opt/mbrola/tts et insérer :<code=bash> | ||
- | #!/bin/sh | ||
- | echo $1 | iconv -f UTF-8 -t ISO_8859-1 > $2 | ||
- | /opt/mbrola/lliaphon/bin/lliaphon $2 > /tmp/log 2>&1 | ||
- | /opt/mbrola/mbrola -e -t 0.75 \ | ||
- | -I /opt/mbrola/lliaphon/share/lliaphon/initfile.lia \ | ||
- | /opt/mbrola/fr2/fr2 \ | ||
- | `echo $2|sed s/\.txt$/\.ola/` $3 >> /tmp/log 2>&1 | ||
- | |||
- | </code> | ||
- | Sans oublier de donner les droits d'éxecution : <code> chmod u+x /opt/mbrola/tts</code> | ||
- | |||
- | Pour configurer ktts, deux solutions : | ||
- | |||
- | * à partir de KSayIt : Settings/Configure KSayIt/Launch Control Center | ||
- | * en lançant kttsmgr à partir de la ligne de commande | ||
- | |||
- | Puis nous allons configurer kttsmgr pour qu'il utilise le couple lliaphon/mbrola : | ||
- | |||
- | * Talkers / Ajouter / Langue: autre / Synthesizer: Show all - commande | ||
- | |||
- | * Choisir la langue dans la fenêtre qui apparaît | ||
- | * Entrez la commande : /opt/mbrola/tts %t %f %w | ||
- | *Et voila, relancez Konqueror et vous avez maintenant une option pour lire le texte sélectionné. | ||
- | |||
- | ==== Programme console ==== | ||
- | * yasr | ||
- | * screader | ||
- | * eflite (emacspeak) | ||
- | |||
- | ==== Autres environnements ==== | ||
- | |||
- | FIXME | ||
- | ===== Les logiciels de synthèse vocale en détail ===== | ||
- | |||
- | |||
- | ==== Festival ==== | ||
- | |||
- | **[[http://www.cstr.ed.ac.uk/projects/festival/|Festival]]** est un synthétiseur vocal, pour lequel il n'existe apparemment pas de voix française directement pour l'instant ([[http://phantomsdad.blogspot.com/2005/06/ktts-and-french-connection.html|avis aux amateurs]]...). | ||
- | |||
- | Mais il existe un patch (ou un fork) pour festival afin d'avoir les voix françaises : [[http://www.culte.org/projets/biglux/install/lao/festival.shtml#InstallV|Franfest]]. | ||
- | |||
- | De même festival peut utiliser les voix française de Mbrola - (et Sapi). | ||
- | |||
- | Il peut fonctionner en mode interactif, même si ça n'a pas l'air très intuitif de prime abord... | ||
- | |||
- | Site officiel : http://www.cstr.ed.ac.uk/projects/festival/ | ||
- | |||
- | Pour l'installer, il suffit d'[[:tutoriel:comment_installer_un_paquet|installer le paquet]] **[[apt>festival]]**, et [[apt://festvox-rablpc16k|d'autres voix anglaises]]. ( voir également [[http://en.wikipedia.org/wiki/Festival_Speech_Synthesis_System#See_also|plus d'information relative sur wikipedia]] ) | ||
- | |||
- | Un exemple simple : | ||
- | echo "That's really a pity I'm not able to speak French" | festival --tts | ||
- | |||
- | Pour connaître les options : | ||
- | festival --help | ||
- | <note important>Si vous obtenez une erreur du type **can't open /dev/dsp**, réessayez après avoir fermé toutes les applications (y compris les pages internet nécessitant certains plugins) utilisant le son. | ||
- | </note> | ||
- | |||
- | <note tip>On peut éviter le **can't open /dev/dsp** en redirigeant le son vers ALSA. Pour cela, on demande à festival de sortir le son avec aplay. On créé un fichier de conf festival avec la commande : | ||
- | |||
- | <code>gedit ~/.festivalrc</code> | ||
- | |||
- | Puis, on y met: | ||
- | |||
- | <code> | ||
- | (Parameter.set 'Audio_Command "aplay -t wav -r $SR $FILE") | ||
- | (Parameter.set 'Audio_Method 'Audio_Command) | ||
- | (Parameter.set 'Audio_Required_Format 'wav) | ||
- | </code> | ||
- | </note> | ||
- | |||
- | ==== SVOX pico TTS ==== | ||
- | Assez connu des utilisateurs d'Android, ce synthétiseur vocal offre de bon résultat, surtout en français. | ||
- | |||
- | Licence : [[https://launchpad.net/ubuntu/precise/+source/svox/+copyright]] | ||
- | |||
- | Activez les [[http://doc.ubuntu-fr.org/depots#depots_officiels|dépots multiverse]] (une librairie de transformation rapide en série de Fourier n'est pas libre) puis installez le paquet **[[apt>libttspico-utils]]**. | ||
- | |||
- | |||
- | Un exemple simple : | ||
- | <code> | ||
- | pico2wave -l fr-FR -w test.wav "Faites demi-tour dès que possible !"; | ||
- | play test.wav; | ||
- | </code> | ||
- | |||
- | SVOX a été racheté par Nuance et a plus ou moins abandonnée le projet, certainement pour ne pas concurencer son moteur TTS payant. Google continue de développer ce moteur sur son [[https://android.googlesource.com/platform/external/svox/|Dépôt GIT]]. | ||
- | |||
- | Lien complémentaire : [[http://forum.ubuntu-fr.org/viewtopic.php?id=108430]] | ||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | ==== Espeak ==== | ||
- | **[[http://espeak.sourceforge.net/|Site officiel d' Espeak]]**. | ||
- | |||
- | Ce synthétiseur vocal étant disponible dans les dépôts Ubuntu il vous suffira d'[[:tutoriel:comment_installer_un_paquet|installer son paquet]] : **[[apt>espeak|Espeak]]**. | ||
- | <note>Si vous souhaitez aussi installer une interface graphique pour espeak, reportez-vous à la page << **[[:gespeaker|gespeaker]]** >></note> | ||
- | |||
- | Il suffit ensuite de donner votre texte en pâture à Espeak, soit par l'intermédiaire d'un fichier texte : | ||
- | espeak -v fr -f texte.txt | ||
- | soit directement en ligne de commande : | ||
- | espeak -v fr "Votre texte à lire..." | ||
- | ou encore par un "[[:diagnostic#commande|pipe]]" sur la sortie standard : | ||
- | echo "Lis mon texte" | espeak -v fr | ||
- | |||
- | L'option **-v** définit la langue/voix à utiliser. D'autres options peuvent être utiles, comme l'option **-s** qui permet de définir le nombre de mots par minutes, ou **-p** qui règle la hauteur (grave/aigu) de la voix. Pour plus d'options : | ||
- | espeak --help | ||
- | |||
- | Malheureusement, le rendu d'Espeak n'est pas exceptionnel. Il est possible d'obtenir de meilleurs résultats, notamment en le combinant avec [[#MBROLA]]. | ||
- | |||
- | Si vous recevez le message d'erreur "bt_audio_service_open: connect() failed: Connection refused (111)", enlevez le paquet bluez-alsa (support bluetooth audio). | ||
- | |||
- | Si vous avez lors du lancement une dizaine d'erreurs testant des périphériques bluetooth etc comme ceci : | ||
- | <code> | ||
- | ALSA lib pcm_dmix.c:1018:(snd_pcm_dmix_open) unable to open slave | ||
- | ALSA lib pcm.c:2217:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.rear | ||
- | ALSA lib pcm.c:2217:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.center_lfe | ||
- | ALSA lib pcm.c:2217:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.side | ||
- | ALSA lib audio/pcm_bluetooth.c:1614:(audioservice_expect) BT_GET_CAPABILITIES failed : Input/output error(5) | ||
- | ALSA lib audio/pcm_bluetooth.c:1614:(audioservice_expect) BT_GET_CAPABILITIES failed : Input/output error(5) | ||
- | ALSA lib audio/pcm_bluetooth.c:1614:(audioservice_expect) BT_GET_CAPABILITIES failed : Input/output error(5) | ||
- | ALSA lib audio/pcm_bluetooth.c:1614:(audioservice_expect) BT_GET_CAPABILITIES failed : Input/output error(5) | ||
- | ALSA lib pcm_dmix.c:957:(snd_pcm_dmix_open) The dmix plugin supports only playback stream | ||
- | ALSA lib pcm_dmix.c:1018:(snd_pcm_dmix_open) unable to open slave | ||
- | Cannot connect to server socket err = No such file or directory | ||
- | Cannot connect to server request channel | ||
- | jack server is not running or cannot be started | ||
- | </code> | ||
- | Une première solution (peut être pas optimale ?) consiste alors à lancer espeak ainsi : | ||
- | espeak -v en "Hello i am espeak" --stdout|paplay | ||
- | (après avoir installé paplay via pulseaudio-utils, source : [[http://askubuntu.com/questions/82118/espeak-returns-error-on-ubuntu-server|http://askubuntu.com/questions/82118/espeak-returns-error-on-ubuntu-server]]) | ||
- | |||
- | ==== MBROLA ==== | ||
- | |||
- | Le projet **[[http://tcts.fpms.ac.be/synthesis/mbrola.html|MBROLA]]** est développé à la faculté Polytechnique de Mons, et comporte un grand nombre de langages/voix. | ||
- | |||
- | Site officiel : http://tcts.fpms.ac.be/synthesis/mbrola.html | ||
- | |||
- | <note>MBROLA [[http://eupat.ffii.org/pikta/xrani/mbrola/index.fr.html|n'est pas libre]].</note> | ||
- | |||
- | === Installation === | ||
- | |||
- | Pour l'installer, il suffit d'[[:tutoriel:comment_installer_un_paquet|installer le paquet]] **[[apt://mbrola|mbrola]]**. | ||
- | |||
- | Désormais, un certain nombre de voix pour mbrola - pour diverses langues - sont présentes dans les dépôts (chercher mbrola dans Synaptic). | ||
- | |||
- | <note important>Par défaut les voix de mbrola s'installent dans /usr/share/mbrola/voices/ (Ubuntu 11.10 : dans /usr/share/mbrola/) | ||
- | Si vous les mettez ailleurs, espeak (voir plus bas) ne les trouvera pas.</note> | ||
- | |||
- | En outre l'ensemble des voix sont téléchargeables depuis le site officiel [[http://tcts.fpms.ac.be/synthesis/mbrola/mbrcopybin.html|deuxième partie de la page]]. Extraire le fichier zip dans « /usr/share/mbrola/voices/ » (Attention : les fichiers voix "fr1" "fr2" ... ne doivent pas être dans un sous répertoire, ils doivent être directement sous .../voices/). | ||
- | |||
- | Les voix françaises de [[http://tcts.fpms.ac.be/synthesis/mbrola/mbrcopybin.html|mbrola]] (non libre): | ||
- | * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/fr1/fr1-990204.zip|Voix Mbrola FR1]] : homme , Faculte Polytech. De Mons. | ||
- | * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/fr2/fr2-980806.zip|Voix Mbrola FR2]] : Femme , Celine Egea | ||
- | * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/fr3/fr3-990324.zip|Voix Mbrola FR3]] : homme , Babel Technology | ||
- | * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/fr4/fr4-990521.zip|Voix Mbrola FR4]] : femme , Babel Technology | ||
- | * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/fr5/fr5-991020.zip|Voix Mbrola FR5]] : homme, belge, Faculte Polytech. De Mons | ||
- | * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/fr6/fr6-010330.zip|Voix Mbrola FR6]] : homme , Faculte Polytech. De Mons | ||
- | * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/fr7/fr7-010330.zip|Voix Mbrola FR7]] : homme belge , Faculte Polytech. De Mons | ||
- | * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/ca1/ca1.zip|Voix québecois 1]] : homme , Vincent Arnaud | ||
- | * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/ca2/ca2.zip|Voix québecois 2]] : homme , Silex Creations Inc. | ||
- | |||
- | |||
- | MBROLA est également disponible sous forme de fichiers binaires téléchargeables [[http://tcts.fpms.ac.be/synthesis/mbrola/mbrcopybin.html|première partie de la page]]. ((Il y a aussi des « .deb » [[http://tcts.fpms.ac.be/synthesis/mbrola/mbrcopybin.html|ici]] (troisième ligne linux), je sais pas ce qu'il y a dedans...)) On extrait le fichier qui correspond à son [[architecture matérielle|architecture]] (le plus souvent i386) dans un répertoire au choix, de préférence /usr/bin/ (là où se fait l'installation par les dépôts). | ||
- | |||
- | === Combinaison avec espeak === | ||
- | |||
- | MBROLA ne fait pas directement la transformation de texte en voix. Il traite des fichiers de phonèmes. Une autre application, capable de décomposer du texte en phonème est donc nécessaire. | ||
- | Les voix de mbrola donnent un rendu plus naturel que les voix de espeak (lesquelles sont très "robotiques"), d'où l'intérêt de combiner les deux. | ||
- | |||
- | Avec [[#espeak]] préalablement installé, on peut traduire un texte en phonèmes, en passant à l'option **-v** les arguments **mb/mb-fr1** (voix masculine) ou **mb/mb-fr4** (voix féminine). On crée un fichier de phonème dans un format compatible avec mbrola : | ||
- | |||
- | espeak -v mb/mb-fr4 -f votre_fichier_texte --pho --phonout=texte.pho | ||
- | | ||
- | <note important>Pour être compatible avec mbrola, le fichier .pho (qui est un fichier texte éditable) doit comprendre sur chaque ligne : un phonème suivi de sa durée suivi éventuellement d'indications de hauteur. Mettre en commentaire avec ; les autres lignes. Voir exemple ci-dessous.</note> | ||
- | ---- | ||
- | Fichier exemple : bonjour.pho | ||
- | |||
- | ; bO~Z'ur | ||
- | |||
- | b 65 | ||
- | |||
- | o~ 35 0 94 20 95 40 96 59 97 80 99 100 99 | ||
- | |||
- | Z 65 | ||
- | |||
- | u 40 0 117 80 109 100 109 | ||
- | |||
- | R 65 | ||
- | ---- | ||
- | <note>Cette note concerne la version Hardy, la génération de phonèmes étant boguée, pour les dernières versions (testé sous Maverick), cette manipulation n'est plus nécessaire (vérifiez la présence du répertoire "mb" sous /usr/share/espeak-data/voices/). | ||
- | |||
- | Pour Hardy : les fichiers de configuration d'Espeak pour Mbrola ne sont pas présents dans la version fournie dans les dépôts officiels d'Ubuntu. Pour pouvoir l'utiliser, il faut télécharger [[http://kent.dl.sourceforge.net/sourceforge/espeak/espeak-1.31-linux.zip|la version officielle d'Espeak]]. Ensuite, dézippez le fichier puis copiez le répertoire espeak-data/voices/mb dans le répertoire /usr/share/espeak-data/voices/. (Il vous faudra [[sudo|les droits superutilisateur]]).</note> | ||
- | |||
- | |||
- | Pour faire ensuite parler l'ordinateur, il suffit de lire les phonèmes avec MBROLA et de rediriger la sortie soit vers un lecteur audio : | ||
- | mbrola /usr/share/mbrola/voices/fr1 texte.pho -.au | aplay | ||
- | ou pour passer par pulseaudio | ||
- | mbrola /usr/share/mbrola/voices/fr1 texte.pho -.au | paplay | ||
- | soit vers un fichier wav : | ||
- | mbrola /usr/share/mbrola/voices/fr1 texte.pho texte.wav | ||
- | |||
- | À la place d'utiliser un fichier contenant des phonèmes, on peut aussi directement envoyer à Mbrola la sortie standard : | ||
- | espeak -v mb/mb-fr1 -f votre_fichier_texte --pho | mbrola /usr/share/mbrola/voices/fr1 - -.au | aplay | ||
- | |||
- | ou | ||
- | |||
- | espeak -v mb/mb-fr1 'votre texte ici' --pho | mbrola /usr/share/mbrola/voices/fr1 - -.au | aplay | ||
- | | ||
- | <note help>Apparemment il n'y a pas besoin d'invoquer mbrola : espeak peut utiliser les voix mbrola lui-même (si elles ont été installées au bon endroit) : <code>espeak -v mb/mb-fr1 -f votre_fichier_texte</code> | ||
- | La voix féminine fr4 reste masculine si on n'utilise pas la commande mbrola.</note> | ||
- | |||
- | Pour plus d'information sur les options disponibles : | ||
- | man mbrola | ||
- | |||
- | ---- | ||
- | |||
- | <note warning>Il semble que l'expression "on a" génère un phonème "n2" illisible par Mbrola. Pour contourner ce problème si vous l'avez également, voir ci-dessous</note> | ||
- | == Solution n°1 == | ||
- | On peut ajouter les options((cf paragraphe « Renaming and Cloning phonemes » voir [[http://nautilux.physik.uni-freiburg.de/~eric/kabuff/texte/vocal/mbrola.html|ce message en anglais]] ou [[http://stuff.mit.edu/afs/sipb/user/kenta/festival/mbrola/readme.txt|idem]])) -e, -C et -R à Mbrola : | ||
- | * -e = IGNORE fatal errors on unkown diphone | ||
- | * -C CL = Phoneme CLONE list of the form a A b B ... | ||
- | * -R RL = Phoneme RENAME list of the form a A b B ... | ||
- | exemple : <code>mbrola -e -C "n n2 s z3" /opt/fr2/fr2 - -.au</code> | ||
- | == Solution n°2 == | ||
- | substituer (commande « s ») à l’aide des expressions rationnelles/régulières de [[sed]] aux deux codes de phonèmes problématiques (en début de ligne), « n2 » et « z3 » respectivement « n » et « s » : | ||
- | <code>[entrée] | sed -e "s/^n2 /n /"| sed -e "s/^z3 /s /" | [sortie]</code> | ||
- | « ^ » dénotant le début de ligne. | ||
- | |||
- | Soit : | ||
- | <code>espeak -v mb/mb-fr1 'votre texte ici' | sed -e "s/^n2 /n /"| sed -e "s/^z3 /s /" | mbrola /usr/share/mbrola/voices/fr1 - -.au | aplay</code> | ||
- | NB cette solution n’implique pas l’emploi d’un fichier de phonèmes intermédiaire | ||
- | == Solution n°3 == | ||
- | 1- Il vous faudra dans ce cas procéder en 2 étapes, créez un fichier des phonèmes de votre texte à lire par : | ||
- | espeak -v mb/mb-fr1 -f "votre_fichier_texte" > texte.pho | ||
- | ou | ||
- | espeak -v mb/mb-fr1 "votre texte à lire ici..." > texte.pho | ||
- | |||
- | 2- Envoi des phonèmes (corrigés au passage) vers Mbrola puis aplay pour lecture. | ||
- | diphorect.sh "texte.pho" | mbrola /opt/fr1/fr1 - -.au | aplay | ||
- | <note help>Il vous faudra au préalable installer le script "diphorect" sur votre ordinateur comme indiqué ci-dessous</note> | ||
- | |||
- | === Installation du script diphorect === | ||
- | == script de conversion du phonème problématique "n2" == | ||
- | |||
- | [[:tutoriel:comment_modifier_un_fichier|Créez (avec les droits administrateur) le fichier]] /usr/bin/diphorect.sh | ||
- | |||
- | Copiez et collez le script que vous trouverez ici : | ||
- | |||
- | [[http://forum.ubuntu-fr.org/viewtopic.php?pid=3686164#p3686164|Forum, sujet Diphorect]] | ||
- | |||
- | Ensuite rendez le script exécutable par : | ||
- | sudo chmod +x /usr/bin/diphorect.sh | ||
- | |||
- | Et voilà, vous êtes prêt ! ;-) | ||
===== Voir aussi ===== | ===== Voir aussi ===== | ||
Ligne 523: | Ligne 276: | ||
Pages officielles de ces projets, et d'autres : | Pages officielles de ces projets, et d'autres : | ||
+ | * **[[http://espeak.sourceforge.net/|Site officiel d'Espeak]]**. | ||
* [[http://tcts.fpms.ac.be/synthesis/mbrola.html|mbrola]] (en) | * [[http://tcts.fpms.ac.be/synthesis/mbrola.html|mbrola]] (en) | ||
- | * [[http://www.cstr.ed.ac.uk/projects/festival/|festival]] (en) / [[http://www.speech.cs.cmu.edu/flite/|flite]] (en) / [[http://festvox.org|Festvox]] (en) | + | * [[https://www.cstr.ed.ac.uk/projects/festival/|festival]] (en) / [[http://www.speech.cs.cmu.edu/flite/|flite]] (en) / [[http://festvox.org|Festvox]] (en) |
- | * [[https://gna.org/projects/lliaphon/|LLiaPhon]] : Transforme un texte en description phonetic (à utiliser avec un autre logiciel ). Conçu pour le français. | + | * [[https://gna.org/projects/lliaphon/|LLiaPhon]] : Transforme un texte en description phonetic (à utiliser avec un autre logiciel). Conçu pour le français. |
* [[http://pages.videotron.com/fluxnic/cicero/|Cicero TTS]] | * [[http://pages.videotron.com/fluxnic/cicero/|Cicero TTS]] | ||
* [[http://epos.ure.cas.cz|epos]] (en) (Tchèque et Slovaque) | * [[http://epos.ure.cas.cz|epos]] (en) (Tchèque et Slovaque) | ||
* [[http://freetts.sourceforge.net/docs/index.php|FreeTTS]] (en-us) (en java) | * [[http://freetts.sourceforge.net/docs/index.php|FreeTTS]] (en-us) (en java) | ||
- | * [[http://forum.ubuntu-fr.org/viewtopic.php?id=128037|xclip-speech, synthèse vocale]] | + | * [[https://forum.ubuntu-fr.org/viewtopic.php?id=128037|xclip-speech, synthèse vocale]] |
* [[http://bothari.free.fr/weblog/post/Ubuntu-Text-to-Speech-%28TTS%29|Synthèse vocale en python (espeak + mbrola + speechdispatcher et son wrapper python)]] | * [[http://bothari.free.fr/weblog/post/Ubuntu-Text-to-Speech-%28TTS%29|Synthèse vocale en python (espeak + mbrola + speechdispatcher et son wrapper python)]] | ||
Ligne 539: | Ligne 293: | ||
* [[http://wiki.eagle-usb.org/wakka.php?wiki=SyntheseParole|Wiki eagle usb]] | * [[http://wiki.eagle-usb.org/wakka.php?wiki=SyntheseParole|Wiki eagle usb]] | ||
- | ==== Tutoriaux ==== | + | ==== Tutoriels ==== |
* [[http://blinuxman.net/edu/fr/EduVocale.txt|La fiche EDU pour une solution vocale en Français sous la console GNU/Linux]] | * [[http://blinuxman.net/edu/fr/EduVocale.txt|La fiche EDU pour une solution vocale en Français sous la console GNU/Linux]] | ||
* [[http://kubuntu.free.fr/blog/index.php/2006/09/24/121-synthese-vocale-en-francais-sous-linux|Synthèse vocale en français sous Linux]] (plutot kde ) | * [[http://kubuntu.free.fr/blog/index.php/2006/09/24/121-synthese-vocale-en-francais-sous-linux|Synthèse vocale en français sous Linux]] (plutot kde ) | ||
* [[http://bothari.free.fr/weblog/post/Ubuntu-Text-to-Speech-%28TTS%29|(fr)Ubuntu Text-to-Speech (TTS)]] | * [[http://bothari.free.fr/weblog/post/Ubuntu-Text-to-Speech-%28TTS%29|(fr)Ubuntu Text-to-Speech (TTS)]] | ||
- | * [[http://ftp.traduc.org/doc-vf/gazette-linux/html/2005/114/lg114-D.html|Faites parler votre shell avec Festival]] | + | * [[https://ftp.traduc.org/doc-vf/gazette-linux/html/2005/114/lg114-D.html|Faites parler votre shell avec Festival]] |
====Ressources : des voix ==== | ====Ressources : des voix ==== | ||
* Il existe la voix française [[http://rs211.rapidshare.com/files/108331417/Virginie.exe|virginie de microsoft(sapi) : gratuit mais non libre]]. ([[http://sharebee.com/789d0c18|lien miroir]] ) | * Il existe la voix française [[http://rs211.rapidshare.com/files/108331417/Virginie.exe|virginie de microsoft(sapi) : gratuit mais non libre]]. ([[http://sharebee.com/789d0c18|lien miroir]] ) | ||
- | * [[http://activex.microsoft.com/activex/controls/agent2/lhttsfrf.exe|Lernout & Hauspie TruVoice TTS engine (voix gratuite française)]] | + | * Lernout & Hauspie TruVoice TTS engine (voix gratuite française) : http://activex.microsoft.com/activex/controls/agent2/lhttsfrf.exe |
- | * [[http://www.cross-plus-a.com/balabolka_fr.htm|Trouver d'autres voix sapi sur ce site]]. | + | * Trouver d'autres voix sapi sur ce site : http://www.cross-plus-a.com/fr/balabolka.htm (Anciennement: http://www.cross-plus-a.com/balabolka_fr.htm) |
- | * Des voix sur [[http://www.datafurnace.net.au/sayzme/html/voices.html|sayz me]]. | + | * Des voix sur sayz me : http://www.datafurnace.net.au/sayzme/html/voices.html |
- | Les voix françaises de [[http://tcts.fpms.ac.be/synthesis/mbrola/mbrcopybin.html|mbrola]] (non libre): | ||
- | * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/fr1/fr1-990204.zip|Voix Mbrola FR1]] : homme , Faculte Polytech. De Mons. | ||
- | * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/fr2/fr2-980806.zip|Voix Mbrola FR2]] : Femme , Celine Egea | ||
- | * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/fr3/fr3-990324.zip|Voix Mbrola FR3]] : homme , Babel Technology | ||
- | * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/fr4/fr4-990521.zip|Voix Mbrola FR4]] : femme , Babel Technology | ||
- | * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/fr5/fr5-991020.zip|Voix Mbrola FR5]] : homme, belge, Faculte Polytech. De Mons | ||
- | * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/fr6/fr6-010330.zip|Voix Mbrola FR6]] : homme , Faculte Polytech. De Mons | ||
- | * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/fr7/fr7-010330.zip|Voix Mbrola FR7]] : homme belge , Faculte Polytech. De Mons | ||
- | * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/ca1/ca1.zip|Voix québecois 1]] : homme , Vincent Arnaud | ||
- | * [[http://tcts.fpms.ac.be/synthesis/mbrola/dba/ca2/ca2.zip|Voix québecois 2]] : homme , Silex Creations Inc. | ||
===== Pages en rapport ===== | ===== Pages en rapport ===== | ||
- | [[reconnaissance_vocale|Reconnaissance vocale]] (Opération inverse) | + | [[:reconnaissance_vocale|Reconnaissance vocale]] (Opération inverse) |
{{topic>synthèse_vocale}} | {{topic>synthèse_vocale}} | ||