Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
synthese_vocale [Le 14/05/2019, 22:39] 193.250.138.66 [eSpeak] |
synthese_vocale [Le 08/09/2024, 12:30] (Version actuelle) moths-art suppression d'un titre qui n'a aucun sens |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | {{tag>portail accessibilité audio multimédia}} | + | {{tag>portail accessibilité audio multimédia synthèse vocale tts}} |
---- | ---- | ||
Ligne 14: | Ligne 14: | ||
Pour en savoir plus : [[wpfr>Synthèse_vocale|Wikipedia]] (fr), [[http://download.gna.org/lliaphon/devguide.pdf|Llia-Phon]] (fr). | Pour en savoir plus : [[wpfr>Synthèse_vocale|Wikipedia]] (fr), [[http://download.gna.org/lliaphon/devguide.pdf|Llia-Phon]] (fr). | ||
- | Ce document a pour but de présenter la mise en œuvre de quelques solutions. | + | Ce document a pour but de présenter la mise en œuvre de quelques solutions. |
Comme la [[:reconnaissance vocale]] va de pair avec la **synthèse vocale** vous serez sans doute intéressé par le site [[http://www.voxforge.org/fr|VoxForge.org]]. Vous pouvez y enregistrer un texte qui permettra d'intégrer votre voix dans les modèles de reconnaissance vocale, et ainsi les améliorer. | Comme la [[:reconnaissance vocale]] va de pair avec la **synthèse vocale** vous serez sans doute intéressé par le site [[http://www.voxforge.org/fr|VoxForge.org]]. Vous pouvez y enregistrer un texte qui permettra d'intégrer votre voix dans les modèles de reconnaissance vocale, et ainsi les améliorer. | ||
Ligne 21: | Ligne 21: | ||
</note> | </note> | ||
- | ===== Logiciels de synthèse vocale ===== | + | ===== Logiciels de synthèse vocale ==== |
====Svoxpico==== | ====Svoxpico==== | ||
- | [[:Svoxpico]]: le lecteur vocal d'Android, de loin celui qui donne les meilleurs résultats, permet de lire n'importe quelle sélection, | + | [[:Svoxpico]]: le lecteur vocal d'Android, de loin celui qui donne les meilleurs résultats, permet de lire n'importe quelle sélection. |
+ | |||
+ | ====gSpeech==== | ||
+ | {{ :applications:gspeech.png?50}} | ||
+ | |||
+ | **gSpeech** est une GUI par dessus **Svoxpico** tout en améliorant sa prononciation sur les mots/expressions les plus courantes. | ||
+ | Une description de **gSpeech** est disponible ici : [[https://wiki.primtux.fr/doku.php/gspeech|présentation de gSpeech]]. | ||
+ | Un descriptif plus technique de l'avancement est également disponible sur [[https://linuxfr.org/news/gspeech-passe-en-0-10|linuxfr]] | ||
+ | ===Via un ppa=== | ||
+ | Vous pouvez installer gSpeech en ajoutant un ppa : | ||
+ | * [[:PPA|Ajouter le PPA]] **ppa:jerem-ferry/tts**((https://launchpad.net/~jerem-ferry/+archive/ubuntu/tts)) dans vos sources de logiciels; | ||
+ | * [[:tutoriel:comment_installer_un_paquet|Installer le paquet]] **[[apt>gspeech]]**. | ||
+ | |||
+ | Vous pouvez trouver les sources sur [[https://github.com/mothsart/gSpeech.git|Github]]. | ||
====eSpeak==== | ====eSpeak==== | ||
* [[:Espeak]] est disponible dans les dépôts, il propose une voix plutôt "robotique", mais combiné avec mbrola, il peut donner de bons résultats. | * [[:Espeak]] est disponible dans les dépôts, il propose une voix plutôt "robotique", mais combiné avec mbrola, il peut donner de bons résultats. | ||
- | *[[:Gespeaker]] : Interface graphique à eSpeak, pour faire lire le texte que vous tapez dans une case texte. | ||
====Festival==== | ====Festival==== | ||
- | * **[[http://www.cstr.ed.ac.uk/projects/festival/|Festival]]** est un synthétiseur vocal, pour lequel il n'existe apparemment pas de voix française directement pour l'instant ([[http://phantomsdad.blogspot.com/2005/06/ktts-and-french-connection.html|avis aux amateurs]]...). | + | * **[[https://www.cstr.ed.ac.uk/projects/festival/|Festival]]** est un synthétiseur vocal, pour lequel il n'existe apparemment pas de voix française directement pour l'instant ([[http://phantomsdad.blogspot.com/2005/06/ktts-and-french-connection.html|avis aux amateurs]]...). |
Mais il existe un [[wpfr>Fork (développement logiciel)|fork]] pour festival afin d'avoir les voix françaises : Où ? | Mais il existe un [[wpfr>Fork (développement logiciel)|fork]] pour festival afin d'avoir les voix françaises : Où ? | ||
Ligne 52: | Ligne 64: | ||
==== MBROLA ==== | ==== MBROLA ==== | ||
- | Le projet **[[http://tcts.fpms.ac.be/synthesis/mbrola.html|MBROLA]]** a été développé à l'Université de Mons ([[https://web.umons.ac.be/numediart/fr/|Institut NUMEDIART]]), et comporte un grand nombre de langages/voix. | + | Le projet **[[http://tcts.fpms.ac.be/synthesis/mbrola.html|MBROLA]]** a été développé à l'Université de Mons ([[https://web.umons.ac.be/numediart/fr/|Institut NUMEDIART]]), et comporte un grand nombre de langages/voix. |
En 2019, **MBROLA a été rendu disponible en [[https://github.com/numediart/MBROLA|open source sur github]] sous license GNU GPL3 Afero.** | En 2019, **MBROLA a été rendu disponible en [[https://github.com/numediart/MBROLA|open source sur github]] sous license GNU GPL3 Afero.** | ||
Ligne 79: | Ligne 91: | ||
- | ====Autres==== | + | ====Autres==== |
* [[:Orca]] : outil par défaut d'Ubuntu, fonctionne avec les programmes couramment utilisés (Navigateur web, Office, Client mail, terminal, etc.) | * [[:Orca]] : outil par défaut d'Ubuntu, fonctionne avec les programmes couramment utilisés (Navigateur web, Office, Client mail, terminal, etc.) | ||
- | * [[:abuledu-volubil|Volubil]] : outil destiné aux enfants. | ||
* [[https://github.com/BullShark/JSpeak|Jspeak (GPLv3)]] lecteur de presse-papier écrit en [[:java]], attention peut faire planter votre session!! | * [[https://github.com/BullShark/JSpeak|Jspeak (GPLv3)]] lecteur de presse-papier écrit en [[:java]], attention peut faire planter votre session!! | ||
* [[http://www.letime.net/vocale|Im3jo]] synthétiseur musical et vocal, une application sur le temps jo fixe a deux octets par front, un exemple d'étude sur un système à 2 dimensions. Destiné aux enfants pour jouer avec la musique, il donne aussi la possibilité de modifier la voix en fichier texte. | * [[http://www.letime.net/vocale|Im3jo]] synthétiseur musical et vocal, une application sur le temps jo fixe a deux octets par front, un exemple d'étude sur un système à 2 dimensions. Destiné aux enfants pour jouer avec la musique, il donne aussi la possibilité de modifier la voix en fichier texte. | ||
Ligne 87: | Ligne 98: | ||
==== Logiciels en console ==== | ==== Logiciels en console ==== | ||
* **[[apt>yasr]]** : Yasr est un lecteur d'écran polyvalent en console pour GNU/Linux et d'autres systèmes d'exploitation de style Unix, | * **[[apt>yasr]]** : Yasr est un lecteur d'écran polyvalent en console pour GNU/Linux et d'autres systèmes d'exploitation de style Unix, | ||
- | * **[[apt>screader]]** : Le programme de fond screader lit l'écran et transmet l'information à un paquet de synthèse vocale logicielle (Comme « festival ») ou à un synthétiseur vocal matériel. | ||
* **[[apt>eflite]]** (emacspeak) s'utilise avec Festival, donc seulement en anglais pour l'instant. | * **[[apt>eflite]]** (emacspeak) s'utilise avec Festival, donc seulement en anglais pour l'instant. | ||
Ligne 157: | Ligne 167: | ||
2 anglais ` | 2 anglais ` | ||
- | ##### Sélection automatique de la langue choisie dans le menu Zenity ##### | + | ##### Sélection automatique de la langue choisie dans le menu Zenity ##### |
case $choix in | case $choix in | ||
Ligne 238: | Ligne 248: | ||
Voici une liste de fil traitant de divers scripts comportant tous une synthèse vocale : | Voici une liste de fil traitant de divers scripts comportant tous une synthèse vocale : | ||
- | * [[http://forum.ubuntu-fr.org/viewtopic.php?id=413946|Script de diction de l'heure]] | + | * [[https://forum.ubuntu-fr.org/viewtopic.php?id=413946|Script de diction de l'heure]] |
- | * [[http://forum.ubuntu-fr.org/viewtopic.php?id=413943|Script de diction du pourcentage de batterie restant]] | + | * [[https://forum.ubuntu-fr.org/viewtopic.php?id=413943|Script de diction du pourcentage de batterie restant]] |
- | * [[http://forum.ubuntu-fr.org/viewtopic.php?id=413944|Réglage du volume avec assistance vocale]] | + | * [[https://forum.ubuntu-fr.org/viewtopic.php?id=413944|Réglage du volume avec assistance vocale]] |
- | * [[http://forum.ubuntu-fr.org/viewtopic.php?id=413945|Consultation de la boite Gmail]] | + | * [[https://forum.ubuntu-fr.org/viewtopic.php?id=413945|Consultation de la boite Gmail]] |
- | * [[http://forum.ubuntu-fr.org/viewtopic.php?id=413950|Aide à la navigation Nautilus]] | + | * [[https://forum.ubuntu-fr.org/viewtopic.php?id=413950|Aide à la navigation Nautilus]] |
==== Sous KDE ==== | ==== Sous KDE ==== | ||
Ligne 254: | Ligne 264: | ||
Pour configurer la synthèse vocale: | Pour configurer la synthèse vocale: | ||
- | * Faites un clic droit sur l'icône dans le tableau de bord sur l'icône Jovie, //Configurer Jovie//, dans l'onglet //Locuteurs// entrez un nom, choisissez le locuteur français cliquez sur Ajouter, | + | * Faites un clic droit sur l'icône dans le tableau de bord sur l'icône Jovie, //Configurer Jovie//, dans l'onglet //Locuteurs// entrez un nom, choisissez le locuteur français cliquez sur Ajouter, |
* Pour lire du texte sélectionner du texte et cliquer sur l'icône Jovie ou clic droit, //Lire le contenue du presse-papier//.\\ | * Pour lire du texte sélectionner du texte et cliquer sur l'icône Jovie ou clic droit, //Lire le contenue du presse-papier//.\\ | ||
* Lorsque vous utilisez le navigateur [[:Konqueror]] de KDE, vous pouvez entendre le texte de la page web affichée. Pour ce faire, assurez-vous que Jovie est lancé. Sélectionnez le texte que vous voulez entendre et choisissez //Outils → Prononcer le texte// dans le menu principal. Après un moment, le texte sélectionné devrait être prononcé. | * Lorsque vous utilisez le navigateur [[:Konqueror]] de KDE, vous pouvez entendre le texte de la page web affichée. Pour ce faire, assurez-vous que Jovie est lancé. Sélectionnez le texte que vous voulez entendre et choisissez //Outils → Prononcer le texte// dans le menu principal. Après un moment, le texte sélectionné devrait être prononcé. | ||
Ligne 268: | Ligne 278: | ||
* **[[http://espeak.sourceforge.net/|Site officiel d'Espeak]]**. | * **[[http://espeak.sourceforge.net/|Site officiel d'Espeak]]**. | ||
* [[http://tcts.fpms.ac.be/synthesis/mbrola.html|mbrola]] (en) | * [[http://tcts.fpms.ac.be/synthesis/mbrola.html|mbrola]] (en) | ||
- | * [[http://www.cstr.ed.ac.uk/projects/festival/|festival]] (en) / [[http://www.speech.cs.cmu.edu/flite/|flite]] (en) / [[http://festvox.org|Festvox]] (en) | + | * [[https://www.cstr.ed.ac.uk/projects/festival/|festival]] (en) / [[http://www.speech.cs.cmu.edu/flite/|flite]] (en) / [[http://festvox.org|Festvox]] (en) |
* [[https://gna.org/projects/lliaphon/|LLiaPhon]] : Transforme un texte en description phonetic (à utiliser avec un autre logiciel). Conçu pour le français. | * [[https://gna.org/projects/lliaphon/|LLiaPhon]] : Transforme un texte en description phonetic (à utiliser avec un autre logiciel). Conçu pour le français. | ||
* [[http://pages.videotron.com/fluxnic/cicero/|Cicero TTS]] | * [[http://pages.videotron.com/fluxnic/cicero/|Cicero TTS]] | ||
* [[http://epos.ure.cas.cz|epos]] (en) (Tchèque et Slovaque) | * [[http://epos.ure.cas.cz|epos]] (en) (Tchèque et Slovaque) | ||
* [[http://freetts.sourceforge.net/docs/index.php|FreeTTS]] (en-us) (en java) | * [[http://freetts.sourceforge.net/docs/index.php|FreeTTS]] (en-us) (en java) | ||
- | * [[http://forum.ubuntu-fr.org/viewtopic.php?id=128037|xclip-speech, synthèse vocale]] | + | * [[https://forum.ubuntu-fr.org/viewtopic.php?id=128037|xclip-speech, synthèse vocale]] |
* [[http://bothari.free.fr/weblog/post/Ubuntu-Text-to-Speech-%28TTS%29|Synthèse vocale en python (espeak + mbrola + speechdispatcher et son wrapper python)]] | * [[http://bothari.free.fr/weblog/post/Ubuntu-Text-to-Speech-%28TTS%29|Synthèse vocale en python (espeak + mbrola + speechdispatcher et son wrapper python)]] | ||
Ligne 288: | Ligne 298: | ||
* [[http://kubuntu.free.fr/blog/index.php/2006/09/24/121-synthese-vocale-en-francais-sous-linux|Synthèse vocale en français sous Linux]] (plutot kde ) | * [[http://kubuntu.free.fr/blog/index.php/2006/09/24/121-synthese-vocale-en-francais-sous-linux|Synthèse vocale en français sous Linux]] (plutot kde ) | ||
* [[http://bothari.free.fr/weblog/post/Ubuntu-Text-to-Speech-%28TTS%29|(fr)Ubuntu Text-to-Speech (TTS)]] | * [[http://bothari.free.fr/weblog/post/Ubuntu-Text-to-Speech-%28TTS%29|(fr)Ubuntu Text-to-Speech (TTS)]] | ||
- | * [[http://ftp.traduc.org/doc-vf/gazette-linux/html/2005/114/lg114-D.html|Faites parler votre shell avec Festival]] | + | * [[https://ftp.traduc.org/doc-vf/gazette-linux/html/2005/114/lg114-D.html|Faites parler votre shell avec Festival]] |
====Ressources : des voix ==== | ====Ressources : des voix ==== |