Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
reconnaissance_vocale [Le 11/12/2019, 15:46] YannUbuntu Ajout de NoComprendo |
reconnaissance_vocale [Le 15/02/2024, 18:30] (Version actuelle) bjacquem [Dictée vocale en ligne] |
||
---|---|---|---|
Ligne 8: | Ligne 8: | ||
Cette page est consacrée à la **reconnaissance vocale** sous Ubuntu et plus généralement sous Linux. | Cette page est consacrée à la **reconnaissance vocale** sous Ubuntu et plus généralement sous Linux. | ||
- | [[:KDE]] intègre un module de reconnaissance vocale, basique et simple à utiliser, basé sur [[http://en.wikipedia.org/wiki/CMU_Sphinx|CMU Sphinx]]. | + | [[:KDE]] intègre un module de reconnaissance vocale, basique et simple à utiliser, basé sur [[https://en.wikipedia.org/wiki/CMU_Sphinx|CMU Sphinx]]. |
Enfin, pour aider l'amélioration des modèles libres de reconnaissance vocale pour Linux, consultez le site [[http://www.voxforge.org/fr|Voxforge.org]]. | Enfin, pour aider l'amélioration des modèles libres de reconnaissance vocale pour Linux, consultez le site [[http://www.voxforge.org/fr|Voxforge.org]]. | ||
Ligne 20: | Ligne 20: | ||
* [[:NoComprendo]] : commande vocale pour Linux | * [[:NoComprendo]] : commande vocale pour Linux | ||
* [[:Perlbox]] : permet de commander l'environnement [[KDE]] par la voix. Basé sur Sphinx. | * [[:Perlbox]] : permet de commander l'environnement [[KDE]] par la voix. Basé sur Sphinx. | ||
- | * [[Simon]] : permet de contrôler de multiples applications (firefox, rhythmbox, ...) ainsi que le bureau aisément. Disponible [[http://sourceforge.net/projects/speech2text/]] | + | * [[Simon]] : permet de contrôler de multiples applications (firefox, rhythmbox, ...) ainsi que le bureau aisément. Disponible [[https://sourceforge.net/projects/speech2text/]] |
* **VoiceExecute** : permet de lancer des logiciels par la voix | * **VoiceExecute** : permet de lancer des logiciels par la voix | ||
* Google search sous [[google_chrome|Chrome]] : le moteur de recherche Google intègre désormais un bouton pour faire une recherche vocale sous Chrome. | * Google search sous [[google_chrome|Chrome]] : le moteur de recherche Google intègre désormais un bouton pour faire une recherche vocale sous Chrome. | ||
- | * [[https://github.com/kalliope-project/kalliope|Kalliope]] est un framework permettant de créer son propre assistant personnel. Le programme supporte plusieurs langues, possède des modules de reconnaissance vocale(STT) offline et self-hosted. | + | * [[https://github.com/kalliope-project/kalliope|Kalliope]] est un framework permettant de créer son propre assistant personnel. Le programme supporte plusieurs langues, possède des modules de reconnaissance vocale(STT) offline et self-hosted. |
* [[https://github.com/claritylab/lucida|Lucida]] est un assistant personnel intelligent basé sur la parole et la vision inspiré par [[http://sirius.clarity-lab.org/|Sirius]]. Visitez le [[http://lucida.ai/|site Web]] pour le tutoriel, et [[http://groups.google.com/forum/#!forum/lucida-users|Lucida-users]] pour de l'aide. Le projet est publié sous [[https://github.com/claritylab/lucida/blob/master/LICENSE|licence BSD]], sauf pour certains sous-modules qui contiennent leurs propres licence. | * [[https://github.com/claritylab/lucida|Lucida]] est un assistant personnel intelligent basé sur la parole et la vision inspiré par [[http://sirius.clarity-lab.org/|Sirius]]. Visitez le [[http://lucida.ai/|site Web]] pour le tutoriel, et [[http://groups.google.com/forum/#!forum/lucida-users|Lucida-users]] pour de l'aide. Le projet est publié sous [[https://github.com/claritylab/lucida/blob/master/LICENSE|licence BSD]], sauf pour certains sous-modules qui contiennent leurs propres licence. | ||
* [[http://jasperproject.github.io/|Jasper]], pour raspberry | * [[http://jasperproject.github.io/|Jasper]], pour raspberry | ||
- | ==== Pour la dictée vocale ==== | + | ==== Pour la dictée vocale via une application ==== |
- | * **X voice** : utilise une librairie ViaVoice d'IBM qui est payante. | + | * **[[https://flathub.org/apps/net.mkiol.SpeechNote|Speech Note]]**, est une application qui permet de convertir ce que vous dictez en texte. Elle est présente dans les dépôts sous forme de [[Flatpak]], vous pouvez l'installer via [[gnome-software|logiciel]]. |
+ | * **X voice** : utilise une librairie ViaVoice d'IBM qui est payante. | ||
* [[wp>Dragon_NaturallySpeaking|Dragon Naturally Speaking]] : fonctionne [[http://appdb.winehq.org/appview.php?versionId=3227|moyennement]] sous Wine, il permet de dicter dans NotePad par exemple. Il peut aussi être utilisé grâce à l'interface [[http://thenerdshow.com/platypus.html|Platypus]]. | * [[wp>Dragon_NaturallySpeaking|Dragon Naturally Speaking]] : fonctionne [[http://appdb.winehq.org/appview.php?versionId=3227|moyennement]] sous Wine, il permet de dicter dans NotePad par exemple. Il peut aussi être utilisé grâce à l'interface [[http://thenerdshow.com/platypus.html|Platypus]]. | ||
- | * **[[https://www.thenerdshow.com/freespeech.html|FreeSpeech]]**. | + | * **[[https://www.thenerdshow.com/freespeech.html|FreeSpeech]]** utilise les librairies [[pocketsphinx|pocketsphinx]]. |
+ | * **[[https://alphacephei.com/vosk/|VOSK]]** : [[https://forge.chapril.org/tykayn/transcription|mode d'emploi pour transcrire un fichier audio]] par Tykayn | ||
+ | * **[[https://doc.linto.ai/#/services/linstt|LinSTT]]** : service Speech-To-Text de l'assistant vocal LinTO | ||
- | ==== Autre ==== | + | ==== Dictée vocale en ligne ==== |
+ | |||
+ | * [[https://speechnotes.co/fr/|SpeechNotes]] ou [[https://voicenotebook.com/|VoiceNotebook]] marchent dans Chrome/Chromium (pas dans Firefox). Non libres. Basés sur le moteur de Google. | ||
+ | * [[https://docs.google.com/document/?usp=mkt_docs|Google Docs]] : une fois un document créé ou ouvert, aller dans le menu //Outils// puis //Saisie vocale// | ||
+ | * [[https://voicenotebook.com/|Voice notebook]] : reconnaissance vocale via une application (multi plateforme), ou extension Chrome | ||
+ | |||
+ | |||
+ | ==== Autres ==== | ||
* [[http://www.speech.cs.cmu.edu/sphinx/doc/Sphinx.html|CMU Sphinx]] : Sphinx est une bibliothèque écrite en java et a une variante en C | * [[http://www.speech.cs.cmu.edu/sphinx/doc/Sphinx.html|CMU Sphinx]] : Sphinx est une bibliothèque écrite en java et a une variante en C | ||
+ | * [[CommonVoice]] le projet de Mozilla (ex-DeepSpeech) | ||
Logiciels dont le développement est arrêté : | Logiciels dont le développement est arrêté : | ||
* [[http://www.kiecza.net/daniel/linux/index.html|CVoiceControl]] : n'est plus soutenu par son créateur depuis 2002 | * [[http://www.kiecza.net/daniel/linux/index.html|CVoiceControl]] : n'est plus soutenu par son créateur depuis 2002 | ||
- | |||
- | |||
- | === DeepSpeech le projet de Mozilla === | ||
- | [[https://research.mozilla.org/machine-learning/|DeepSpeech]] de la fondation mozilla, buts: | ||
- | * Web Speech API | ||
- | * Speech recognition | ||
- | * Speech-to-Text | ||
=====Voir aussi===== | =====Voir aussi===== | ||
- | *[[http://forum.ubuntu-fr.org/viewtopic.php?pid=3532304|Discussion "Reconnaissance vocale"]] sur le forum ubuntu-fr | + | *[[https://forum.ubuntu-fr.org/viewtopic.php?id=60231&p=4|Discussion "Reconnaissance vocale"]] sur le forum ubuntu-fr |
*[[synthese_vocale|Synthèse vocale]] (Opération inverse) | *[[synthese_vocale|Synthèse vocale]] (Opération inverse) | ||
- | * Un article du numéro 117 de Full Circle sur le sujet FIXME | ||
===== Pages en rapport ===== | ===== Pages en rapport ===== | ||
{{topic>reconnaissance_vocale&header}} | {{topic>reconnaissance_vocale&header}} | ||