Reconnaissance vocale

Cette page est consacrée à la reconnaissance vocale sous Ubuntu et plus généralement sous Linux.

Canonical prévoit d'intégrer prochainement le logiciel libre speechcontrol pour ubuntu linux, développé par canonical, et pourrait faire à l'avenir de la synthèse vocale également.

KDE intègre un module de reconnaissance vocale, basique et simple à utiliser, basé sur CMU Sphinx.

Enfin, pour aider l'amélioration des modèles libres de reconnaissance vocale pour Linux, consultez le site Voxforge.org. Vous pouvez y enregistrer un texte qui permettra d'intégrer votre voix dans les modèles de reconnaissance vocale, et ainsi les améliorer.

La synthèse vocale, qui n'est pas à confondre avec la reconnaissance vocale, peut aussi vous intéresser.

Pour la commande vocale

  • Perlbox : permet de commander l'environnement KDE par la voix. Basé sur Sphinx.
  • Simon : permet de contrôler de multiples applications (firefox, rhythmbox, …) ainsi que le bureau aisément. Disponible http://sourceforge.net/projects/speech2text/
  • VoiceExecute : permet de lancer des logiciels par la voix
  • Google search sous Chrome : le moteur de recherche Google intègre désormais un bouton pour faire une recherche vocale sous Chrome.
  • Kalliope est un framework permettant de créer sont propre assistant personnel. Le programme supporte plusieurs langues, possède des modules de reconnaissance vocale(STT) offline et self-hosted.
  • Lucida est un assistant personnel intelligent basé sur la parole et la vision inspiré par Sirius. Visitez le site Web pour le tutoriel, et Lucida-users pour de l'aide. Le projet est publié sous licence BSD, sauf pour certains sous-modules qui contiennent leurs propres licence.
  • Jasper, pour raspberry

Pour la dictée vocale

Autre

  • CMU Sphinx : Sphinx est une bibliothèque écrite en java et a une variante en C

Logiciels dont le développement est arrêté :

  • CVoiceControl : n'est plus soutenu par son créateur depuis 2002

DeepSpeech le projet de Mozilla

DeepSpeech de la fondation mozilla, buts:

  • Web Speech API
  • Speech recognition
  • Speech-to-Text
  • reconnaissance_vocale.txt
  • Dernière modification: Le 11/05/2018, 11:43
  • par sispheor