La parole libre … Reconnaissance vocale (Linux, Windows et Mac) – voxforge.org
On janvier 12, 2022 by adminVoxForge est un jeu de données vocal ouvert qui a été mis en place pour collecter la parole transcrite pour une utilisation avec des moteurs de reconnaissance vocale libres et open source (sur Linux, Windows et Mac).
Nous mettrons à disposition tous les fichiers audio soumis sous licence GPL, puis nous les ‘compilerons’ en modèles acoustiques pour les utiliser avec des moteurs de reconnaissance vocale Open Source tels que CMU Sphinx, ISIP, Julius (github) et HTK (note : HTK a des restrictions de distribution).
Pourquoi avons-nous besoin d’audio vocal libre sous licence GPL ?
La plupart des modèles acoustiques utilisés par les moteurs de reconnaissance vocale (ou Speech-to-Text) ‘Open Source’ sont à source fermée. Ils ne vous donnent pas accès à l’audio vocal et aux transcriptions (c’est-à-dire le speechcorpus) utilisés pour créer le modèle acoustique.
La raison en est que les projets Free and Open Source (‘FOSS’) sont obligés d’acheter de grands corpus de parole avec des licences restrictives. Bien qu’il existe quelques exemples de petits corpus vocaux FOSS qui pourraient être utilisés pour créer des modèles acoustiques, la grande majorité des corpus (en particulier les grands corpus les mieux adaptés à la construction de bons modèles acoustiques) doivent être achetés sous des licences restrictives.
Comment pouvez-vous aider?
Enregistrez-vous en lisant du texte et téléchargez vos enregistrements sur VoxForge.
Autres Options.
Laisser un commentaire