Free Speech… Recognition (Linux, Windows and Mac) – voxforge.org
On Januar 12, 2022 by adminVoxForge ist ein offener Sprachdatensatz, der eingerichtet wurde, um transkribierte Sprache für die Verwendung mit Free and Open SourceSpeech Recognition Engines (auf Linux, Windows und Mac) zu sammeln.
Wir stellen alle eingereichten Audiodateien unter der GPL-Lizenz zur Verfügung und „kompilieren“ sie zu akustischen Modellen für die Verwendung mit Open-Source-Spracherkennungs-Engines wie CMU Sphinx, ISIP, Julius (github) und HTK (Hinweis: HTK hat Vertriebsbeschränkungen).
Warum brauchen wir freies GPL-Sprachaudio?
Die meisten akustischen Modelle, die von „Open-Source“-Spracherkennungs-Engines (oder Speech-to-Text) verwendet werden, sind Closed Source. Sie geben keinen Zugriff auf das Sprachaudio und die Transkriptionen (d.h. den Sprachkorpus), die zur Erstellung des akustischen Modells verwendet wurden.
Der Grund dafür ist, dass Free and Open Source („FOSS“) Projekte große Sprachkorpora mit restriktiver Lizenzierung erwerben müssen. Obwohl es einige wenige kleine FOSS-Sprachkorpora gibt, die für die Erstellung akustischer Modelle verwendet werden könnten, muss die überwiegende Mehrheit der Korpora (insbesondere große Korpora, die sich am besten für die Erstellung guter akustischer Modelle eignen) unter restriktiven Lizenzen erworben werden.
Wie können Sie helfen?
Nehmen Sie sich selbst beim Lesen eines Textes auf und laden Sie Ihre Aufnahmen auf VoxForge hoch.
Weitere Optionen.
Schreibe einen Kommentar