Articles

Free Speech… Recognition (Linux, Windows and Mac) – voxforge.org

On Januar 12, 2022 by admin

VoxForge ist ein offener Sprachdatensatz, der eingerichtet wurde, um transkribierte Sprache für die Verwendung mit Free and Open SourceSpeech Recognition Engines (auf Linux, Windows und Mac) zu sammeln.

Wir stellen alle eingereichten Audiodateien unter der GPL-Lizenz zur Verfügung und „kompilieren“ sie zu akustischen Modellen für die Verwendung mit Open-Source-Spracherkennungs-Engines wie CMU Sphinx, ISIP, Julius (github) und HTK (Hinweis: HTK hat Vertriebsbeschränkungen).

Warum brauchen wir freies GPL-Sprachaudio?

Die meisten akustischen Modelle, die von „Open-Source“-Spracherkennungs-Engines (oder Speech-to-Text) verwendet werden, sind Closed Source. Sie geben keinen Zugriff auf das Sprachaudio und die Transkriptionen (d.h. den Sprachkorpus), die zur Erstellung des akustischen Modells verwendet wurden.

Der Grund dafür ist, dass Free and Open Source („FOSS“) Projekte große Sprachkorpora mit restriktiver Lizenzierung erwerben müssen. Obwohl es einige wenige kleine FOSS-Sprachkorpora gibt, die für die Erstellung akustischer Modelle verwendet werden könnten, muss die überwiegende Mehrheit der Korpora (insbesondere große Korpora, die sich am besten für die Erstellung guter akustischer Modelle eignen) unter restriktiven Lizenzen erworben werden.

Wie können Sie helfen?

Nehmen Sie sich selbst beim Lesen eines Textes auf und laden Sie Ihre Aufnahmen auf VoxForge hoch.

Weitere Optionen.

Archives

Categories

Free Speech… Recognition (Linux, Windows and Mac) – voxforge.org

Warum brauchen wir freies GPL-Sprachaudio?

Wie können Sie helfen?

Schreibe einen Kommentar Antworten abbrechen

Archive

Meta