Svoboda projevu… Rozpoznávání řeči (Linux, Windows a Mac) – voxforge.org
On 12 ledna, 2022 by adminVoxForge je otevřená sada dat o řeči, která byla vytvořena za účelem shromažďování přepsané řeči pro použití se svobodnými a otevřenými systémy pro rozpoznávání řeči (pro Linux, Windows a Mac).
Zpřístupníme všechny zaslané zvukové soubory pod licencí GPL a poté je „zkompilujeme“ do akustických modelů pro použití s motory pro rozpoznávání řeči s otevřeným zdrojovým kódem, jako jsou CMU Sphinx, ISIP, Julius (github) a HTK (poznámka: HTK má distribuční omezení).
Proč potřebujeme svobodný zvuk řeči pod licencí GPL?
Většina akustických modelů používaných motory pro rozpoznávání řeči (nebo Speech-to-Text) s otevřeným zdrojovým kódem je uzavřená. Neumožňují přístup k řečovému zvuku a přepisům (tj. k řečovému korpusu) použitým k vytvoření akustického modelu.
Důvodem je to, že projekty Free and Open Source („FOSS“) jsou nuceny zakoupit rozsáhlé řečové korpusy s omezujícími licencemi. Ačkoli existuje několik případů malých řečových korpusů FOSS, které by mohly být použity pro tvorbu akustických modelů, naprostá většina korpusů (zejména velkých korpusů nejvhodnějších pro tvorbu dobrých akustických modelů) musí být zakoupena pod omezujícími licencemi.
Jak můžete pomoci?
Nahrajte se při čtení nějakého textu a nahrajte své nahrávky na VoxForge.
Další možnosti.
Napsat komentář