Szólásszabadság… Recognition (Linux, Windows and Mac) – voxforge.org
On január 12, 2022 by adminA VoxForge egy nyílt beszédadatbázis, amelyet azért hoztak létre, hogy átírt beszédet gyűjtsön a Free and Open SourceSpeech Recognition Engines (Linux, Windows and Mac) számára.
A GPL licenc alatt elérhetővé tesszük az összes beküldött hangfájlt, majd akusztikai modellekké “fordítjuk” őket a nyílt forráskódú beszédfelismerő motorok, például a CMU Sphinx, az ISIP, a Julius (github) és a HTK (megjegyzés: a HTK terjesztési korlátozásokkal rendelkezik) számára.
Miért van szükségünk ingyenes GPL beszédhangra?
A legtöbb akusztikai modell, amelyet a “nyílt forráskódú” beszédfelismerő (vagy Speech-to-Text) motorok használnak, zárt forráskódú. Nem adnak hozzáférést az akusztikai modell létrehozásához használt beszédhanghoz és átiratokhoz (azaz a beszédkorpuszhoz).
Ez azért van, mert a szabad és nyílt forráskódú (“FOSS”) projektek nagyméretű beszédkorpuszok megvásárlására kötelezettek, korlátozó licencekkel. Bár van néhány példa olyan kis FOSS beszédkorpuszokra, amelyek felhasználhatók akusztikai modellek létrehozására, a korpuszok túlnyomó többségét (különösen a jó akusztikai modellek létrehozására legalkalmasabb nagy korpuszokat) korlátozó licencek alapján kell megvásárolni.
Hogyan tud segíteni?
Vegye fel magát, amint szöveget olvas, és töltse fel a felvételeket a VoxForge-ra.
Más lehetőségek.
Vélemény, hozzászólás?