Articles

Szólásszabadság… Recognition (Linux, Windows and Mac) – voxforge.org

On január 12, 2022 by admin

A VoxForge egy nyílt beszédadatbázis, amelyet azért hoztak létre, hogy átírt beszédet gyűjtsön a Free and Open SourceSpeech Recognition Engines (Linux, Windows and Mac) számára.

A GPL licenc alatt elérhetővé tesszük az összes beküldött hangfájlt, majd akusztikai modellekké “fordítjuk” őket a nyílt forráskódú beszédfelismerő motorok, például a CMU Sphinx, az ISIP, a Julius (github) és a HTK (megjegyzés: a HTK terjesztési korlátozásokkal rendelkezik) számára.

Miért van szükségünk ingyenes GPL beszédhangra?

A legtöbb akusztikai modell, amelyet a “nyílt forráskódú” beszédfelismerő (vagy Speech-to-Text) motorok használnak, zárt forráskódú. Nem adnak hozzáférést az akusztikai modell létrehozásához használt beszédhanghoz és átiratokhoz (azaz a beszédkorpuszhoz).

Ez azért van, mert a szabad és nyílt forráskódú (“FOSS”) projektek nagyméretű beszédkorpuszok megvásárlására kötelezettek, korlátozó licencekkel. Bár van néhány példa olyan kis FOSS beszédkorpuszokra, amelyek felhasználhatók akusztikai modellek létrehozására, a korpuszok túlnyomó többségét (különösen a jó akusztikai modellek létrehozására legalkalmasabb nagy korpuszokat) korlátozó licencek alapján kell megvásárolni.

Hogyan tud segíteni?

Vegye fel magát, amint szöveget olvas, és töltse fel a felvételeket a VoxForge-ra.

Más lehetőségek.

Archives

Categories

Szólásszabadság… Recognition (Linux, Windows and Mac) – voxforge.org

Miért van szükségünk ingyenes GPL beszédhangra?

Hogyan tud segíteni?

Vélemény, hozzászólás? Kilépés a válaszból

Archívum

Meta