Vrije Spraak… Recognition (Linux, Windows and Mac) – voxforge.org
On januari 12, 2022 by adminVoxForge is een open spraakdataset die is opgezet om getranscribeerde spraak te verzamelen voor gebruik met Free and Open SourceSpeech Recognition Engines (op Linux, Windows en Mac).
We zullen alle ingezonden audiobestanden beschikbaar stellen onder de GPL licentie, en ze vervolgens ‘compileren’ in akoestische modellen voor gebruik met Open Source spraakherkenningsengines zoals CMU Sphinx, ISIP, Julius (github) en HTK (let op: HTK heeft distributiebeperkingen).
Waarom hebben we Vrije GPL Spraakaudio nodig?
De meeste akoestische modellen die worden gebruikt door ‘Open Source’ spraakherkenningsengines (of Speech-to-Text) zijn gesloten broncode. Ze geven je geen toegang tot de spraakaudio en transcripties (d.w.z. het spraakcorpus) die gebruikt zijn om het akoestische model te maken.
De reden hiervoor is dat Free and Open Source (‘FOSS’) projecten verplicht zijn om grote spraakkorpussen aan te schaffen met restrictieve licenties. Hoewel er enkele voorbeelden zijn van kleine FOSS-spraakcorpora die kunnen worden gebruikt om akoestische modellen te maken, moet de overgrote meerderheid van corpora (vooral grote corpora die het meest geschikt zijn voor het bouwen van goede akoestische modellen) worden aangeschaft onder restrictieve licenties.
Hoe kunt u helpen?
U neemt zelf een tekst op en uploadt uw opnamen naar VoxForge.
Andere opties.
Geef een antwoord