Yttrandefrihet… Recognition (Linux, Windows and Mac) – voxforge.org
On januari 12, 2022 by adminVoxForge är en öppen taldataset som skapades för att samla in transkriberat tal för användning med Free and Open SourceSpeech Recognition Engines (på Linux, Windows och Mac).
Vi kommer att göra alla inlämnade ljudfiler tillgängliga under GPL-licensen och sedan ”kompilera” dem till akustiska modeller för användning i taligenkänningsmotorer med öppen källkod, t.ex. CMU Sphinx, ISIP, Julius (github) och HTK (observera: HTK har distributionsbegränsningar).
Varför behöver vi fritt GPL-taljud?
De flesta akustiska modeller som används av taligenkänningsmotorer med öppen källkod är slutna källkodsmotorer (eller tal till text). De ger dig inte tillgång till talljudet och transkriptionerna (dvs. talkorpus) som används för att skapa den akustiska modellen.
Anledningen till detta är att projekt med fri och öppen källkod (”FOSS”) är tvungna att köpa stora talkorpusar med restriktiva licenser. Även om det finns ett fåtal exempel på små FOSS-talkorpora som skulle kunna användas för att skapa akustiska modeller, måste den stora majoriteten av korpora (särskilt stora korpora som är bäst lämpade för att bygga bra akustiska modeller) köpas med restriktiva licenser.
Hur kan du hjälpa till?
Inspel dig själv när du läser upp en text och ladda upp dina inspelningar till VoxForge.
Andra alternativ.
Lämna ett svar