Ytringsfrihed… Recognition (Linux, Windows og Mac) – voxforge.org
On januar 12, 2022 by adminVoxForge er et åbent taledatasæt, der blev oprettet for at indsamle transskriberet tale til brug med Free and Open SourceSpeech Recognition Engines (på Linux, Windows og Mac).
Vi vil gøre alle indsendte lydfiler tilgængelige under GPL-licensen og derefter “kompilere” dem til akustiske modeller til brug med Open Source-talegenkendelsesmotorer som CMU Sphinx, ISIP, Julius (github) og HTK (bemærk: HTK har distributionsrestriktioner).
Hvorfor har vi brug for gratis GPL-talelyd?
De fleste akustiske modeller, der anvendes af Open Source-talegenkendelsesmotorer (eller tale-til-tekst-motorer), er closed source. De giver dig ikke adgang til den talelyd og de transskriptioner (dvs. talekorpus), der er brugt til at skabe den akustiske model.
Grunden til dette er, at Free and Open Source (‘FOSS’) projekter er tvunget til at købe store talekorps med restriktive licenser. Selv om der findes nogle få eksempler på små FOSS-talecorpora, der kan bruges til at skabe akustiske modeller, skal langt de fleste korpora (især store korpora, der er bedst egnede til at opbygge gode akustiske modeller) købes under restriktive licenser.
Hvordan kan du hjælpe?
Optag dig selv og læs noget tekst, og upload dine optagelser til VoxForge.
Andre muligheder.
Skriv et svar