Discorso libero… Recognition (Linux, Windows e Mac) – voxforge.org
Il Gennaio 12, 2022 da adminVoxForge è un dataset aperto che è stato creato per raccogliere il parlato trascritto da usare con motori di riconoscimento vocale liberi e open source (su Linux, Windows e Mac).
Metteremo a disposizione tutti i file audio inviati sotto licenza GPL, e poi li ‘compileremo’ in modelli acustici da usare con motori di riconoscimento vocale Open Source come CMU Sphinx, ISIP, Julius (github) e HTK (nota: HTK ha restrizioni di distribuzione).
Perché abbiamo bisogno di audio parlato libero GPL?
La maggior parte dei modelli acustici usati dai motori ‘Open Source’ di riconoscimento vocale (o Speech-to-Text) sono closed source. Non ti danno accesso all’audio del parlato e alle trascrizioni (cioè il corpus del parlato) usato per creare il modello acustico.
La ragione di questo è che i progetti Free and Open Source (‘FOSS’) sono obbligati ad acquistare grandi speechcorpus con licenze restrittive. Anche se ci sono alcuni casi di piccoli corpora vocali FOSS che potrebbero essere usati per creare modelli acustici, la stragrande maggioranza dei corpora (specialmente i corpora grandi più adatti a costruire buoni modelli acustici) devono essere acquistati sotto licenze restrittive.
Come puoi aiutare?
Registrati leggendo del testo e carica le tue registrazioni su VoxForge.
Altre opzioni.
Lascia un commento