Articles

Discorso libero… Recognition (Linux, Windows e Mac) – voxforge.org

Il Gennaio 12, 2022 da admin

VoxForge è un dataset aperto che è stato creato per raccogliere il parlato trascritto da usare con motori di riconoscimento vocale liberi e open source (su Linux, Windows e Mac).

Metteremo a disposizione tutti i file audio inviati sotto licenza GPL, e poi li ‘compileremo’ in modelli acustici da usare con motori di riconoscimento vocale Open Source come CMU Sphinx, ISIP, Julius (github) e HTK (nota: HTK ha restrizioni di distribuzione).

Perché abbiamo bisogno di audio parlato libero GPL?

La maggior parte dei modelli acustici usati dai motori ‘Open Source’ di riconoscimento vocale (o Speech-to-Text) sono closed source. Non ti danno accesso all’audio del parlato e alle trascrizioni (cioè il corpus del parlato) usato per creare il modello acustico.

La ragione di questo è che i progetti Free and Open Source (‘FOSS’) sono obbligati ad acquistare grandi speechcorpus con licenze restrittive. Anche se ci sono alcuni casi di piccoli corpora vocali FOSS che potrebbero essere usati per creare modelli acustici, la stragrande maggioranza dei corpora (specialmente i corpora grandi più adatti a costruire buoni modelli acustici) devono essere acquistati sotto licenze restrittive.

Come puoi aiutare?

Registrati leggendo del testo e carica le tue registrazioni su VoxForge.

Altre opzioni.

Archivi

Categorie

Discorso libero… Recognition (Linux, Windows e Mac) – voxforge.org

Perché abbiamo bisogno di audio parlato libero GPL?

Come puoi aiutare?

Lascia un commento Annulla risposta

Archivi

Meta