Libertatea de exprimare… Recognition (Linux, Windows și Mac) – voxforge.org
On ianuarie 12, 2022 by adminVoxForge este un set de date deschis de recunoaștere a vorbirii care a fost creat pentru a colecta vorbirea transcrisă pentru a fi utilizată cu motoare de recunoaștere a vorbirii libere și cu sursă deschisă (pe Linux, Windows și Mac).
Vom pune la dispoziție toate fișierele audio trimise sub licența GPL, iar apoi le vom „compila” în modele acustice pentru a fi utilizate cu motoare de recunoaștere a vorbirii cu sursă deschisă, cum ar fi CMU Sphinx, ISIP, Julius (github) și HTK (notă: HTK are restricții de distribuție).
De ce avem nevoie de fișiere audio de vorbire GPL gratuite?
Majoritatea modelelor acustice utilizate de motoarele de recunoaștere a vorbirii (sau Speech-to-Text) cu sursă deschisă sunt cu sursă închisă. Acestea nu vă oferă acces la sunetul de vorbire și la transcrieri (de exemplu, discursulcorpus) folosite pentru a crea modelul acustic.
Motivul pentru aceasta este că proiectele Free and Open Source („FOSS”) sunt obligate să achiziționeze corpusuri de vorbire mari cu licențe restrictive. Deși există câteva cazuri de corpusuri de vorbire FOSS de mici dimensiuni care ar putea fi folosite pentru a crea modele acustice, marea majoritate a corpusurilor (în special a corpusurilor mari, cele mai potrivite pentru construirea unor modele acustice bune) trebuie achiziționate sub licențe restrictive.
Cum puteți ajuta?
Înregistrează-te citind un text și încarcă înregistrările tale pe VoxForge.
Alte opțiuni.
Lasă un răspuns