Sananvapaus… Recognition (Linux, Windows ja Mac) – voxforge.org
On 12 tammikuun, 2022 by adminVoxForge on avoin puhetietokanta, joka perustettiin keräämään transkriptoitua puhetta käytettäväksi vapaiden ja avoimen lähdekoodin puheentunnistuskoneiden kanssa (Linux, Windows ja Mac).
Tuotamme kaikki lähetetyt äänitiedostot saataville GPL-lisenssin alaisina ja ”käännämme” ne akustisiksi malleiksi käytettäväksi avoimen lähdekoodin puheentunnistusmoottoreissa, kuten CMU Sphinxissä, ISIP:ssä, Juliuksessa (github) ja HTK:ssa (huom. HTK:lla on jakelurajoituksia).
Miksi tarvitsemme ilmaista GPL-puheäänitiedostoa?
Suuri osa avoimen lähdekoodin puheentunnistus- (tai puheesta tekstiksi-) moottoreissa käytetyistä äänimalleista on suljetun lähdekoodin. Ne eivät anna sinulle pääsyä akustisen mallin luomisessa käytettyyn puheaudioon ja transkriptioihin (eli puhekorpukseen).
Syy tähän on se, että vapaan ja avoimen lähdekoodin (”FOSS”) projektit joutuvat ostamaan suuria puhekorpuksia, joiden lisensointi on rajoittavaa. Vaikka on olemassa muutamia esimerkkejä pienistä FOSS-puhekorpuksista, joita voitaisiin käyttää akustisten mallien luomiseen, valtaosa korpuksista (erityisesti suurista korpuksista, jotka soveltuvat parhaiten hyvien akustisten mallien luomiseen) on ostettava rajoittavien lisenssien alaisina.
Miten voit auttaa?
Nauhoita itsesi lukemassa tekstiä ja lataa nauhoituksesi VoxForgeen.
Muut vaihtoehdot.
Vastaa