Articles

Sananvapaus… Recognition (Linux, Windows ja Mac) – voxforge.org

On 12 tammikuun, 2022 by admin

VoxForge on avoin puhetietokanta, joka perustettiin keräämään transkriptoitua puhetta käytettäväksi vapaiden ja avoimen lähdekoodin puheentunnistuskoneiden kanssa (Linux, Windows ja Mac).

Tuotamme kaikki lähetetyt äänitiedostot saataville GPL-lisenssin alaisina ja ”käännämme” ne akustisiksi malleiksi käytettäväksi avoimen lähdekoodin puheentunnistusmoottoreissa, kuten CMU Sphinxissä, ISIP:ssä, Juliuksessa (github) ja HTK:ssa (huom. HTK:lla on jakelurajoituksia).

Miksi tarvitsemme ilmaista GPL-puheäänitiedostoa?

Suuri osa avoimen lähdekoodin puheentunnistus- (tai puheesta tekstiksi-) moottoreissa käytetyistä äänimalleista on suljetun lähdekoodin. Ne eivät anna sinulle pääsyä akustisen mallin luomisessa käytettyyn puheaudioon ja transkriptioihin (eli puhekorpukseen).

Syy tähän on se, että vapaan ja avoimen lähdekoodin (”FOSS”) projektit joutuvat ostamaan suuria puhekorpuksia, joiden lisensointi on rajoittavaa. Vaikka on olemassa muutamia esimerkkejä pienistä FOSS-puhekorpuksista, joita voitaisiin käyttää akustisten mallien luomiseen, valtaosa korpuksista (erityisesti suurista korpuksista, jotka soveltuvat parhaiten hyvien akustisten mallien luomiseen) on ostettava rajoittavien lisenssien alaisina.

Miten voit auttaa?

Nauhoita itsesi lukemassa tekstiä ja lataa nauhoituksesi VoxForgeen.

Muut vaihtoehdot.

Archives

Categories

Sananvapaus… Recognition (Linux, Windows ja Mac) – voxforge.org

Miksi tarvitsemme ilmaista GPL-puheäänitiedostoa?

Miten voit auttaa?

Vastaa Peruuta vastaus

Arkistot

Meta