Wolna Mowa… Rozpoznawanie (Linux, Windows i Mac) – voxforge.org
On 12 stycznia, 2022 by adminVoxForge jest otwartym zbiorem danych mowy, który został założony w celu zbierania transkrypcji mowy do użycia z Wolnymi i Otwartymi Silnikami Rozpoznawania Mowy (w systemach Linux, Windows i Mac).
Udostępnimy wszystkie przesłane pliki audio na licencji GPL, a następnie 'skompilujemy’ je do modeli akustycznych dla silników rozpoznawania mowy Open Source, takich jak CMU Sphinx, ISIP, Julius (github) i HTK (uwaga: HTK ma ograniczenia w dystrybucji).
Dlaczego potrzebujemy wolnego audio mowy na licencji GPL?
Większość modeli akustycznych używanych przez silniki rozpoznawania mowy 'Open Source’ (lub Speech-to-Text) jest zamknięta. Nie dają one dostępu do nagrań audio mowy i transkrypcji (tj. korpusu mowy) użytych do stworzenia modelu akustycznego.
Powodem tego jest fakt, że projekty Free and Open Source (’FOSS’) są zmuszone do zakupu dużych speechcorporów z restrykcyjnymi licencjami. Chociaż istnieje kilka przypadków małych korpusów mowy FOSS, które mogą być użyte do stworzenia modeli akustycznych, większość korpusów (szczególnie duże korpusy, które najlepiej nadają się do stworzenia dobrych modeli akustycznych) muszą być zakupione na restrykcyjnych licencjach.
Jak możesz pomóc?
Nagraj siebie czytającego jakiś tekst i prześlij swoje nagrania do VoxForge.
Inne opcje.
Pozostałe opcje.
Pozostałe opcje. Jak możesz pomóc?
Dodaj komentarz