Discurso Livre… Reconhecimento (Linux, Windows e Mac) – voxforge.org
On Janeiro 12, 2022 by adminVoxForge é um conjunto de dados de fala aberta que foi configurado para recolher a fala transcrita para uso com motores de reconhecimento Free e Open SourceSpeech (em Linux, Windows e Mac).
Estaremos disponíveis todos os arquivos de áudio submetidos sob a licença GPL, e então os ‘compilamos’ em modelos acústicos para uso com os mecanismos de reconhecimento de fala Open Source como CMU Sphinx, ISIP, Julius (github) e HTK (nota: HTK tem restrições de distribuição).
Por que precisamos de áudio de fala GPL livre?
Os modelos acústicos mais usados pelos mecanismos de reconhecimento de fala ‘Open Source’ (ou Speech-to-Text) são de código fechado. Eles não dão acesso aos speechaudio e transcrições (ou seja, o speechcorpus) usados para criar o modelo acústico.
A razão para isso é que projetos Free e Open Source (‘FOSS’) são necessários para a compra de um grande speechcorpora com licença restritiva. Embora existam poucas instâncias de pequenos corpora de fala FOSS que poderiam ser usados para criar modelos acústicos, a grande maioria dos corpora (especialmente corpora maiores, mais adequados para construir bons modelos acústicos) devem ser comprados sob licenças restritivas.
Como você pode ajudar?
Recorde você mesmo lendo algum texto e carregue suas gravações no VoxForge.
Outras Opções.
Deixe uma resposta