Articles

Discurso Livre… Reconhecimento (Linux, Windows e Mac) – voxforge.org

On Janeiro 12, 2022 by admin

VoxForge é um conjunto de dados de fala aberta que foi configurado para recolher a fala transcrita para uso com motores de reconhecimento Free e Open SourceSpeech (em Linux, Windows e Mac).

Estaremos disponíveis todos os arquivos de áudio submetidos sob a licença GPL, e então os ‘compilamos’ em modelos acústicos para uso com os mecanismos de reconhecimento de fala Open Source como CMU Sphinx, ISIP, Julius (github) e HTK (nota: HTK tem restrições de distribuição).

Por que precisamos de áudio de fala GPL livre?

Os modelos acústicos mais usados pelos mecanismos de reconhecimento de fala ‘Open Source’ (ou Speech-to-Text) são de código fechado. Eles não dão acesso aos speechaudio e transcrições (ou seja, o speechcorpus) usados para criar o modelo acústico.

A razão para isso é que projetos Free e Open Source (‘FOSS’) são necessários para a compra de um grande speechcorpora com licença restritiva. Embora existam poucas instâncias de pequenos corpora de fala FOSS que poderiam ser usados para criar modelos acústicos, a grande maioria dos corpora (especialmente corpora maiores, mais adequados para construir bons modelos acústicos) devem ser comprados sob licenças restritivas.

Como você pode ajudar?

Recorde você mesmo lendo algum texto e carregue suas gravações no VoxForge.

Outras Opções.

Archives

Categories

Discurso Livre… Reconhecimento (Linux, Windows e Mac) – voxforge.org

Por que precisamos de áudio de fala GPL livre?

Como você pode ajudar?

Deixe uma resposta Cancelar resposta

Arquivo

Meta