Conversor de WVE para HTK

Converta seus arquivos wve para htk online e grátis

Solte os arquivos aqui. 1 GB tamanho máximo do ficheiro ou Registar-se
para
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Como converter WVE para HTK

1

Selecione os arquivos do seu computador, Google Drive, Dropbox ou adicione um URL. Você também pode simplesmente arrastá-lo para esta página.

2

Escolha htk ou qualquer outro formato de saída desejado (mais de 200 formatos compatíveis)

3

Espere o arquivo ser convertido e você poderá, então, baixar o seu arquivo htk

Sobre os formatos

WVE é o formato de áudio nativo da família Psion Séries 3 de assistentes digitais pessoais, lancado pela empresa britanica Psion PLC a partir de setembro de 1991. Esses PDAs clamshell incluiam um gravador de voz embutido, e toda a funcionalidade de ditado dependia dos arquivos WVE para armazenar o som capturado. Cada arquivo comeca com a assinatura ASCII "ALawSoundFile**" seguida por um cabecalho mínimo, e então áudio codificado em A-law bruto amostrado a 8 kHz — uma taxa herdada dos padrões de telefonia digital. A 8000 bytes por segundo, uma gravação de um minuto ocupa apenas 480 KB, o que era essencial dado que os dispositivos Psion armazenavam dados em cartoes SRAM tipicamente variando de 128 KB a 2 MB. A codificação A-law fornece clareza de fala razoável dentro dessas restrições apertadas de armazenamento, priorizando inteligibilidade sobre reprodução de alta fidelidade. Os arquivos WVE podem ser convertidos para WAV ou outros formatos modernos usando SoX, Awave Studio ou utilitários especializados para Psion. Embora o formato seja firmemente um produto da computação portátil do início dos anos 1990, ele possui significado histórico como um dos primeiros formatos de gravação de áudio projetados para dispositivos de consumo de bolso. Colecionadores é pesquisadores que estudam a história da computação móvel ocasionalmente encontram arquivos WVE ao recuperar dados de midias SRAM legadas.
Desenvolvedor: Psion PLC
Lançamento inicial: 1991
HTK é o container de forma de onda nativo do Hidden Markov Model Toolkit, um pacote de software desenvolvido no Departamento de Engenharia da Universidade de Cambridge para pesquisa em reconhecimento de fala. Distribuido pela primeira vez em 1993, o HTK rapidamente se tornou uma plataforma de referência em laboratorios de linguística computacional em todo o mundo, e seu formato de arquivo seguiu o mesmo caminho. Cada arquivo armazena uma sequência de vetores de parâmetros ou amostras brutas precedidos por um cabecalho de 12 bytes especificando o número de quadros, o periodo do quadro em unidades de 100 ns, a contagem de bytes por quadro é um código de tipo indicando o tipo de dado — às opções vão desde PCM de forma de onda até coeficientes cepstrais de frequência Mel é energias de banco de filtros. Essa versatilidade permite que um único container carregue tanto áudio fonte quanto features extraidas sem alterar os analisadores. O cabecalho deliberadamente mínimo evita preenchimento de alinhamento ou blocos opcionais, tornando o formato trivial de ler a partir de C, Python ou MATLAB com poucas linhas de É/S binária. Três vantagens sustentam a relevancia duradoura do HTK: integração estreita com o pipeline de treinamento é reconhecimento HTK, layout de bytes deterministico que elimina ambiguidade no analisador é ampla adoção em corpora acadêmicos.
Lançamento inicial: 1993