Conversor de MAUD para HTK

Converta seus arquivos maud para htk online e grátis

Solte os arquivos aqui. 1 GB tamanho máximo do ficheiro ou Registar-se
para
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Como converter MAUD para HTK

1

Selecione os arquivos do seu computador, Google Drive, Dropbox ou adicione um URL. Você também pode simplesmente arrastá-lo para esta página.

2

Escolha htk ou qualquer outro formato de saída desejado (mais de 200 formatos compatíveis)

3

Espere o arquivo ser convertido e você poderá, então, baixar o seu arquivo htk

Sobre os formatos

MAUD é um formato de arquivo de áudio desenvolvido pela MacroSystem para a plataforma Commodore Amiga, introduzido no início dos anos 1990 como parte de suas ferramentas de produção de vídeo é áudio digital. Construído sobre a arquitetura de blocos IFF (Interchange File Format) do Amiga, os arquivos MAUD organizam dados em blocos claramente delineados — MHDR para o cabecalho, MDAT para dados de amostra é blocos opcionais de anotacao para metadados. O formato suporta layouts mono é estéreo com profundidades de bits de 8 ou 16 bits é taxas de amostragem de até 48 kHz, que representavam especificações de grau profissional no hardware Amiga. Tanto PCM linear assinado quanto codificacoes A-law/mu-law estão disponíveis, oferecendo uma escolha entre fidelidade é tamanho de arquivo. O MAUD viu uso primario na comunidade de produção de vídeo do Amiga, onde às placas MacroSystem Retina é VLab Motion demandavam áudio sincronizado que o formato padrão 8SVX não conseguia fornecer. Suporte a conversão existe hoje por meio do SoX é libsndfile, garantindo que producoes vintage do Amiga permaneçam recuperaveis. Três vantagens distintas se destacam: estrutura limpa baseada em IFF que qualquer analisador consciente de blocos pode navegar, capacidade estéreo de 16 bits a frente do áudio tipico do Amiga é sobrecarga leve que deixava máximo poder de CPU para renderização de vídeo.
Lançamento inicial: 1992
HTK é o container de forma de onda nativo do Hidden Markov Model Toolkit, um pacote de software desenvolvido no Departamento de Engenharia da Universidade de Cambridge para pesquisa em reconhecimento de fala. Distribuido pela primeira vez em 1993, o HTK rapidamente se tornou uma plataforma de referência em laboratorios de linguística computacional em todo o mundo, e seu formato de arquivo seguiu o mesmo caminho. Cada arquivo armazena uma sequência de vetores de parâmetros ou amostras brutas precedidos por um cabecalho de 12 bytes especificando o número de quadros, o periodo do quadro em unidades de 100 ns, a contagem de bytes por quadro é um código de tipo indicando o tipo de dado — às opções vão desde PCM de forma de onda até coeficientes cepstrais de frequência Mel é energias de banco de filtros. Essa versatilidade permite que um único container carregue tanto áudio fonte quanto features extraidas sem alterar os analisadores. O cabecalho deliberadamente mínimo evita preenchimento de alinhamento ou blocos opcionais, tornando o formato trivial de ler a partir de C, Python ou MATLAB com poucas linhas de É/S binária. Três vantagens sustentam a relevancia duradoura do HTK: integração estreita com o pipeline de treinamento é reconhecimento HTK, layout de bytes deterministico que elimina ambiguidade no analisador é ampla adoção em corpora acadêmicos.
Lançamento inicial: 1993