Conversor de HTK para SPX
Converta seus arquivos htk para spx online e grátis
htk
spx
Definições
Automático
Define o bitrate de áudio geral para Speex. Projetado para codificação de fala humana, o Speex atinge a transparência em bitrates ultrabaixos, com um bitrate máximo de 44 kbps.
Automático (Sem alterações)
Define o número de canais de áudio. Essa configuração é muito útil ao reduzir canais (downmix), por exemplo, de 5.1 para estéreo.
Automático (Sem alterações)
Define a taxa de amostragem do áudio. Música com um espectro completo (20 Hz – 20 kHz) requer valores não inferiores a 44.1 kHz para atingir a transparência. Mais informações podem ser encontradas na wiki.
htk
HTK é o container de forma de onda nativo do Hidden Markov Model Toolkit, um pacote de software desenvolvido no Departamento de Engenharia da Universidade de Cambridge para pesquisa em reconhecimento de fala. Distribuido pela primeira vez em 1993, o HTK rapidamente se tornou uma plataforma de referência em laboratorios de linguística computacional em todo o mundo, e seu formato de arquivo seguiu o mesmo caminho. Cada arquivo armazena uma sequência de vetores de parâmetros ou amostras brutas precedidos por um cabecalho de 12 bytes especificando o número de quadros, o periodo do quadro em unidades de 100 ns, a contagem de bytes por quadro é um código de tipo indicando o tipo de dado — às opções vão desde PCM de forma de onda até coeficientes cepstrais de frequência Mel é energias de banco de filtros. Essa versatilidade permite que um único container carregue tanto áudio fonte quanto features extraidas sem alterar os analisadores. O cabecalho deliberadamente mínimo evita preenchimento de alinhamento ou blocos opcionais, tornando o formato trivial de ler a partir de C, Python ou MATLAB com poucas linhas de É/S binária. Três vantagens sustentam a relevancia duradoura do HTK: integração estreita com o pipeline de treinamento é reconhecimento HTK, layout de bytes deterministico que elimina ambiguidade no analisador é ampla adoção em corpora acadêmicos.
leia mais
spx
Speex é um codec de áudio de código aberto desenvolvido especificamente para compressão de fala, criado por Jean-Marc Valin sob a Xiph.Org Foundation. Lancado pela primeira vez em outubro de 2002, ele têm como alvo voz sobre IP, conferencias é qualquer cenário onde a palavra falada precisa viajar de forma eficiente pela rede. Os arquivos SPX envolvem áudio codificado em Speex dentro de um container Ogg, combinando a otimizacao de fala do codec com às capacidades de streaming do Ogg. Três taxas de amostragem são suportadas — banda estreita a 8 kHz, banda larga a 16 kHz é banda ultra-larga a 32 kHz — juntamente com codificação de taxa de bits variável que se adapta em tempo real a complexidade da fala. Uma vantagem de destaque é sua natureza livre de patentes é licenciada sob BSD, que permitiu que desenvolvedores o incorporassem livremente em produtos comerciais é de código aberto. O Speex também inclui cancelamento de eco acustico, supressao de ruido é controle automático de ganho, recursos que codecs rivais normalmente delegam a bibliotecas externas. Embora seus criadores recomendem oficialmente o Opus) como sucessor desde 2012, o Speex permanece implantado em sistemas VoIP legados, gravações arquivadas é dispositivos embarcados onde seu decodificador leve ainda é valorizado.
leia mais
Como converter HTK para SPX
Selecione os arquivos do seu computador, Google Drive, Dropbox ou adicione um URL. Você também pode simplesmente arrastá-lo para esta página.
Escolha spx ou qualquer outro formato de saída desejado (mais de 200 formatos compatíveis)
Espere o arquivo ser convertido e você poderá, então, baixar o seu arquivo spx
Sobre os formatos
HTK é o container de forma de onda nativo do Hidden Markov Model Toolkit, um pacote de software desenvolvido no Departamento de Engenharia da Universidade de Cambridge para pesquisa em reconhecimento de fala. Distribuido pela primeira vez em 1993, o HTK rapidamente se tornou uma plataforma de referência em laboratorios de linguística computacional em todo o mundo, e seu formato de arquivo seguiu o mesmo caminho. Cada arquivo armazena uma sequência de vetores de parâmetros ou amostras brutas precedidos por um cabecalho de 12 bytes especificando o número de quadros, o periodo do quadro em unidades de 100 ns, a contagem de bytes por quadro é um código de tipo indicando o tipo de dado — às opções vão desde PCM de forma de onda até coeficientes cepstrais de frequência Mel é energias de banco de filtros. Essa versatilidade permite que um único container carregue tanto áudio fonte quanto features extraidas sem alterar os analisadores. O cabecalho deliberadamente mínimo evita preenchimento de alinhamento ou blocos opcionais, tornando o formato trivial de ler a partir de C, Python ou MATLAB com poucas linhas de É/S binária. Três vantagens sustentam a relevancia duradoura do HTK: integração estreita com o pipeline de treinamento é reconhecimento HTK, layout de bytes deterministico que elimina ambiguidade no analisador é ampla adoção em corpora acadêmicos.
Speex é um codec de áudio de código aberto desenvolvido especificamente para compressão de fala, criado por Jean-Marc Valin sob a Xiph.Org Foundation. Lancado pela primeira vez em outubro de 2002, ele têm como alvo voz sobre IP, conferencias é qualquer cenário onde a palavra falada precisa viajar de forma eficiente pela rede. Os arquivos SPX envolvem áudio codificado em Speex dentro de um container Ogg, combinando a otimizacao de fala do codec com às capacidades de streaming do Ogg. Três taxas de amostragem são suportadas — banda estreita a 8 kHz, banda larga a 16 kHz é banda ultra-larga a 32 kHz — juntamente com codificação de taxa de bits variável que se adapta em tempo real a complexidade da fala. Uma vantagem de destaque é sua natureza livre de patentes é licenciada sob BSD, que permitiu que desenvolvedores o incorporassem livremente em produtos comerciais é de código aberto. O Speex também inclui cancelamento de eco acustico, supressao de ruido é controle automático de ganho, recursos que codecs rivais normalmente delegam a bibliotecas externas. Embora seus criadores recomendem oficialmente o Opus) como sucessor desde 2012, o Speex permanece implantado em sistemas VoIP legados, gravações arquivadas é dispositivos embarcados onde seu decodificador leve ainda é valorizado.