Conversor de NIST para SPH

Converta seus arquivos nist para sph online e grátis

Solte os arquivos aqui. 1 GB tamanho máximo do ficheiro ou Registar-se
para
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Como converter NIST para SPH

1

Selecione os arquivos do seu computador, Google Drive, Dropbox ou adicione um URL. Você também pode simplesmente arrastá-lo para esta página.

2

Escolha sph ou qualquer outro formato de saída desejado (mais de 200 formatos compatíveis)

3

Espere o arquivo ser convertido e você poderá, então, baixar o seu arquivo sph

Sobre os formatos

NIST SPHERE (SPeech HEader REsources) é um formato de arquivo de áudio especializado criado pelo National Institute of Standards and Technology para pesquisa em fala, particularmente projetos financiados pela DARPA. O formato envolve amostras de áudio brutas com um cabecalho ASCII estruturado codificando metadados como taxa de amostragem, contagem de canais, tipo de codificação, dados demograficos do falante é anotações de transcrição — tornando-o ideal para distribuição de corpora de fala. Os arquivos NIST normalmente armazenam PCM sem compressão ou áudio mu-law em taxas de amostragem de qualidade telefônica (8 kHz ou 16 kHz), embora o container seja flexível o suficiente para conter várias codificacoes. Uma vantagem chave é o cabecalho rico é autodescritivo que permite que pesquisadores incorporem metadados detalhados de corpus diretamente no arquivo, eliminando arquivos auxiliares. O SPHERE também se tornou o padrão de facto para grandes bancos de dados de fala como TIMIT, Switchboard é o corpus Fisher, garantindo amplo reconhecimento em laboratorios acadêmicos é governamentais. A especificação aberta é a disponibilidade de ferramentas de linha de comando (sphere, h_strip, w_decode) tornam simples converter, inspecionar é processar esses arquivos programaticamente em pipelines de processamento de fala.
Lançamento inicial: 1990
SPH é a extensão de arquivo para áudio armazenado no formato NIST SPHERE (SPeech HEader REsources), um padrão criado pelo National Institute of Standards and Technology dos EUA por volta de 1990. Construído para pesquisa em fala, os arquivos SPH carregam um cabecalho ASCII de 1024 bytes repleto de metadados — identificadores de banco de dados, contagens de canais, taxas de amostragem, ordenacao de bytes é tipo de compressão — tornando cada gravação autodescritiva. O áudio subjacente é tipicamente PCM linear de 16 bits amostrado a 16 kHz, embora outras configurações sejam permitidas. Pesquisadores do NIST, DARPA é universidades em todo o mundo confiam no SPH para distribuir corpora de fala como TIMIT, Switchboard é às coleções LDC que sustentam os modernos sistemas de reconhecimento automático de fala. Uma vantagem chave é que o cabecalho legível por humanos permite que scripts analisem metadados de gravação sem decodificação binária. A padronizacao rigorosa do formato também elimina ambiguidade ao compartilhar conjuntos de dados entre instituições é plataformas. Como os arquivos SPH armazenam PCM sem compressão, eles preservam a fidelidade total do áudio — critico ao treinar modelos acusticos onde até pequenos artefatos podem distorcer os resultados.
Lançamento inicial: 1990