Conversor de MPG para SPH

Extraia áudio NIST Sphere de vídeos MPG online

Solte os arquivos aqui. 1 GB tamanho máximo do ficheiro ou Registar-se
para
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Padrão de Pesquisa

O SPH (Sphere) é a pedra angular da pesquisa de fala. Extraia áudio MPG no formato que corpora linguísticos e ferramentas ASR esperam.

Trabalho na Nuvem

A extração de áudio roda nos nossos servidores — sem ferramentas NIST necessárias localmente para produzir arquivos no formato Sphere.

Privacidade dos Dados

Os arquivos MPG enviados são removidos após a conversão. As saídas SPH são excluídas dos servidores em até 24 horas.

Como converter MPG para SPH

1

Selecione os arquivos do seu computador, Google Drive, Dropbox ou adicione um URL. Você também pode simplesmente arrastá-lo para esta página.

2

Escolha sph ou qualquer outro formato de saída desejado (mais de 200 formatos compatíveis)

3

Espere o arquivo ser convertido e você poderá, então, baixar o seu arquivo sph

Sobre os formatos

MPG é uma extensão de arquivo comum para arquivos de vídeo codificados usando os padrões de compressão MPEG-1 ou MPEG-2, desenvolvidos pelo Moving Picture Experts Group. A extensão de três caracteres originou-se dos sistemas de arquivos iniciais do Windows é DOS que restringiam extensões a três caracteres, fornecendo uma abreviacao para a designacao MPEG mais longa. Os arquivos MPG contém program streams MPEG que multiplexam um fluxo elementar de vídeo é um ou mais fluxos elementares de áudio em um fluxo de bytes unificado com timestamps de sincronizacao. O formato foi amplamente utilizado ao longo dos anos 1990 é 2000 para armazenar vídeo digital em computadores pessoais, aparecendo em tudo, desde rips de Vídeo CD é extracoes de DVD até gravações de TV digital capturadas com placas codificadoras de hardware. Arquivos MPG usando compressão MPEG-1 normalmente contém vídeo 352x240 (NTSC) ou 352x288 (PAL) em taxas de bits em torno de 1,5 Mbps, enquanto arquivos MPG codificados em MPEG-2 suportam resoluções mais altas até Full HD. A estrutura de program stream assume um meio de armazenamento relativamente confiável, diferente da variante de transport stream projetada para transmissão, tornando-o eficiente para reprodução baseada em arquivo sem a sobrecarga de pacotes de recuperação de erros. A ampla compatibilidade é uma das forcas duradouras do formato, já que virtualmente todos os reprodutores de mídia em todos os sistemas operacionais podem decodificar esses arquivos sem instalação adicional de codecs. O MPG contínua sendo encontrado em conteúdo de vídeo arquivado, gravações de vigilância é fluxos de trabalho de vídeo digital legados.
Lançamento inicial: Agosto 1993
SPH é a extensão de arquivo para áudio armazenado no formato NIST SPHERE (SPeech HEader REsources), um padrão criado pelo National Institute of Standards and Technology dos EUA por volta de 1990. Construído para pesquisa em fala, os arquivos SPH carregam um cabecalho ASCII de 1024 bytes repleto de metadados — identificadores de banco de dados, contagens de canais, taxas de amostragem, ordenacao de bytes é tipo de compressão — tornando cada gravação autodescritiva. O áudio subjacente é tipicamente PCM linear de 16 bits amostrado a 16 kHz, embora outras configurações sejam permitidas. Pesquisadores do NIST, DARPA é universidades em todo o mundo confiam no SPH para distribuir corpora de fala como TIMIT, Switchboard é às coleções LDC que sustentam os modernos sistemas de reconhecimento automático de fala. Uma vantagem chave é que o cabecalho legível por humanos permite que scripts analisem metadados de gravação sem decodificação binária. A padronizacao rigorosa do formato também elimina ambiguidade ao compartilhar conjuntos de dados entre instituições é plataformas. Como os arquivos SPH armazenam PCM sem compressão, eles preservam a fidelidade total do áudio — critico ao treinar modelos acusticos onde até pequenos artefatos podem distorcer os resultados.
Lançamento inicial: 1990

Perguntas Frequentes

Por que converter MPG para SPH?

O SPH (NIST Sphere) é o formato padrão para corpora de pesquisa de fala. A conversão produz áudio compatível com ferramentas de pesquisa linguística.

O que usa arquivos SPH?

As ferramentas de fala NIST, corpora LDC, Kaldi e frameworks de reconhecimento de fala HTK trabalham com áudio no formato Sphere.

O SPH inclui metadados?

Sim — arquivos Sphere possuem um cabeçalho de texto rico que armazena taxa de amostragem, codificação, contagem de canais e campos de metadados personalizados.

O SPH serve para reprodução geral?

O SPH é um formato de pesquisa. Converta para WAV ou MP3 para escuta geral. O SPH é melhor para pipelines de análise de fala.

Posso extrair em lote?

Envie múltiplos arquivos MPG e extraia áudio SPH de cada um — construa datasets de pesquisa de forma eficiente em uma sessão.