Convertitore da MPG a SPH

Estrai audio NIST Sphere da video MPG online

Rilascia i file qui. 1 GB dimensione massima del file oppure Registrati
in
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Standard di Ricerca

SPH (Sphere) è la pietra angolare della ricerca vocale. Estrai audio MPG nel formato che i corpora linguistici e gli strumenti ASR si aspettano.

Lavoro nel Cloud

L'estrazione audio avviene sui nostri server — nessuno strumento NIST necessario localmente per produrre file in formato Sphere.

Privacy dei Dati

I file MPG caricati vengono rimossi dopo la conversione. Gli output SPH vengono eliminati dai server entro 24 ore.

Come convertire MPG in SPH

1

Seleziona file dal Computer, Google Drive, Dropbox, URL o trascinandoli sulla pagina.

2

Scegli sph o qualsiasi altro formato che ti serva come destinazione (più di 200 formati supportati)

3

Lascia convertire il file e potrai scaricare il tuo sph subito dopo

Informazioni sui formati

MPG è un'estensione file comune per i file video codificati utilizzando gli standard di compressione MPEG-1 o MPEG-2, sviluppati dal Moving Picture Experts Group. L'estensione a tre caratteri è nata dai primi file system Windows e DOS che limitavano le estensioni a tre caratteri, fornendo un'abbreviazione per la denominazione MPEG più lunga. I file MPG contengono program stream MPEG che multiplexano un flusso video e uno o più flussi elementari audio in un flusso di byte unificato con timestamp di sincronizzazione. Il formato è stato ampiamente utilizzato negli anni '90 e 2000 per l'archiviazione di video digitale su personal computer, comparendo in tutto, dalle copie di Video CD e le estrazioni da DVD alle registrazioni TV digitali catturate con schede encoder hardware. I file MPG con compressione MPEG-1 contengono tipicamente video a 352x240 (NTSC) o 352x288 (PAL) con bitrate intorno a 1,5 Mbps, mentre i file MPG codificati in MPEG-2 supportano risoluzioni più elevate fino al full HD. La struttura del program stream presuppone un supporto di archiviazione relativamente affidabile, a differenza della variante transport stream progettata per il broadcast, risultando efficiente per la riproduzione basata su file senza l'overhead dei pacchetti di recupero errori. L'ampia compatibilità è uno dei punti di forza duraturi del formato, poichè praticamente ogni lettore multimediale su tutti i sistemi operativi può decodificare questi file senza installazione di codec aggiuntivi. MPG continua a essere incontrato in contenuti video archiviati, registrazioni di sorveglianza e flussi di lavoro video digitali legacy.
Prima versione: Agosto 1993
SPH è l'estensione file per l'audio memorizzato nel formato NIST SPHERE (SPeech HEader REsources), uno standard creato dal National Institute of Standards and Technology statunitense intorno al 1990. Progettato per la ricerca vocale, i file SPH portano un'intestazione ASCII di 1024 byte ricca di metadati — identificatori di database, conteggi dei canali, frequenze di campionamento, ordine dei byte e tipo di compressione — rendendo ogni registrazione autodescrittiva. L'audio sottostante è tipicamente PCM lineare a 16 bit campionato a 16 kHz, sebbene siano ammesse altre configurazioni. Ricercatori del NIST, del DARPA e di università in tutto il mondo si affidano a SPH per la distribuzione di corpora vocali come TIMIT, Switchboard e le collezioni LDC che sostengono i moderni sistemi di riconoscimento vocale automatico. Un vantaggio fondamentale è che l'intestazione leggibile dall'uomo consente agli script di analizzare i metadati della registrazione senza decodifica binaria. La rigorosa standardizzazione del formato elimina inoltre l'ambiguità nella condivisione di dataset tra istituzioni e piattaforme diverse. Poichè i file SPH memorizzano PCM non compresso, preservano la piena fedeltà audio — aspetto critico quando si addestrano modelli acustici dove anche piccoli artefatti possono distorcere i risultati.
Prima versione: 1990

Domande frequenti

Perché convertire MPG in SPH?

SPH (NIST Sphere) è il formato standard per i corpora di ricerca vocale. La conversione produce audio compatibile con gli strumenti di ricerca linguistica.

Cosa usa i file SPH?

Gli strumenti vocali NIST, i corpora LDC, Kaldi e i framework di riconoscimento vocale HTK lavorano tutti con audio in formato Sphere.

SPH include metadati?

Sì — i file Sphere hanno un ricco header testuale che memorizza frequenza di campionamento, codifica, conteggio canali e campi di metadati personalizzati.

SPH è adatto alla riproduzione generica?

SPH è un formato di ricerca. Converti in WAV o MP3 per l'ascolto generico. SPH è ideale per pipeline di analisi vocale.

Posso estrarre in blocco?

Carica più file MPG e estrai audio SPH da ciascuno — costruisci dataset di ricerca in modo efficiente in una sola sessione.