SPX to SPH Converter

Converti audio Speex nel formato NIST SPH per ricerca vocale

Rilascia i file qui. 1 GB dimensione massima del file oppure Registrati
in
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Formato Corpus Vocale

Converti le registrazioni SPX nel formato NIST SPHERE — lo standard de facto per la distribuzione di dataset vocali per la ricerca mondiale.

Compatibile con la Ricerca

I file SPH funzionano con Kaldi, HTK, Praat e tutti i principali toolkit di elaborazione vocale usati nel NLP e nella ricerca acustica.

Privacy dei Dati

I file SPX caricati vengono cancellati dopo la conversione. Gli output SPH vengono eliminati dai server entro 24 ore.

Come convertire SPX in SPH

1

Seleziona file dal Computer, Google Drive, Dropbox, URL o trascinandoli sulla pagina.

2

Scegli sph o qualsiasi altro formato che ti serva come destinazione (più di 200 formati supportati)

3

Lascia convertire il file e potrai scaricare il tuo sph subito dopo

Informazioni sui formati

Speex è un codec audio open-source appositamente progettato per la compressione del parlato, sviluppato da Jean-Marc Valin sotto la Xiph.Org Foundation. Rilasciato per la prima volta nell'ottobre 2002, si rivolge al voice-over-IP, alle conferenze e a qualsiasi scenario in cui la voce parlata deve viaggiare efficientemente attraverso una rete. I file SPX avvolgono l'audio codificato Speex in un contenitore Ogg, abbinando l'ottimizzazione vocale del codec alle capacità di streaming di Ogg. Tre frequenze di campionamento sono supportate — narrowband a 8 kHz, wideband a 16 kHz e ultra-wideband a 32 kHz — insieme alla codifica a bitrate variabile che si adatta in tempo reale alla complessità del parlato. Un vantaggio di spicco è la natura priva di brevetti e con licenza BSD, che ha permesso agli sviluppatori di incorporarlo liberamente in prodotti sia commerciali che open-source. Speex integra inoltre cancellazione dell'eco acustico, soppressione del rumore e controllo automatico del guadagno, funzionalità che i codec concorrenti delegano tipicamente a librerie esterne. Sebbene i suoi creatori raccomandino ufficialmente Opus come successore dal 2012, Speex resta implementato nei sistemi VoIP legacy, nelle registrazioni archiviate e nei dispositivi embedded dove l'impronta leggera del suo decodificatore è ancora apprezzata.
Sviluppatore: Xiph.Org Foundation
Prima versione: 15 ottobre 2002
SPH è l'estensione file per l'audio memorizzato nel formato NIST SPHERE (SPeech HEader REsources), uno standard creato dal National Institute of Standards and Technology statunitense intorno al 1990. Progettato per la ricerca vocale, i file SPH portano un'intestazione ASCII di 1024 byte ricca di metadati — identificatori di database, conteggi dei canali, frequenze di campionamento, ordine dei byte e tipo di compressione — rendendo ogni registrazione autodescrittiva. L'audio sottostante è tipicamente PCM lineare a 16 bit campionato a 16 kHz, sebbene siano ammesse altre configurazioni. Ricercatori del NIST, del DARPA e di università in tutto il mondo si affidano a SPH per la distribuzione di corpora vocali come TIMIT, Switchboard e le collezioni LDC che sostengono i moderni sistemi di riconoscimento vocale automatico. Un vantaggio fondamentale è che l'intestazione leggibile dall'uomo consente agli script di analizzare i metadati della registrazione senza decodifica binaria. La rigorosa standardizzazione del formato elimina inoltre l'ambiguità nella condivisione di dataset tra istituzioni e piattaforme diverse. Poichè i file SPH memorizzano PCM non compresso, preservano la piena fedeltà audio — aspetto critico quando si addestrano modelli acustici dove anche piccoli artefatti possono distorcere i risultati.
Prima versione: 1990

Domande frequenti

Perché convertire SPX in SPH?

SPH (NIST SPHERE) è il formato standard per i corpus di ricerca vocale. Convertire da SPX prepara le registrazioni per la ricerca linguistica e acustica.

Cos'è NIST SPHERE?

SPHERE (SPeech HEader Resources) è stato sviluppato dal NIST per la distribuzione standardizzata di dati vocali nelle comunità di ricerca.

Quali strumenti lavorano con SPH?

Il toolkit NIST SPHERE, HTK, Kaldi, Praat e i principali framework di elaborazione vocale gestiscono i file SPH nativamente.

SPH è usato nel riconoscimento vocale?

Sì — la maggior parte dei principali corpus vocali (TIMIT, Switchboard, ecc.) sono distribuiti in formato SPH per addestrare i modelli di riconoscimento.

La conversione è gratuita?

Sì — gratuita su convertio.co per uso standard.