VOX zu SPH Converter

Dialogic VOX ins NIST-SPHERE-Format konvertieren

Dateien wählen

Dateien hierhin und ablegen. 1 GB maximale dateigröße oder Registrieren

Forschungskorpus-fertig

NIST SPHERE ist der Standard für Sprachforschungsdaten. Ihre VOX-Telefonieaufnahmen werden zu Trainingsmaterial.

Telefonie zu Forschung

Echtes Callcenter-Audio im Forschungsformat — wertvoll für den Aufbau telefoniespezifischer Spracherkennungsmodelle.

Massenverarbeitung

Konvertieren Sie ganze Sammlungen von VOX-Aufnahmen in SPH für den Korpusaufbau.

Wie man VOX in SPH konvertiert

Wählen Sie Dateien vom Computer, Google Drive, Dropbox, einer URL oder durch Ziehen auf die Seite.

Wählen Sie sph oder irgendein anderes Format, das Sie als Ergebnis haben wollen (mehr als 200 Formate unterstützt)

Lassen Sie die Datei konvertieren und Sie können Ihre sph-Datei direkt danach herunterladen

Über die Formate

VOX ist ein headerloses Audioformat, das auf der Dialogic ADPCM-Kodierung basiert und seit den 1980er Jahren in Telefonie-, IVR-Systemen (Interactive Voice Response) und Voicemail-Plattformen weit verbreitet ist. Jedes Audiosample wird mit einem von Oki Electric entwickelten Algorithmus auf 4 Bit komprimiert, der in Hardware auf Dialogic Corporations Telefonie-Schnittstellenkarten implementiert wurde. VOX-Dateien verwenden typischerweise eine Abtastrate von 6000 oder 8000 Hz und erzeugen extrem kompakte Aufnahmen, die auf Sprachverständlichkeit statt musikalische Klangtreue optimiert sind. Da das Format keinen Header enthält, muss die Wiedergabesoftware die Abtastrate und Kodierungsparameter im Voraus kennen — ein Kompromiss, der Overhead reduziert, aber sorgfältiges Dateimanagement erfordert. Der Hauptvorteil von VOX ist die Speichereffizienz: Eine einminütige Sprachaufnahme bei 8 kHz belegt rund 240 KB, praktisch für Systeme mit Tausenden von Ansagen. Dialogic ADPCM entspricht dem ITU-T G.726-Standard und gewährleistet Interoperabilität zwischen Telefoniegeräten verschiedener Hersteller. Auch wenn moderne Callcenter auf IP-basierte Systeme mit Codecs wie Opus migrieren, bestehen umfangreiche Bibliotheken von VOX-Aufnahmen in Legacy-IVR-Installationen und Compliance-Archiven weltweit.

Entwickler: Dialogic Corporation

Erstveröffentlichung: 1983

SPH ist die Dateierweiterung für Audio im NIST SPHERE-Format (SPeech HEader REsources), einem Standard, der um 1990 vom U.S. National Institute of Standards and Technology entwickelt wurde. Für die Sprachforschung konzipiert, enthalten SPH-Dateien einen 1024-Byte-ASCII-Header mit umfangreichen Metadaten — Datenbankkennungen, Kanalzahlen, Abtastraten, Bytereihenfolge und Kompressionstyp — sodass jede Aufnahme sich selbst beschreibt. Das zugrunde liegende Audio ist typischerweise 16-Bit-lineares PCM mit 16 kHz Abtastrate, obwohl andere Konfigurationen zulässig sind. Forscher am NIST, bei der DARPA und an Universitäten weltweit setzen auf SPH für die Verteilung von Sprachkorpora wie TIMIT, Switchboard und den LDC-Sammlungen, die modernen Spracherkennungssystemen zugrunde liegen. Ein wesentlicher Vorteil ist, dass der menschenlesbare Header es Skripten ermöglicht, Aufnahme-Metadaten ohne binäre Dekodierung zu parsen. Die strikte Standardisierung eliminiert zudem Mehrdeutigkeiten beim Austausch von Datensätzen zwischen Institutionen und Plattformen. Da SPH-Dateien unkomprimiertes PCM speichern, bewahren sie die volle Audioklangtreü — entscheidend beim Training akustischer Modelle, bei denen selbst kleine Artefakte die Ergebnisse verfälschen können.

Entwickler: National Institute of Standards and Technology

Erstveröffentlichung: 1990

Häufig gestellte Fragen

Warum VOX in SPH umwandeln?

SPHERE ist der Standard für Sprachforschungs-Korpora. Die Konvertierung von VOX erzeugt Telefonie-Trainingsdaten für Spracherkennung.

Womit lassen sich SPH-Dateien öffnen?

NIST-SPHERE-Tools, SoX, HTK und Kaldi lesen SPH-Dateien.

Ist Telefonie-VOX für die Forschung geeignet?

Reale Telefonieaufnahmen sind wertvoll für das Training von Spracherkennung — sie repräsentieren tatsächliche Gesprächsbedingungen.

Kann ich für den Korpusaufbau im Stapel konvertieren?

Laden Sie mehrere VOX-Dateien hoch und konvertieren Sie sie gleichzeitig in SPH — effizient für den Aufbau von Telefonie-Sprachkorpora.

Ist SPH dasselbe wie NIST?

Ja — SPH ist die Dateiendung, NIST bezeichnet die Herkunftsorganisation.

Spezifische Converter

MP3 in SPH

WAV in SPH

MP4 in SPH

ASF in SPH

FLAC in SPH

M4A in SPH

OGG in SPH

SWF in SPH

WVE in SPH

3G2 in SPH

3GP in SPH

AAF in SPH

AV1 in SPH

AVCHD in SPH

AVI in SPH

CAVS in SPH

DIVX in SPH

DV in SPH

F4V in SPH

FLV in SPH

HEVC in SPH

M2TS in SPH

M2V in SPH

M4V in SPH

MJPEG in SPH

MKV in SPH

MOD in SPH

MOV in SPH

MPEG in SPH

MPEG-2 in SPH