SPH-zu-PVF-Konverter
Wandeln Sie Ihre sph-Dateien online & kostenlos in pvf um
sph
pvf
Wie man SPH in PVF konvertiert
Wählen Sie Dateien vom Computer, Google Drive, Dropbox, einer URL oder durch Ziehen auf die Seite.
Wählen Sie pvf oder irgendein anderes Format, das Sie als Ergebnis haben wollen (mehr als 200 Formate unterstützt)
Lassen Sie die Datei konvertieren und Sie können Ihre pvf-Datei direkt danach herunterladen
Über die Formate
SPH ist die Dateierweiterung für Audio im NIST SPHERE-Format (SPeech HEader REsources), einem Standard, der um 1990 vom U.S. National Institute of Standards and Technology entwickelt wurde. Für die Sprachforschung konzipiert, enthalten SPH-Dateien einen 1024-Byte-ASCII-Header mit umfangreichen Metadaten — Datenbankkennungen, Kanalzahlen, Abtastraten, Bytereihenfolge und Kompressionstyp — sodass jede Aufnahme sich selbst beschreibt. Das zugrunde liegende Audio ist typischerweise 16-Bit-lineares PCM mit 16 kHz Abtastrate, obwohl andere Konfigurationen zulässig sind. Forscher am NIST, bei der DARPA und an Universitäten weltweit setzen auf SPH für die Verteilung von Sprachkorpora wie TIMIT, Switchboard und den LDC-Sammlungen, die modernen Spracherkennungssystemen zugrunde liegen. Ein wesentlicher Vorteil ist, dass der menschenlesbare Header es Skripten ermöglicht, Aufnahme-Metadaten ohne binäre Dekodierung zu parsen. Die strikte Standardisierung eliminiert zudem Mehrdeutigkeiten beim Austausch von Datensätzen zwischen Institutionen und Plattformen. Da SPH-Dateien unkomprimiertes PCM speichern, bewahren sie die volle Audioklangtreü — entscheidend beim Training akustischer Modelle, bei denen selbst kleine Artefakte die Ergebnisse verfälschen können.
PVF (Portable Voice Format) ist ein einfaches Audiodateiformat, das für die Sprachnachrichtenspeicherung in Linux-basierten Telefoniesystemen entworfen wurde, insbesondere ISDN4Linux und dessen vbox-Voicemail-Anwendung. Das Format entstand aus dem europäischen ISDN-Ökosystem der späten 1990er Jahre, als Linux-Server zunehmend PBX- und Anrufbeantworter-Aufgaben über digitale Telefonleitungen übernahmen. PVF-Dateien speichern rohe vorzeichenbehaftete 16-Bit-PCM-Samples bei 8000 Hz Mono, eingeleitet von einem minimalen Klartext-Header, der Datenformat und Bytereihenfolge angibt. Diese bewusste Einfachheit ist eine der Hauptstärken des Formats — ohne Kompression und mit einem menschenlesbaren Header sind PVF-Dateien trivial einfach zu parsen, per Pipe weiterzuleiten und mit Standard-Unix-Tools zu bearbeiten. Die 8-kHz-Rate entspricht der Nyquist-Anforderung für Telefon-Bandbreiten-Sprache (300-3400 Hz) und macht PVF zu einem natürlichen Zwischenformat für Sprachverarbeitungspipelines. Ein weiterer Vorteil ist die plattformübergreifende Portabilität: Die explizite Bytereihenfolge-Deklaration bedeutet, dass PVF-Dateien ohne Mehrdeutigkeiten zwischen Big-Endian- und Little-Endian-Systemen verschoben werden können. Das SoX-Audio-Toolkit bietet native PVF-Lese-/Schreibunterstützung und ermöglicht eine unkomplizierte Konvertierung in moderne Formate.