MPG zu SPH Converter

NIST-Sphere-Audio aus MPG-Videos extrahieren

Dateien hierhin und ablegen. 1 GB maximale dateigröße oder Registrieren
in
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Forschungsstandard

SPH (Sphere) ist der Eckpfeiler der Sprachforschung. Extrahieren Sie MPG-Audio in dem Format, das linguistische Korpora und ASR-Tools erwarten.

Cloudbasierte Arbeit

Die Audioextraktion läuft auf unseren Servern — keine NIST-Tools lokal erforderlich, um Sphere-Format-Dateien zu erzeugen.

Datenschutz

Hochgeladene MPG-Dateien werden nach der Konvertierung entfernt. SPH-Ausgaben werden innerhalb von 24 Stunden von den Servern gelöscht.

Wie man MPG in SPH konvertiert

1

Wählen Sie Dateien vom Computer, Google Drive, Dropbox, einer URL oder durch Ziehen auf die Seite.

2

Wählen Sie sph oder irgendein anderes Format, das Sie als Ergebnis haben wollen (mehr als 200 Formate unterstützt)

3

Lassen Sie die Datei konvertieren und Sie können Ihre sph-Datei direkt danach herunterladen

Über die Formate

MPG ist eine gängige Dateierweiterung für Videodateien, die mit den MPEG-1- oder MPEG-2-Kompressionsstandards der Moving Picture Experts Group kodiert sind. Die dreibuchstabige Erweiterung entstand aus frühen Windows- und DOS-Dateisystemen, die Erweiterungen auf drei Zeichen beschränkten, und bietet eine Kurzform für die längere MPEG-Bezeichnung. MPG-Dateien enthalten MPEG-Programm-Streams, die einen Video- und einen oder mehrere Audio-Elementary-Streams in einen einheitlichen Bytestrom mit Synchronisationszeitstempeln multiplexen. Das Format war in den 1990er und 2000er Jahren weit verbreitet für die Speicherung digitaler Videos auf PCs und erschien in allem von Video-CD-Rips und DVD-Extraktionen bis hin zu Digital-TV-Aufnahmen mit Hardware-Encoder-Karten. MPG-Dateien mit MPEG-1-Kompression enthalten typischerweise 352x240 (NTSC) oder 352x288 (PAL) Video bei Bitraten um 1,5 Mbps, während MPEG-2-kodierte MPG-Dateien höhere Auflösungen bis Full HD unterstützen. Die Programm-Stream-Struktur geht von einem relativ zuverlässigen Speichermedium aus, im Gegensatz zur Transport-Stream-Variante für den Rundfunk, was sie effizient für dateibasierte Wiedergabe ohne den Overhead von Fehlerwiederherstellungspaketen macht. Breite Kompatibilität ist eine der beständigen Stärken des Formats, da praktisch jeder Mediaplayer auf allen Betriebssystemen diese Dateien ohne zusätzliche Codec-Installation dekodieren kann. MPG begegnet einem weiterhin in archivierten Videoinhalten, Ueberwachungsaufnahmen und älteren digitalen Video-Workflows.
Erstveröffentlichung: August 1993
SPH ist die Dateierweiterung für Audio im NIST SPHERE-Format (SPeech HEader REsources), einem Standard, der um 1990 vom U.S. National Institute of Standards and Technology entwickelt wurde. Für die Sprachforschung konzipiert, enthalten SPH-Dateien einen 1024-Byte-ASCII-Header mit umfangreichen Metadaten — Datenbankkennungen, Kanalzahlen, Abtastraten, Bytereihenfolge und Kompressionstyp — sodass jede Aufnahme sich selbst beschreibt. Das zugrunde liegende Audio ist typischerweise 16-Bit-lineares PCM mit 16 kHz Abtastrate, obwohl andere Konfigurationen zulässig sind. Forscher am NIST, bei der DARPA und an Universitäten weltweit setzen auf SPH für die Verteilung von Sprachkorpora wie TIMIT, Switchboard und den LDC-Sammlungen, die modernen Spracherkennungssystemen zugrunde liegen. Ein wesentlicher Vorteil ist, dass der menschenlesbare Header es Skripten ermöglicht, Aufnahme-Metadaten ohne binäre Dekodierung zu parsen. Die strikte Standardisierung eliminiert zudem Mehrdeutigkeiten beim Austausch von Datensätzen zwischen Institutionen und Plattformen. Da SPH-Dateien unkomprimiertes PCM speichern, bewahren sie die volle Audioklangtreü — entscheidend beim Training akustischer Modelle, bei denen selbst kleine Artefakte die Ergebnisse verfälschen können.
Erstveröffentlichung: 1990

Häufig gestellte Fragen

Warum MPG in SPH umwandeln?

SPH (NIST Sphere) ist das Standardformat für Sprachforschungskorpora. Die Konvertierung erzeugt Audio, das mit linguistischen Forschungstools kompatibel ist.

Was verwendet SPH-Dateien?

Die NIST-Sprachtools, LDC-Korpora, Kaldi und HTK-Spracherkennungs-Frameworks arbeiten alle mit Sphere-formatiertem Audio.

Enthält SPH Metadaten?

Ja — Sphere-Dateien haben einen reichhaltigen Text-Header, der Abtastrate, Kodierung, Kanalanzahl und benutzerdefinierte Metadatenfelder speichert.

Ist SPH zur allgemeinen Wiedergabe geeignet?

SPH ist ein Forschungsformat. Konvertieren Sie für allgemeines Hören in WAV oder MP3. SPH eignet sich am besten für Sprachanalyse-Pipelines.

Kann ich mehrere Dateien extrahieren?

Laden Sie mehrere MPG-Dateien hoch und extrahieren Sie SPH-Audio aus jeder — bauen Sie Forschungsdatensätze effizient in einer Sitzung auf.