AV1 in NIST Konverter

NIST-Sphere-Audio aus AV1-Video online extrahieren

Dateien hierhin und ablegen. 1 GB maximale dateigröße oder Registrieren
in
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Forschungsstandard

NIST Sphere ist der Regierungsstandard für Sprachdatenaustausch — die Konvertierung von AV1 erzeugt forschungsfertiges Audio.

Korpus-Einstellungen

Konfigurieren Sie Abtastrate und Kodierung passend zu den exakten Anforderungen Ihres Sprachevaluierungs- oder Trainingskorpus.

Sichere Konvertierung

AV1-Uploads werden sofort nach der Verarbeitung gelöscht und NIST-Ausgaben innerhalb von 24 Stunden entfernt.

Wie man AV1 in NIST konvertiert

1

Wählen Sie Dateien vom Computer, Google Drive, Dropbox, einer URL oder durch Ziehen auf die Seite.

2

Wählen Sie nist oder irgendein anderes Format, das Sie als Ergebnis haben wollen (mehr als 200 Formate unterstützt)

3

Lassen Sie die Datei konvertieren und Sie können Ihre nist-Datei direkt danach herunterladen

Über die Formate

AV1 (AOMedia Video 1) ist ein offenes, lizenzgebührenfreies Videokodierungsformat, das von der Alliance for Open Media entwickelt wurde — einem Konsortium, zu dessen Gründungsmitgliedern unter anderem Google, Mozilla, Microsoft, Amazon, Netflix und Intel gehören. Die Spezifikation wurde im Juni 2018 finalisiert mit dem Ziel, einen Videocodec der nächsten Generation bereitzustellen, der die Kompressionseffizienz von H.264 und HEVC übertrifft und dabei frei von Lizenzgebühren bleibt. AV1 erreicht rund 30-50% bessere Kompression als HEVC bei gleichwertiger visueller Qualität, was es besonders attraktiv für Streaming-Plattformen macht, die Bandbreitenkosten senken wollen, ohne das Zuschaürerlebnis einzuschränken. Der Codec unterstützt ein breites Spektrum an Funktionen, darunter Filmkorn-Synthese, flexible Kachelung für parallele Verarbeitung, inhaltsadaptive Auflösungsumschaltung und einen reichen Satz an Intra- und Inter-Vorhersagemodi. Die Hardware-Dekodierungsunterstützung ist rapide gewachsen — über mobile Prozessoren, GPUs und Smart-TVs hinweg — und adressiert frühe Bedenken hinsichtlich der Rechenanforderungen bei der Kodierung. AV1 wurde von großen Streaming-Diensten für die Bereitstellung von 4K- und HDR-Inhalten übernommen und dient als Videokomponente des WebM-Containers für webbasierte Wiedergabe. Der lizenzgebührenfreie Status macht AV1 besonders bedeutsam für offene Web-Standards und barrierefreie Medienverbreitung.
Erstveröffentlichung: 25. Juni 2018
NIST SPHERE (SPeech HEader REsources) ist ein spezialisiertes Audiodateiformat, das vom National Institute of Standards and Technology für die Sprachforschung entwickelt wurde, insbesondere für DARPA-geförderte Projekte. Das Format umhüllt rohe Audiosamples mit einem strukturierten ASCII-Header, der Metadaten wie Abtastrate, Kanalanzahl, Kodierungstyp, Sprecherdemografie und Transkriptionsannotationen enthält — ideal für die Verteilung von Sprachkorpora. NIST-Dateien speichern typischerweise unkomprimiertes PCM oder Mu-Law-Audio bei Telefonie-Abtastraten (8 kHz oder 16 kHz), obwohl der Container flexibel genug für verschiedene Kodierungen ist. Ein wesentlicher Vorteil ist der reichhaltige, selbstbeschreibende Header, der es Forschern ermöglicht, detaillierte Korpus-Metadaten direkt in die Datei einzubetten und so Begleitdateien überflüssig zu machen. SPHERE hat sich zudem als De-facto-Standard für bedeutende Sprachdatenbanken wie TIMIT, Switchboard und das Fisher-Korpus etabliert und genießt breite Anerkennung in akademischen und staatlichen Laboren. Die offene Spezifikation und die Verfügbarkeit von Kommandozeilentools (sphere, h_strip, w_decode) machen es unkompliziert, diese Dateien in Sprachverarbeitungspipelines programmatisch zu konvertieren, zu inspizieren und zu verarbeiten.
Erstveröffentlichung: 1990

Häufig gestellte Fragen

Warum AV1 in NIST konvertieren?

NIST Sphere ist das Standard-Austauschformat für Sprachforschungsdaten — verwendet von staatlichen und akademischen Sprachevaluierungsprogrammen.

Was öffnet NIST-Dateien?

NIST-Sprachtools, SoX, Kaldi und HTK verarbeiten NIST-Sphere-Audio für Forschungs- und Evaluierungszwecke.

Wie unterscheidet sich NIST von SPH?

NIST und SPH beziehen sich auf dasselbe NIST-Sphere-Format — verschiedene Dateierweiterungen für identische Audio-Container-Spezifikationen.

Welche Einstellungen funktionieren am besten?

Sprachforschung erfordert typischerweise 8 kHz oder 16 kHz, 16-Bit Mono — passen Sie diese an Ihre Korpus-Spezifikationen an.

Sind meine Daten privat?

AV1-Uploads werden sofort gelöscht. NIST-Ausgaben werden innerhalb von 24 Stunden entfernt.