MPEG do SPH Konwerter

Wyodrębnij audio MPEG jako format mowy NIST SPHERE

Wybierz pliki

Upuść pliki tutaj. 1 GB Maksymalny rozmiar pliku lub Zapisz się

Wideo do korpusu mowy

Wyodrębnij dialogi z wideo MPEG i zapakuj je jako NIST SPHERE — pomijając ręczną ekstrakcję przy budowaniu zbiorów danych badawczych.

Standard NIST

Wyjście SPH spełnia specyfikacje NIST SPHERE dokładnie. Importuj bezpośrednio do Kaldi, HTK lub dowolnego frameworka rozpoznawania mowy.

Bezpieczna obsługa

Przesłane pliki MPEG są usuwane po konwersji. Pliki wyjściowe SPH są kasowane w ciągu 24 godzin — Twoje materiały badawcze pozostają poufne.

Jak przekonwertować plik w formacie MPEG do formatu SPH

Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.

Wybierz format sph lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).

Poczekaj, aż plik zostanie przekonwertowany do formatu sph; od razu po konwersji możesz go pobrać.

O formatach

MPEG (MPEG-1) to fundamentalny standard kompresji wideo i audio opublikowany w sierpniu 1993 roku przez Moving Picture Experts Group jako ISO/IEC 11172. Byl to pierwszy miedzynarodowy standard stratnej kompresji ruchomych obrazow i towarzyszacego audio, ustanawiajacy zasady i techniki, ktore wplynely na praktycznie wszystkie kolejne kodeki wideo. Wideo MPEG-1 osiaga kompresje poprzez kombinacje predykcji kompensowanej ruchem, kodowania dyskretna transformata kosinusowa i kodowania entropijnego o zmiennej dlugosci, zorganizowanego wokol trzech typow klatek: I-klatki (kodowane wewnetrznie), P-klatki (predykcyjne) i B-klatki (predykcyjne dwukierunkowo). Standard celuje w szybkosci transmisji ok. 1,5 Mbps dla laczonego audio i wideo, tworzac jakosc porownywalna z tasma VHS przy rozdzielczosci SIF (352x240 dla NTSC). Ten poziom kompresji zostal specjalnie dobrany, by odpowiadac przepustowosci danych napedow CD-ROM o predkosci 1x, umozliwiajac format Video CD, ktory przyniosl cyfrowe wideo konsumentom na poczatku lat 90. Komponent audio, szczegolnie Layer III (MP3), stal sie najbardziej wplywowym formatem audio w historii. Struktura klatek I/P/B, podejscie do estymacji ruchu i kodowanie transformata blokowa ustanowily architektoniczny szablon stosowany przez kazdy wiekszy kodek wideo od tamtej pory — od MPEG-2 przez H.264 i dalej. Choc dawno przewyzszony pod wzgledem efektywnosci kompresji, MPEG-1 pozostaje obslugiwany przez praktycznie kazde oprogramowanie multimedialne.

Twórca: Moving Picture Experts Group

Pierwsze wydanie: Sierpień 1993

SPH to rozszerzenie plikow audio przechowywanych w formacie NIST SPHERE (SPeech HEader REsources) — standardzie stworzonym przez amerykanski National Institute of Standards and Technology okolo 1990 roku. Przeznaczony do badan nad mowa, pliki SPH zawieraja 1024-bajtowy naglowek ASCII wypelniony metadanymi — identyfikatorami bazy danych, liczba kanalow, czestotliwoscia probkowania, kolejnoscia bajtow i typem kompresji — co czyni kazde nagranie samoopisujoacy sie. Dane audio to zwykle 16-bitowe liniowe PCM probkowane przy 16 kHz, choc dozwolone sa inne konfiguracje. Badacze z NIST, DARPA i uniwersytetow na calym swiecie polegaja na SPH przy dystrybucji korpusow mowy, takich jak TIMIT, Switchboard i kolekcje LDC, ktore stanowia fundament nowoczesnych systemow automatycznego rozpoznawania mowy. Kluczowa zaleta jest to, ze czytelny naglowek pozwala skryptom parsowac metadane nagrania bez dekodowania binarnego. Scisla standaryzacja formatu eliminuje tez niejednoznacznosc przy wspoldzieleniu zbiorow danych miedzy instytucjami i platformami. Poniewaz pliki SPH przechowuja nieskompresowane PCM, zachowuja pelna wiernosc audio — co jest krytyczne przy trenowaniu modeli akustycznych, gdzie nawet drobne artefakty moga znieksztalcic wyniki.

Twórca: National Institute of Standards and Technology

Pierwsze wydanie: 1990

Często Zadawane Pytania

Dlaczego warto konwertować MPEG na SPH?

SPH to standard NIST SPHERE dla badań nad mową. Dialogi z wideo MPEG stają się prawidłowo sformatowanymi danymi do treningu ASR i ewaluacji.

Jakie narzędzia obsługują SPH?

Kaldi, HTK, Praat i zestaw narzędzi NIST SPHERE obsługują SPH natywnie. To standardowy format wymiany dla badań audio mowy.

Czy SPH kompresuje audio?

Nie — SPH przechowuje dane PCM bez kompresji stratnej. Audio MPEG trafia do formatu SPHERE w pełnej jakości do dokładnego przetwarzania mowy.

Czy audio MPEG-1 jest wystarczające?

Audio MPEG-1 zapewnia odpowiednią jakość do badań nad mową. Dialogi są dobrze zachowane podczas ekstrakcji i kodowania SPH.

Czy mogę konwertować wiele plików MPEG?

Prześlij wiele wideo MPEG i skonwertuj je partiami do SPH. Wydajne przy budowaniu korpusów mowy z archiwalnych kolekcji wideo.

Powiązane konwersje

MPEG do MP3

MPEG do WAV

MPEG do MP4

MPEG do OGG

MPEG do M4A

MPEG do WMA

MPEG do GIF

MPEG do FLAC

MPEG do AAC

MPEG do AVI

MPEG do M4R

MPEG do AIFF

MPEG do MJPEG

MPEG do MOV

MPEG do WMV

MPEG do AMR

MPEG do OPUS

MPEG do DIVX

MPEG do GSM

MPEG do AC3

MPEG do 3GP

MPEG do AV1

MPEG do MP2

MPEG do WEBM

MPEG do FLV

MPEG do VOB

MPEG do CDDA

MPEG do AU

MPEG do M4V

MPEG do XVID

MPEG do MKV

MPEG do DTS

MPEG do TS

MPEG do W64

MPEG do AVCHD

MPEG do HEVC

MPEG do SWF

MPEG do OGV

MPEG do M2V

MPEG do SLN

MPEG do F4V

MPEG do VOX

MPEG do ASF

MPEG do 3G2

MPEG do CAF

MPEG do 8SVX

MPEG do WV

MPEG do SPX

MPEG do VOC

MPEG do OGA

MPEG do MTS

MPEG do RMVB

MPEG do RA

MPEG do CVS

MPEG do SD2

MPEG do WVE

MPEG do AMB

MPEG do MXF

MPEG do PVF

MPEG do AVR

Dedykowane konwertery

MP3 do SPH

WAV do SPH

MP4 do SPH

ASF do SPH

FLAC do SPH

M4A do SPH

OGG do SPH

SWF do SPH

WVE do SPH

3G2 do SPH

3GP do SPH

AAF do SPH

AV1 do SPH

AVCHD do SPH

AVI do SPH

CAVS do SPH

DIVX do SPH

DV do SPH

F4V do SPH

FLV do SPH

HEVC do SPH

M2TS do SPH

M2V do SPH

M4V do SPH

MJPEG do SPH

MKV do SPH

MOD do SPH

MOV do SPH

MPEG do SPH

MPEG-2 do SPH