Konwerter plików DSS do NIST
Konwertuj swoje pliki w formacie dss do formatu nist przez Internet i bezpłatnie
dss
nist
Jak przekonwertować plik w formacie DSS do formatu NIST
Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.
Wybierz format nist lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).
Poczekaj, aż plik zostanie przekonwertowany do formatu nist; od razu po konwersji możesz go pobrać.
O formatach
DSS (Digital Speech Standard) to wlasciciowy format nagrywania glosu opracowany przez Olympus, Philips i Grundig w 1994 roku za posrednictwem International Voice Association. Zaprojektowany z mysla o przepływach pracy dyktowania, DSS stosuje kompresje zoptymalizowana pod katem mowy przy bardzo niskich szybkosciach transmisji — oryginalny standard koduje przy ok. 13,7 kbps, a DSS Pro osiaga ok. 28 kbps z poprawiona czytelnoscia. Kodek koncentruje swój budzet na zakresach czestotliwosci charakterystycznych dla ludzkiej mowy, zamiast na pelnym spektrum audio, tworzac wyjatkowo kompaktowe pliki. Profesjonalne dyktafony Olympusa i Philipsa uzywaja DSS natywnie, integrujac sie z oprogramowaniem do transkrypcji obslugujacym flagi priorytetow, zakladki i identyfikacje autora w metadanych plikow. Jedna z zalet jest efektywnosc rozmiaru pliku: godzina dyktowania zajmuje zaledwie 6-12 MB, co jest praktyczne w srodowiskach o duzym wolumenie, takich jak szpitale, kancelarie prawne i sady. Wbudowane metadane umozliwiaja bezproblemowe kierowanie przez kolejki transkrypcji z automatycznym sortowaniem priorytetow. Chociaz DSS jest formatem zamknietym z odtwarzaniem ograniczonym do kompatybilnego oprogramowania, jego dominacja w profesjonalnym dyktowaniu zapewnia ciagla obsluge przez glowne platformy transkrypcyjne.
NIST SPHERE (SPeech HEader REsources) to specjalistyczny format plikow audio stworzony przez National Institute of Standards and Technology na potrzeby badan nad mowa, w szczegolnosci projektow finansowanych przez DARPA. Format opakowuje surowe probki audio w strukturalny naglowek ASCII kodujacy metadane, takie jak czestotliwosc probkowania, liczba kanalow, typ kodowania, dane demograficzne mowcy i adnotacje transkrypcyjne — co czyni go idealnym do dystrybucji korpusow mowy. Pliki NIST zwykle przechowuja nieskompresowane PCM lub audio mu-law przy czestotliwosciach probkowania klasy telefonicznej (8 kHz lub 16 kHz), choc kontener jest na tyle elastyczny, by pomiescic rozne kodowania. Kluczowa zaleta jest bogaty, samoopisujoacy sie naglowek, pozwalajacy badaczom osadzac szczegolowe metadane korpusowe bezposrednio w pliku, eliminujac potrzebe osobnych plikow towarzyszacych. SPHERE stal sie rowniez de facto standardem dla glownych baz danych mowy, takich jak TIMIT, Switchboard i korpus Fisher, zapewniajac szerokie uznanie w laboratoriach akademickich i rzadowych. Otwarta specyfikacja i dostepnosc narzedzi wiersza polecen (sphere, h_strip, w_decode) umozliwiaja latwa konwersje, inspekcje i przetwarzanie tych plikow programistycznie w potokach przetwarzania mowy.