Konwerter plików AMR do HTK
Konwertuj swoje pliki w formacie amr do formatu htk przez Internet i bezpłatnie
amr
htk
Jak przekonwertować plik w formacie AMR do formatu HTK
Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.
Wybierz format htk lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).
Poczekaj, aż plik zostanie przekonwertowany do formatu htk; od razu po konwersji możesz go pobrać.
O formatach
AMR (Adaptive Multi-Rate) to skompresowany format audio zoptymalizowany pod katem mowy, standaryzowany przez Europejski Instytut Norm Telekomunikacyjnych i przyjety jako obowiazkowy kodek w sieciach GSM i 3G. Kodek dynamicznie przelacza sie miedzy osmioma szybkosciami transmisji — od 4,75 do 12,2 kbps — w zaleznosci od warunkow sieciowych i poziomu szumu tla. Gdy jakosc lacza spada, koder przechodzi na nizsza przepustowosc, wymieniaiac nieznaczna czytelnosc na niezawodnosc transmisji. Ten mechanizm adaptacyjny zdefiniowany jest w specyfikacjach 3GPP i reprezentuje jeden z najszerzej wdrozonych kodekow glosowych na swiecie, uzywany w miliardach polaczen telefonii komorkowej. Glowna zaleta jest efektywnosc kompresji: jedna minuta dzwieku AMR przy 12,2 kbps zajmuje ok. 90 KB, co jest praktyczne dla notatek glosowych, poczty glosowej i MMS w sieciach o ograniczonej przepustowosci. Kolejnym atutem jest wbudowana detekcja aktywnosci glosowej i generowanie szumu komfortu, co redukuje transmisje w czasie ciszy. Choc AMR nie nadaje sie do muzyki ze wzgledu na waskie pasmo (300-3400 Hz), doskonale sprawdza sie w dostarczaniu zrozumialej mowy w trudnych warunkach sieciowych.
HTK to natywny kontener fal dzwiekowych dla Hidden Markov Model Toolkit — pakietu oprogramowania opracowanego na Wydziale Inzynierii Uniwersytetu Cambridge do badan nad rozpoznawaniem mowy. Po raz pierwszy udostepniony w 1993 roku, HTK szybko stal sie platforma referencyjnaw laboratoriach lingwistyki obliczeniowej na calym swiecie, a jego format plikow poszedl w jego slady. Kazdy plik przechowuje sekwencje wektorow parametrow lub surowe probki, poprzedzone 12-bajtowym naglowkiem okreslajacym liczbe ramek, okres ramki w jednostkach 100 ns, liczbe bajtow na ramke oraz kod typu wskazujacy rodzaj danych — opcje obejmuja zarowno przebieg PCM, jak i wspolczynniki mel-czestotliwosciowe oraz energie pasma filtrowego. Ta wszechstronnosc pozwala pojedynczemu kontenerowi przenosic zarowno zrodlowe audio, jak i wyekstrahowane cechy bez zmiany parserow. Celowo minimalny naglowek unika wyrownan paddingu czy opcjonalnych blokow, co czyni format trywialnym do odczytu z C, Pythona czy MATLAB-a za pomoca kilku linii binarnego I/O. Trzy zalety stanowia o trwalym znaczeniu HTK: scisla integracja z potokiem trenowania i rozpoznawania HTK, deterministyczny uklad bajtow eliminujacy niejednoznacznosc parsera oraz szerokie przyjecie w korpusach akademickich.