HTK'den AMR'ye dönüştürücü
htk dosyalarınızı amr'ye çevrimiçi & ücretsiz olarak dönüştürün
htk
amr
Ayarlar
12.2 kbps
AMR ses çözücüsü, 7.4 kbit/sn'den başlayan ücretli kaliteli konuşmayla 4.75 12.2 kbit/sn arasında değişen çeşitli oranlarını destekler.
Mono (1.0)
Ses kanalı sayısını ayarlayın. Bu ayar en çok kanalları downmixlerken kullanışlıdır (örn. 5,1'den stereo'ya).
8000 Hz
Sesin örnek oranını ayarlayın. Tam spektrumlu (20 Hz — 20 kHz) müzik, şeffaflık elde etmek için 44.1 kHz'den düşük olmayan değerler gerektirir. Viki'de daha fazla bilgi bulunabilir.
htk
HTK, Cambridge Üniversitesi Mühendislik Bölümü'nde konuşma tanıma araştırmaları için geliştirilen bir yazılım paketi olan Hidden Markov Model Toolkit'ın yerel dalga formu kapsayıcısıdır. 1993'te i̇lk dağıtılan HTK, dünya genelinde hesaplamalı dilbilim laboratuvarlarında hızla referans platform haline gelmiş ve dosya formatı da aynı yolu izlemiştir. Her dosya, çerçeve sayısını, 100 ns birimlerinde çerçeve süresini, çerçeve başına bayt sayısını ve veri türünü belirten bir tür kodu içeren 12 baytlık bir başlık ile öncelenmiş parametre vektörleri veya ham örnekler dizisi depolar — dalga formu PCM'den Mel-frekans kepstral katsayılarına ve filtre bankası enerjilerine kadar seçenekler mevcuttur. Bu çok yönlülük, tek bir kapsayıcının hem kaynak sesi hem de çıkarılan özellikleri ayrıştırıcı değiştirmeden taşımasını sağlar. Kasıtlı olarak minimalist başlık, hizalama dolgusu veya isteğe bağlı yığınlardan kaçınarak formatı C, Python veya MATLAB'da birkaç satır i̇kili G/Ç ile okumayı kolaylaştırır. HTK'nın kalıcı önemini destekleyen üç avantaj: HTK eğitim ve tanıma hattıyla sıkı entegrasyon, ayrıştırıcı belirsizliğini ortadan kaldıran deterministik bayt düzeni ve akademik veri derlemlerinde yaygın benimseme.
devamını oku
amr
AMR (Adaptive Multi-Rate), konuşma için optimize edilmiş sıkıştırılmış bir ses formatıdır ve Avrupa Telekomünikasyon Standartları Enstitüsü tarafından standartlaştırılarak GSM ve 3G mobil ağlar için zorunlu kodek olarak benimsenmiştir. Kodek, ağ koşullarına ve arka plan gürültü seviyelerine bağlı olarak 4,75 ile 12,2 kbps arasında sekiz bit hızı arasında dinamik olarak geçiş yapar. Bağlantı kalitesi düştüğünde, kodlayıcı marjinal netliği iletim güvenilirliğiyle takas ederek daha düşük bir hıza geçer. Bu uyarlanabilir mekanizma 3GPP spesifikasyonlarında tanımlanmıştır ve milyarlarca mobil aramada kullanılan, küresel ölçekte en yaygın konuşma kodeklerinden birini temsil eder. Başlıca avantajı sıkıştırma verimliliğidir: 12,2 kbps'de bir dakikalık AMR sesi yaklaşık 90 KB yer kaplar ve bant genişliği kısıtlı ağlarda sesli notlar, sesli mesajlar ve MMS için son derece pratiktir. Diğer bir yararı işe yerleşik ses aktivite algılama ve konfor gürültüsü üretimi olup sessizlik sırasında iletimi azaltır. AMR, dar bant genişliği (300-3400 Hz) nedeniyle müzik için uygun olmasa da zorlu ağ koşullarında anlaşılır konuşma iletiminde üstün başarı gösterir.
devamını oku
HTK'i AMR'ye dönüştürme yöntemi
Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.
amr ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)
Haydi dosyayı dönüştürün ve amr dosyanızı hemen sonra indirebilirsiniz
Formatlar hakkında
HTK, Cambridge Üniversitesi Mühendislik Bölümü'nde konuşma tanıma araştırmaları için geliştirilen bir yazılım paketi olan Hidden Markov Model Toolkit'ın yerel dalga formu kapsayıcısıdır. 1993'te i̇lk dağıtılan HTK, dünya genelinde hesaplamalı dilbilim laboratuvarlarında hızla referans platform haline gelmiş ve dosya formatı da aynı yolu izlemiştir. Her dosya, çerçeve sayısını, 100 ns birimlerinde çerçeve süresini, çerçeve başına bayt sayısını ve veri türünü belirten bir tür kodu içeren 12 baytlık bir başlık ile öncelenmiş parametre vektörleri veya ham örnekler dizisi depolar — dalga formu PCM'den Mel-frekans kepstral katsayılarına ve filtre bankası enerjilerine kadar seçenekler mevcuttur. Bu çok yönlülük, tek bir kapsayıcının hem kaynak sesi hem de çıkarılan özellikleri ayrıştırıcı değiştirmeden taşımasını sağlar. Kasıtlı olarak minimalist başlık, hizalama dolgusu veya isteğe bağlı yığınlardan kaçınarak formatı C, Python veya MATLAB'da birkaç satır i̇kili G/Ç ile okumayı kolaylaştırır. HTK'nın kalıcı önemini destekleyen üç avantaj: HTK eğitim ve tanıma hattıyla sıkı entegrasyon, ayrıştırıcı belirsizliğini ortadan kaldıran deterministik bayt düzeni ve akademik veri derlemlerinde yaygın benimseme.
AMR (Adaptive Multi-Rate), konuşma için optimize edilmiş sıkıştırılmış bir ses formatıdır ve Avrupa Telekomünikasyon Standartları Enstitüsü tarafından standartlaştırılarak GSM ve 3G mobil ağlar için zorunlu kodek olarak benimsenmiştir. Kodek, ağ koşullarına ve arka plan gürültü seviyelerine bağlı olarak 4,75 ile 12,2 kbps arasında sekiz bit hızı arasında dinamik olarak geçiş yapar. Bağlantı kalitesi düştüğünde, kodlayıcı marjinal netliği iletim güvenilirliğiyle takas ederek daha düşük bir hıza geçer. Bu uyarlanabilir mekanizma 3GPP spesifikasyonlarında tanımlanmıştır ve milyarlarca mobil aramada kullanılan, küresel ölçekte en yaygın konuşma kodeklerinden birini temsil eder. Başlıca avantajı sıkıştırma verimliliğidir: 12,2 kbps'de bir dakikalık AMR sesi yaklaşık 90 KB yer kaplar ve bant genişliği kısıtlı ağlarda sesli notlar, sesli mesajlar ve MMS için son derece pratiktir. Diğer bir yararı işe yerleşik ses aktivite algılama ve konfor gürültüsü üretimi olup sessizlik sırasında iletimi azaltır. AMR, dar bant genişliği (300-3400 Hz) nedeniyle müzik için uygun olmasa da zorlu ağ koşullarında anlaşılır konuşma iletiminde üstün başarı gösterir.