HTK'den SPX'ye dönüştürücü
htk dosyalarınızı spx'ye çevrimiçi & ücretsiz olarak dönüştürün
htk
spx
Ayarlar
Otomatik
Speex için toplam çıkış ses bit oranını ayarlayın. İnsan konuşma kodlaması için tasarlanan Speex, maksimum bit oranı 44 kbps olan ultra düşük bit oranında şeffaflığa ulaşır.
Otomatik (Değişiklik yok)
Ses kanalı sayısını ayarlayın. Bu ayar en çok kanalları downmixlerken kullanışlıdır (örn. 5,1'den stereo'ya).
Otomatik (Değişiklik yok)
Sesin örnek oranını ayarlayın. Tam spektrumlu (20 Hz — 20 kHz) müzik, şeffaflık elde etmek için 44.1 kHz'den düşük olmayan değerler gerektirir. Viki'de daha fazla bilgi bulunabilir.
htk
HTK, Cambridge Üniversitesi Mühendislik Bölümü'nde konuşma tanıma araştırmaları için geliştirilen bir yazılım paketi olan Hidden Markov Model Toolkit'ın yerel dalga formu kapsayıcısıdır. 1993'te i̇lk dağıtılan HTK, dünya genelinde hesaplamalı dilbilim laboratuvarlarında hızla referans platform haline gelmiş ve dosya formatı da aynı yolu izlemiştir. Her dosya, çerçeve sayısını, 100 ns birimlerinde çerçeve süresini, çerçeve başına bayt sayısını ve veri türünü belirten bir tür kodu içeren 12 baytlık bir başlık ile öncelenmiş parametre vektörleri veya ham örnekler dizisi depolar — dalga formu PCM'den Mel-frekans kepstral katsayılarına ve filtre bankası enerjilerine kadar seçenekler mevcuttur. Bu çok yönlülük, tek bir kapsayıcının hem kaynak sesi hem de çıkarılan özellikleri ayrıştırıcı değiştirmeden taşımasını sağlar. Kasıtlı olarak minimalist başlık, hizalama dolgusu veya isteğe bağlı yığınlardan kaçınarak formatı C, Python veya MATLAB'da birkaç satır i̇kili G/Ç ile okumayı kolaylaştırır. HTK'nın kalıcı önemini destekleyen üç avantaj: HTK eğitim ve tanıma hattıyla sıkı entegrasyon, ayrıştırıcı belirsizliğini ortadan kaldıran deterministik bayt düzeni ve akademik veri derlemlerinde yaygın benimseme.
devamını oku
spx
Speex, Xiph.Org Vakfı bünyesinde Jean-Marc Valin tarafından geliştirilen, konuşma sıkıştırması için özel olarak tasarlanmış açık kaynaklı bir ses kodekidir. İlk olarak Ekim 2002'de yayınlanan kodek, IP üzerinden ses, konferans ve konuşulan dilin ağ üzerinden verimli şekilde iletilmesi gereken her senaryoyu hedefler. SPX dosyaları, kodek'ın konuşma optimizasyonunu Ogg'un akış yetenekleriyle eşleştirerek Speex kodlu sesi Ogg kapsayıcısı içinde sarar. Üç örnekleme hızı desteklenir — dar bant için 8 kHz, geniş bant için 16 kHz ve ultra geniş bant için 32 kHz — konuşma karmaşıklığına gerçek zamanlı uyum sağlayan değişken bit hızlı kodlamayla birlikte. Öne çıkan avantajı patent içermeyen, BSD lisanslı yapısıdır ve geliştiricilerin hem ticari hem de açık kaynak ürünlere serbestçe yerleştirmesine olanak tanır. Speex ayrıca rakip kodeklerin genellikle harici kütüphanelere bıraktığı akustik eko giderme, gürültü bastırma ve otomatik kazanç kontrolü özelliklerini de bünyesinde barındırır. Yaratıcıları 2012'den beri Opus)'ü resmi olarak halef olarak önerse de Speex, hafif kod çözücü ayak izinin hâlâ değer gördüğü eski VoIP sistemlerinde, arşivlenmiş kayıtlarda ve gömülü cihazlarda kullanılmaya devam etmektedir.
devamını oku
HTK'i SPX'ye dönüştürme yöntemi
Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.
spx ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)
Haydi dosyayı dönüştürün ve spx dosyanızı hemen sonra indirebilirsiniz
Formatlar hakkında
HTK, Cambridge Üniversitesi Mühendislik Bölümü'nde konuşma tanıma araştırmaları için geliştirilen bir yazılım paketi olan Hidden Markov Model Toolkit'ın yerel dalga formu kapsayıcısıdır. 1993'te i̇lk dağıtılan HTK, dünya genelinde hesaplamalı dilbilim laboratuvarlarında hızla referans platform haline gelmiş ve dosya formatı da aynı yolu izlemiştir. Her dosya, çerçeve sayısını, 100 ns birimlerinde çerçeve süresini, çerçeve başına bayt sayısını ve veri türünü belirten bir tür kodu içeren 12 baytlık bir başlık ile öncelenmiş parametre vektörleri veya ham örnekler dizisi depolar — dalga formu PCM'den Mel-frekans kepstral katsayılarına ve filtre bankası enerjilerine kadar seçenekler mevcuttur. Bu çok yönlülük, tek bir kapsayıcının hem kaynak sesi hem de çıkarılan özellikleri ayrıştırıcı değiştirmeden taşımasını sağlar. Kasıtlı olarak minimalist başlık, hizalama dolgusu veya isteğe bağlı yığınlardan kaçınarak formatı C, Python veya MATLAB'da birkaç satır i̇kili G/Ç ile okumayı kolaylaştırır. HTK'nın kalıcı önemini destekleyen üç avantaj: HTK eğitim ve tanıma hattıyla sıkı entegrasyon, ayrıştırıcı belirsizliğini ortadan kaldıran deterministik bayt düzeni ve akademik veri derlemlerinde yaygın benimseme.
Speex, Xiph.Org Vakfı bünyesinde Jean-Marc Valin tarafından geliştirilen, konuşma sıkıştırması için özel olarak tasarlanmış açık kaynaklı bir ses kodekidir. İlk olarak Ekim 2002'de yayınlanan kodek, IP üzerinden ses, konferans ve konuşulan dilin ağ üzerinden verimli şekilde iletilmesi gereken her senaryoyu hedefler. SPX dosyaları, kodek'ın konuşma optimizasyonunu Ogg'un akış yetenekleriyle eşleştirerek Speex kodlu sesi Ogg kapsayıcısı içinde sarar. Üç örnekleme hızı desteklenir — dar bant için 8 kHz, geniş bant için 16 kHz ve ultra geniş bant için 32 kHz — konuşma karmaşıklığına gerçek zamanlı uyum sağlayan değişken bit hızlı kodlamayla birlikte. Öne çıkan avantajı patent içermeyen, BSD lisanslı yapısıdır ve geliştiricilerin hem ticari hem de açık kaynak ürünlere serbestçe yerleştirmesine olanak tanır. Speex ayrıca rakip kodeklerin genellikle harici kütüphanelere bıraktığı akustik eko giderme, gürültü bastırma ve otomatik kazanç kontrolü özelliklerini de bünyesinde barındırır. Yaratıcıları 2012'den beri Opus)'ü resmi olarak halef olarak önerse de Speex, hafif kod çözücü ayak izinin hâlâ değer gördüğü eski VoIP sistemlerinde, arşivlenmiş kayıtlarda ve gömülü cihazlarda kullanılmaya devam etmektedir.