MPG'den HTK'ya Dönüştürücü

Konuşma araştırması için MPG'den HTK sesi çıkarın — çevrimiçi

Dosyaları buraya bırakın. 1 GB maksimum dosya boyutu veya Kaydol
için
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Konuşma Araştırması

HTK, konuşma tanıma eğitimi için özel olarak tasarlanmıştır. MPG video kaynaklarınızdan düzgün biçimlendirilmiş araştırma verisi çıkarın.

Bulut İşleme

Ses çıkarımı sunucularımızda gerçekleşir — yalnızca format dönüştürme için HTK araç takımı kurulumu gerekmez.

Veri Güvenliği

Yüklenen MPG dosyaları işleme sonrasında silinir. HTK sonuçları 24 saat içinde sunuculardan kaldırılır.

MPG'i HTK'ye dönüştürme yöntemi

1

Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.

2

htk ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)

3

Haydi dosyayı dönüştürün ve htk dosyanızı hemen sonra indirebilirsiniz

Formatlar hakkında

MPG, Hareketli Görüntü Uzmanlar Grubu tarafından geliştirilen MPEG-1 veya MPEG-2 sıkıştırma standartları kullanılarak kodlanmış video dosyaları için yaygın bir dosya uzantısıdır. Üç karakterli uzantı, uzantıları üç karakterle sınırlayan erken Windows ve DOS dosya sistemlerinden kaynaklanarak daha uzun MPEG adlandırmasının kısaltmasını sağlar. MPG dosyaları, bir video ve bir veya daha fazla ses temel akışını senkronizasyon zaman damgalarıyla birleşik bir bayt akışına çoğullayan MPEG program akışları içerir. Format, 1990'lar ve 2000'ler boyunca kişisel bilgisayarlarda dijital video depolamak için yaygın biçimde kullanılmış ve Video CD kopyalarından DVD çıkarmalarına, donanım kodlayıcı kartlarıyla yakalanan dijital TV kayıtlarına kadar her alanda karşılaşılmıştır. MPEG-1 sıkıştırması kullanan MPG dosyaları genellikle yaklaşık 1,5 Mbps bit hızlarında 352x240 (NTSC) veya 352x288 (PAL) video içerirken, MPEG-2 kodlu MPG dosyaları tam HD'ye kadar daha yüksek çözünürlükleri destekler. Program akışı yapısı, yayın için tasarlanmış aktarım akışı varyantının aksine nispeten güvenilir bir depolama ortamı varsayarak hata kurtarma paketlerinin yükü olmadan dosya tabanlı oynatma için verimlilik sağlar. Geniş uyumluluk, formatın kalıcı güçlü yönlerinden biridir; çünkü tüm işletim sistemlerindeki neredeyse her medya oynatıcı ek codec yüklemesi olmadan bu dosyaları çözebilir. MPG, arşivlenmiş video içerikte, güvenlik kayıtlarında ve eski dijital video iş akışlarında hâlâ karşılaşılmaktadır.
İlk yayın: Ağustos 1993
HTK, Cambridge Üniversitesi Mühendislik Bölümü'nde konuşma tanıma araştırmaları için geliştirilen bir yazılım paketi olan Hidden Markov Model Toolkit'ın yerel dalga formu kapsayıcısıdır. 1993'te i̇lk dağıtılan HTK, dünya genelinde hesaplamalı dilbilim laboratuvarlarında hızla referans platform haline gelmiş ve dosya formatı da aynı yolu izlemiştir. Her dosya, çerçeve sayısını, 100 ns birimlerinde çerçeve süresini, çerçeve başına bayt sayısını ve veri türünü belirten bir tür kodu içeren 12 baytlık bir başlık ile öncelenmiş parametre vektörleri veya ham örnekler dizisi depolar — dalga formu PCM'den Mel-frekans kepstral katsayılarına ve filtre bankası enerjilerine kadar seçenekler mevcuttur. Bu çok yönlülük, tek bir kapsayıcının hem kaynak sesi hem de çıkarılan özellikleri ayrıştırıcı değiştirmeden taşımasını sağlar. Kasıtlı olarak minimalist başlık, hizalama dolgusu veya isteğe bağlı yığınlardan kaçınarak formatı C, Python veya MATLAB'da birkaç satır i̇kili G/Ç ile okumayı kolaylaştırır. HTK'nın kalıcı önemini destekleyen üç avantaj: HTK eğitim ve tanıma hattıyla sıkı entegrasyon, ayrıştırıcı belirsizliğini ortadan kaldıran deterministik bayt düzeni ve akademik veri derlemlerinde yaygın benimseme.
İlk yayın: 1993

Sık Sorulan Sorular

MPG'yi neden HTK'ya dönüştürmelisiniz?

HTK, konuşma tanıma araştırması için Hidden Markov Model Toolkit tarafından kullanılan formattır. Dönüştürme, düzgün biçimlendirilmiş eğitim verisi sağlar.

HTK dosyalarını ne kullanır?

Cambridge HTK konuşma tanıma araç takımı, Kaldi ve diğer otomatik konuşma tanıma araştırma çerçeveleri HTK formatındaki ses verileriyle çalışır.

HTK genel ses için uygun mu?

Hayır — HTK özel bir araştırma formatıdır. Genel dinleme veya oynatma için WAV, MP3 veya FLAC kullanın.

Hangi örnekleme hızını kullanmalıyım?

Konuşma tanıma genellikle 16 kHz kullanır. Araştırma hattınıza uygun HTK verisi üretmek için bunu dönüştürme öncesinde ayarlayın.

Toplu dönüştürme yapabilir miyim?

Birden fazla MPG dosyası yükleyin ve her birinden aynı anda HTK sesi çıkarın — konuşma araştırma veri setleri oluşturmak için verimlidir.

MPG - HTK kalite değerlendirmesi

5.0 (1 oyları)
Geribildirim sağlamak için en az 1 dosya dönüştürmeniz ve indirmeniz gerekir!