AVI'den SPH'ye Dönüştürücü

AVI sesini NIST SPHERE konuşma formatına online çıkarın

Dosyaları buraya bırakın. 1 GB maksimum dosya boyutu veya Kaydol
için
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

AVI'den Konuşma Verisine

AVI'deki video sesini dilbilim veri setleri, tanıma eğitimi ve akustik analiz için hazır SPHERE formatındaki konuşma verisine dönüştürün.

Sunucu Taraflı İşleme

Ses çıkarma ve SPH kodlaması sunucularımızda çalışır. Kendi makineniz yüklenmeden kalır — yerel yazılım kurulumu gerekmez.

Araştırmaya Hazır Çıktı

AVI dosyalarınızdan SPH çıktısı NIST SPHERE spesifikasyonlarını karşılar. Doğrudan Kaldi, HTK veya diğer konuşma işleme çerçevelerine aktarın.

AVI'i SPH'ye dönüştürme yöntemi

1

Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.

2

sph ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)

3

Haydi dosyayı dönüştürün ve sph dosyanızı hemen sonra indirebilirsiniz

Formatlar hakkında

AVI (Audio Video Interleave), Microsoft tarafından Video for Windows teknolojisinin bir parçası olarak Kasım 1992'de tanıtılan en eski ve en tanınmış multimedya kapsayıcı formatlarından biridir. Resource Interchange File Format (RIFF) yapısı üzerine inşa edilen AVI, ses ve video verilerini dönüşümlü parçalar halinde iç içe geçirerek karmaşık akış yönetimi gerektirmeden senkronize oynatma sağlar. Format, codec bağımsızdır; yani erken dönem Cinepak ve Indeo'dan modern DivX, Xvid ve H.264 akışlarına kadar neredeyse her codec ile sıkıştırılmış videoyu barındırabilir. Bu esneklik, 1990'lar ve 2000'ler boyunca kişisel bilgisayarlarda yaygın biçimde benimsenmesine katkıda bulunmuştur. Dikkat çekici bir özelliği, AVI dosyalarının daha karmaşık modern kapsayıcılara kıyasla i̇kili düzeyde düzenlenmesi ve işlenmesinin nispeten kolay olan basit bir iç yapıya sahip olmasıdır. AVI ayrıca birden fazla ses akışını destekleyerek tek bir dosya içinde çok dilli içerik barındırmaya olanak tanır. Ancak orijinal spesifikasyonun eski uygulamalardaki 2 GB dosya boyutu sınırı ve değişken kare hızları veya gelişmiş altyazı formatları için yerel destek eksikliği gibi kısıtlamaları vardır. OpenDML uzantıları (AVI 2.0) bu boyut sınırlamasını ortadan kaldırmıştır. Onlarca yıllık olmasına rağmen AVI, en evrensel şekilde tanınan multimedya formatlarından biri olmaya devam etmekte ve tüm büyük işletim sistemlerinde medya oynatıcılar ve düzenleme araçları tarafından yaygın biçimde desteklenmektedir.
Geliştirici: Microsoft
İlk yayın: 10 Kasım 1992
SPH, 1990 civarında ABD Ulusal Standartlar ve Teknoloji Enstitüsü tarafından oluşturulan NIST SPHERE (SPeech HEader REsources) formatında depolanan sesin dosya uzantısıdır. Konuşma araştırması için tasarlanan SPH dosyaları, veritabanı tanımlayıcıları, kanal sayıları, örnekleme hızları, bayt sıralaması ve sıkıştırma türü gibi üst verilerle dolu 1024 baytlık ASCII başlık taşır — her kaydı kendi kendini tanımlayan hâle getirir. Temel ses genellikle 16 kHz'de örneklenmiş 16 bit doğrusal PCM'dır, ancak diğer yapılandırmalara da izin verilir. NIST, DARPA ve dünya genelindeki üniversitelerdeki araştırmacılar, modern otomatik konuşma tanıma sistemlerinin temelini oluşturan TIMIT, Switchboard ve LDC koleksiyonları gibi konuşma veri derlemlerini dağıtmak için SPH'ye güvenir. Önemli bir avantajı, i̇nsan tarafından okunabilir başlığın betiklerin i̇kili kod çözme olmadan kayıt üst verilerini ayrıştırmasına olanak tanımasıdır. Formatın sıkı standardizasyonu ayrıca kurumlar ve platformlar arasında veri setleri paylaşırken belirsizliği ortadan kaldırır. SPH dosyaları sıkıştırılmamış PCM depoladığından tam ses doğruluğunu korur — küçük artefaktların bile sonuçları çarpıtabileceği akustik modeller eğitilirken kritik bir özellik.
İlk yayın: 1990

Sık Sorulan Sorular

AVI'yi neden SPH'ye dönüştürmelisiniz?

SPH (SPHERE), dilbilim ve konuşma tanımada kullanılan NIST'ten bir konuşma ses standardıdır. AVI'yi dönüştürmek araştırma veri setleri için diyalog çıkarır.

SPH dosyalarıyla hangi araçlar çalışır?

HTK, Kaldi, Praat ve diğer konuşma analiz çerçeveleri SPH okur. NIST SPHERE araç seti de bu format için doğal araçlar sağlar.

SPH, NIST ile aynı mı?

SPH ve NIST her ikisi de Ulusal Standartlar ve Teknoloji Enstitüsü tarafından tanımlanan SPHERE formatını ifade eder. İşlevsel olarak aynıdırlar.

SPH stereo sesi destekliyor mu?

SPHERE dosyaları çok kanallı veri depolayabilir, ancak konuşma veri setleri genellikle mono kullanır. AVI'den ses kanalları yapılandırıldığı şekilde korunur.

Büyük AVI dosyalarını işleyebilir miyim?

Sunucularımız çeşitli boyutlardaki AVI dosyalarını destekler. Daha büyük videolar biraz daha uzun sürebilir, ancak ses çıkarma ve SPH kodlaması güvenilir kalır.