Convertitore da HTK ad WVE
Converti i tuoi file htk in wve online e gratis
htk
wve
Come convertire HTK in WVE
Seleziona file dal Computer, Google Drive, Dropbox, URL o trascinandoli sulla pagina.
Scegli wve o qualsiasi altro formato che ti serva come destinazione (più di 200 formati supportati)
Lascia convertire il file e potrai scaricare il tuo wve subito dopo
Informazioni sui formati
HTK è il contenitore nativo di forme d'onda per l'Hidden Markov Model Toolkit, una suite software sviluppata presso il dipartimento di Ingegneria dell'Università di Cambridge per la ricerca sul riconoscimento vocale. Distribuito per la prima volta nel 1993, HTK è diventato rapidamente una piattaforma di riferimento nei laboratori di linguistica computazionale in tutto il mondo, e il suo formato file ha seguito la stessa traiettoria. Ogni file memorizza una sequenza di vettori di parametri o campioni grezzi preceduti da un'intestazione di 12 byte che specifica il numero di frame, il periodo del frame in unità di 100 ns, il conteggio dei byte per frame e un codice di tipo che indica la natura dei dati — le opzioni spaziano dal PCM a forma d'onda ai coefficienti cepstrali su scala di Mel e alle energie dei banchi di filtri. Questa versatilità consente a un unico contenitore di trasportare sia l'audio sorgente che le feature estratte senza cambiare parser. L'intestazione deliberatamente minimale evita il padding di allineamento o chunk opzionali, rendendo il formato banale da leggere da C, Python o MATLAB con poche righe di I/O binario. Tre vantaggi sostengono la rilevanza duratura di HTK: l'integrazione stretta con la pipeline di addestramento e riconoscimento HTK, un layout di byte deterministico che elimina l'ambiguità del parser e un'adozione capillare nei corpora accademici.
WVE è il formato audio nativo della famiglia Psion Series 3 di assistenti digitali personali, prodotti dalla società britannica Psion PLC a partire dal settembre 1991. Questi PDA a conchiglia includevano un registratore vocale integrato, e tutta la funzionalità di dettatura si basava sui file WVE per memorizzare il suono catturato. Ogni file inizia con la firma ASCII "ALawSoundFile**" seguita da un'intestazione minimale, quindi audio grezzo codificato in A-law campionato a 8 kHz — una frequenza ereditata dagli standard di telefonia digitale. A 8000 byte al secondo, una registrazione di un minuto occupa solo 480 KB, caratteristica essenziale dato che i dispositivi Psion archiviavano i dati su schede SRAM con capacità tipiche da 128 KB a 2 MB. La codifica A-law fornisce una chiarezza vocale ragionevole entro questi stretti vincoli di archiviazione, privilegiando l'intelligibilità rispetto alla riproduzione ad alta fedeltà. I file WVE possono essere convertiti in WAV o altri formati moderni utilizzando SoX, Awave Studio o utilità specializzate per file Psion. Sebbene il formato sia decisamente un prodotto dell'informatica palmare dei primi anni '90, riveste un significato storico come uno dei primi formati di registrazione audio progettati per dispositivi consumer tascabili. Collezionisti e ricercatori che studiano la storia dell'informatica mobile incontrano occasionalmente file WVE nel recupero di dati da supporti SRAM legacy.