Conversor HTK a WVE
Convierta sus archivos htk a wve en línea y gratis
htk
wve
Cómo convertir de HTK a WVE
Seleccione los archivos desde el ordenador, Google Drive, Dropbox o agregue una URL. También puede simplemente arrastrarlo a esta página..
Elija wve o cualquier otro formato de salida deseado (más de 200 formatos compatibles)
Cuando su archivo está convertido, puede guardar archivo wve inmediatamente
Sobre los formatos
HTK es el contenedor de formas de onda nativo del Hidden Markov Model Toolkit, un conjunto de software desarrollado en el Departamento de Ingeniería de la Universidad de Cambridge para la investigación en reconocimiento de voz. Distribuido por primera vez en 1993, HTK rápidamente se convirtio en una plataforma de referencia en laboratorios de lingüística computacional a nivel mundial, y su formato de archivo tuvo la misma trayectoria. Cada archivo almacena una secuencia de vectores de parámetros o muestras en bruto precedidos por una cabecera de 12 bytes qué específica el número de tramas, el periodo de trama en unidades de 100 ns, el conteo de bytes por trama y un código de tipo qué indica la clase de datos — las opciones van desde PCM de forma de onda hasta coeficientes cepstrales de frecuencia Mel y energias de banco de filtros. Está versatilidad permite qué un solo contenedor transporte tanto audio fuente como características extraidas sin cambiar de analizadores. La cabecera deliberadamente mínima evita relleno de alineacion o bloques opcionales, haciendo qué el formato sea trivial de leer desde C, Python o MATLAB con unas pocas líneas de E/S binaria. Tres ventajas sustentan la relevancia duradera de HTK: integración estrecha con la cadena de entrenamiento y reconocimiento HTK, disposición de bytes determinista qué elimina la ambiguedad del analizador, y adopción generalizada en corpus académicos.
WVE es el formato de audio nativo de la familia Psion Series 3 de asistentes digitales personales, lanzados por la empresa britanica Psion PLC a partir de septiembre de 1991. Estás PDAs de tipo almeja incluian una grabadora de voz integrada, y toda la funcionalidad de dictado se apoyaba en archivos WVE para almacenar el sonido capturado. Cada archivo comienza con la firma ASCII "ALawSoundFile**" seguida de una cabecera mínima, y luego audio codificado en A-law muestreado a 8 kHz — una tasa heredada de los estándares de telefonía digital. A 8000 bytes por segundo, una grabación de un minuto ocupa solo 480 KB, algo esencial dado qué los dispositivos Psion almacenaban datos en tarjetas SRAM qué típicamente iban de 128 KB a 2 MB. La codificación A-law proporciona una claridad de voz razonable dentro de estás estrictas restricciones de almacenamiento, priorizando la inteligibilidad sobre la reproducción de alta fidelidad. Los archivos WVE pueden convertirse a WAV u otros formatos modernos usando SoX, Awave Studio o utilidades especializadas para archivos Psion. Sí bien el formato es firmemente un producto de la informática de mano de principios de los 90, tiene importancia histórica como uno de los primeros formatos de grabación de audio diseñados para dispositivos de consumo de bolsillo. Los coleccionistas e investigadores qué estudian la historia de la computación móvil ocasionalmente encuentran archivos WVE al recuperar datos de medios SRAM heredados.