Công cụ chuyển đổi WVE sang HTK

Chuyển đổi file wve sang htk trực tuyến và miễn phí

Thả tập tin ở đây. 1 GB Kích thước file tối đa hoặc là Đăng ký
đến
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Làm thế nào để chuyển đổi WVE sang HTK

1

Lựa chọn các tập tin từ Máy tính, Google Drive, Dropbox, URL hoặc bằng cách kéo tập tin vào trang này.

2

Chọn htk hoặc bất kỳ định dạng nào khác bạn cần chuyển đổi sang (hỗ trợ hơn 200 định dạng)

3

Hãy để tập tin chuyển đổi và bạn có thể tải tập tin htk của bạn xuống ngay sau đó

Về các định dạng

WVE là định dạng âm thanh gốc của dòng thiết bị hỗ trợ cá nhân kỹ thuật số Psion Series 3, được công ty Psion PLC của Anh phát hành từ tháng 9 năm 1991. Các PDA dạng vỏ sò này tích hợp máy ghi âm, và mọi chức năng đọc chính tả đều dựa vào tệp WVE để lưu âm thanh thu được. Mỗi tệp bắt đầu bằng chữ ký ASCII "ALawSoundFile**" theo sau bởi header tối giản, rồi âm thanh mã hóa A-law thô lấy mẫu ở 8 kHz — tần số thừa hưởng từ tiêu chuẩn viễn thông kỹ thuật số. Ở 8000 byte mỗi giây, một phút ghi âm chỉ chiếm 480 KB, điều thiết yếu khi thiết bị Psion lưu trữ dữ liệu trên thẻ SRAM thường có dung lượng 128 KB đến 2 MB. Mã hóa A-law mang lại độ rõ giọng nói hợp lý trong điều kiện lưu trữ eo hẹp, ưu tiên dễ nghe hơn là tái tạo trung thực chất lượng cao. Tệp WVE có thể chuyển đổi sang WAV hoặc các định dạng hiện đại bằng SoX, Awave Studio hoặc các tiện ích chuyên dụng cho Psion. Dù là sản phẩm của thời kỳ điện toán cầm tay đầu thập niên 1990, định dạng này có ý nghĩa lịch sử như một trong những định dạng ghi âm đầu tiên được thiết kế cho thiết bị tiêu dùng bỏ túi. Các nhà sưu tập và nhà nghiên cứu lịch sử điện toán di động đôi khi gặp tệp WVE khi khôi phục dữ liệu từ phương tiện SRAM cũ.
Nhà phát triển: Psion PLC
Phát hành lần đầu: 1991
HTK là container dạng sóng gốc cho Hidden Markov Model Toolkit, bộ phần mềm được phát triển tại Khoa Kỹ thuật Đại học Cambridge phục vụ nghiên cứu nhận dạng giọng nói. Phân phối lần đầu vào năm 1993, HTK nhanh chóng trở thành nền tảng tham chiếu trong các phòng thí nghiệm ngôn ngữ học tính toán trên toàn thế giới, và định dạng tệp của nó cũng lan rộng theo. Mỗi tệp lưu một chuỗi vector tham số hoặc mẫu thô kèm tiêu đề 12 byte chỉ định số khung, chu kỳ khung tính bằng đơn vị 100 ns, số byte mỗi khung, và mã loại chỉ ra kiểu dữ liệu — các tùy chọn dao động từ PCM dạng sóng đến hệ số cepstral tần số Mel và năng lượng bộ lọc. Tính đa dụng này cho phép một container duy nhất chứa cả âm thanh nguồn lẫn đặc trưng đã trích xuất mà không cần thay đổi bộ phân tích. Tiêu đề cố ý tối giản không có padding căn chỉnh hay khối tùy chọn, khiến định dạng cực kỳ dễ đọc từ C, Python hoặc MATLAB chỉ với vài dòng I/O nhị phân. Ba ưu điểm làm nên sự bền vững của HTK: tích hợp chặt chẽ với pipeline huấn luyện và nhận dạng HTK, bố trí byte xác định loại bỏ mơ hồ trong phân tích, và được áp dụng rộng rãi trong các kho dữ liệu học thuật.
Phát hành lần đầu: 1993