เครื่องมือแปลงไฟล์ HTK เป็น PVF

แปลงไฟล์ htk ของคุณให้เป็น pvf ผ่านช่องทางออนไลน์ฟรี

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

วิธีแปลง HTK เป็น PVF

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ pvf หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ pvf ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ
เผยแพร่ครั้งแรก: 1993
PVF (Portable Voice Format) เป็นรูปแบบไฟล์เสียงอย่างง่ายที่ออกแบบมาสำหรับการจัดเก็บข้อความเสียงในระบบโทรศัพท์ที่ใช้ Linux โดยเฉพาะ ISDN4Linux และแอปพลิเคชันวอยซ์เมล vbox รูปแบบนี้เกิดขึ้นจากระบบนิเวศ ISDN ของยุโรปในช่วงปลายทศวรรษ 1990 เมื่อเซิร์ฟเวอร์ Linux เริ่มจัดการหน้าที่ PBX และเครื่องตอบรับอัตโนมัติผ่านสายโทรศัพท์ดิจิทัลมากขึ้น ไฟล์ PVF จัดเก็บตัวอย่าง PCM แบบ signed 16 บิตดิบที่ 8000 Hz โมโน โดยมีส่วนหัวแบบข้อความธรรมดาขั้นต่ำที่ระบุรูปแบบข้อมูลและลำดับไบต์ ความเรียบง่ายโดยเจตนานี้เป็นจุดแข็งหลักประการหนึ่งของรูปแบบ — ไม่มีการบีบอัดและส่วนหัวที่อ่านได้ง่าย ทำให้ไฟล์ PVF ง่ายอย่างยิ่งต่อการแยกวิเคราะห์ ส่งต่อ และจัดการด้วยเครื่องมือ Unix มาตรฐาน อัตรา 8 kHz ตรงกับข้อกำหนด Nyquist สำหรับเสียงพูดในแบนด์วิดท์โทรศัพท์ (300-3400 Hz) ทำให้ PVF เป็นรูปแบบกลางที่เหมาะสมสำหรับไปป์ไลน์ประมวลผลเสียง ข้อดีอีกประการคือความสามารถในการพกพาข้ามสถาปัตยกรรม — การประกาศลำดับไบต์อย่างชัดเจนหมายความว่าไฟล์ PVF สามารถย้ายระหว่างระบบ big-endian และ little-endian ได้โดยไม่มีความกำกวม ชุดเครื่องมือเสียง SoX รองรับการอ่านและเขียน PVF โดยตรง ทำให้แปลงเป็นรูปแบบสมัยใหม่ได้อย่างง่ายดาย
ผู้พัฒนา: ISDN4Linux Project
เผยแพร่ครั้งแรก: 1997