เครื่องมือแปลงไฟล์ DSS เป็น HTK
แปลงไฟล์ dss ของคุณให้เป็น htk ผ่านช่องทางออนไลน์ฟรี
dss
htk
วิธีแปลง DSS เป็น HTK
เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.
เลือกรูปแบบไฟล์ htk หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)
ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ htk ของคุณได้หลังจากนั้น
เกี่ยวกับรูปแบบไฟล์
DSS (Digital Speech Standard) เป็นรูปแบบบันทึกเสียงพูดที่เป็นกรรมสิทธิ์ พัฒนาโดย Olympus, Philips และ Grundig ในปี 1994 ผ่าน International Voice Association สร้างมาสำหรับเวิร์กโฟลว์การบอกคำบอก DSS ใช้การบีบอัดที่ปรับให้เหมาะกับเสียงพูดที่อัตราบิตต่ำมาก — มาตรฐานดั้งเดิมเข้ารหัสที่ประมาณ 13.7 kbps ขณะที่ DSS Pro ให้ประมาณ 28 kbps พร้อมความชัดเจนที่ดีขึ้น ตัวแปลงสัญญาณจัดสรรงบประมาณไปยังช่วงความถี่ที่เป็นลักษณะเฉพาะของเสียงพูดมนุษย์แทนที่จะเป็นเสียงแบบสเปกตรัมเต็ม สร้างไฟล์ที่กะทัดรัดเป็นพิเศษ เครื่องบันทึกมืออาชีพจาก Olympus และ Philips ใช้ DSS เป็นค่าเริ่มต้น ผสานรวมกับซอฟต์แวร์ถอดความที่รองรับธงจัดลำดับความสำคัญ บุ๊กมาร์ก และการระบุผู้เขียนในเมตาดาต้าของไฟล์ ข้อดีคือประสิทธิภาพขนาดไฟล์: การบอกคำบอกหนึ่งชั่วโมงใช้เพียง 6-12 MB เหมาะสำหรับสภาพแวดล้อมที่มีปริมาณมาก เช่น โรงพยาบาล สำนักงานกฎหมาย และศาล เมตาดาต้าในตัวช่วยให้สามารถจัดเส้นทางผ่านคิวถอดความได้อย่างราบรื่นพร้อมการจัดเรียงลำดับความสำคัญอัตโนมัติ แม้ DSS จะเป็นรูปแบบปิดที่จำกัดการเล่นเฉพาะซอฟต์แวร์ที่เข้ากันได้ แต่ความโดดเด่นในการบอกคำบอกระดับมืออาชีพรับประกันการรองรับอย่างต่อเนื่องจากแพลตฟอร์มถอดความหลัก
HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ