เครื่องมือแปลงไฟล์ HTK เป็น FSSD

แปลงไฟล์ htk ของคุณให้เป็น fssd ผ่านช่องทางออนไลน์ฟรี

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

วิธีแปลง HTK เป็น FSSD

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ fssd หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ fssd ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ
เผยแพร่ครั้งแรก: 1993
FSSD เป็นรูปแบบเสียงดิบที่มีต้นกำเนิดในระบบนิเวศ Macintosh คลาสสิก โดยฮาร์ดแวร์ MacRecorder ของ Farallon Computing (1988) เก็บเสียงที่แปลงเป็นดิจิทัลเป็น unsigned 8-bit PCM ในรายการ resource fork ที่แท็กด้วยรหัสประเภท 'FSSD' ในเครื่องมือประมวลผลเสียงสมัยใหม่อย่าง SoX FSSD ถือเป็นชื่อเรียกอื่นของรูปแบบ u8 (unsigned 8-bit) ดิบ — ไฟล์ที่ไม่มีส่วนหัวบรรจุสตรีมตัวอย่างแอมพลิจูดขนาดไบต์เดียวแบบเรียบ โดยแต่ละค่าตั้งแต่ 0 ถึง 255 แสดงระดับเสียงโดยมี 128 เป็นจุดกลาง เนื่องจากไม่มีส่วนหัว พารามิเตอร์การเล่นอย่างอัตราสุ่มตัวอย่างและจำนวนแชนเนลต้องระบุจากภายนอก MacRecorder ดั้งเดิมมักบันทึกที่อัตราสูงสุด 22 kHz แบบโมโน แม้อัตราสุ่มตัวอย่างใดก็ใช้ได้เมื่อตีความข้อมูลดิบ FSSD และรูปแบบบีบอัดคู่หู HCOM (ที่เพิ่มการบีบอัด Huffman ให้กับข้อมูลพื้นฐานเดียวกัน) เป็นรูปแบบเสียงมาตรฐานสำหรับมัลติมีเดีย Mac ยุคแรก: HyperCard stacks ซีดีรอมเพื่อการศึกษา และเสียงแจ้งเตือนของระบบในช่วงปลายทศวรรษ 1980 ถึงต้นทศวรรษ 1990 ใช้การเข้ารหัสนี้อย่างมาก ข้อดีของรูปแบบ FSSD ดิบคือความง่ายในการแยกวิเคราะห์ — ไม่มีค่าใช้จ่ายจากคอนเทนเนอร์ ข้อมูลเสียงเริ่มต้นที่ไบต์ศูนย์และอ่านได้ด้วยเครื่องมือใดก็ได้ที่ประมวลผล unsigned 8-bit PCM ความสำคัญทางประวัติศาสตร์ของรูปแบบยังมีความเกี่ยวข้องในทางปฏิบัติสำหรับนักจดหมายเหตุดิจิทัล: การแปลงการบันทึก FSSD เป็นคอนเทนเนอร์สมัยใหม่อย่าง WAV รักษาเนื้อหาเสียงต้นฉบับได้โดยไม่สูญเสียข้อมูล เนื่องจากตัวอย่างดิบต้องการเพียงส่วนหัวเพิ่มเข้าไป ไม่จำเป็นต้องแปลงรหัสใด ๆ
ผู้พัฒนา: Farallon Computing
เผยแพร่ครั้งแรก: 1988