เครื่องมือแปลงไฟล์ SPH เป็น IRCAM

แปลงไฟล์ sph ของคุณให้เป็น ircam ผ่านช่องทางออนไลน์ฟรี

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

วิธีแปลง SPH เป็น IRCAM

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ ircam หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ ircam ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้
เผยแพร่ครั้งแรก: 1990
ไฟล์เสียง IRCAM มีต้นกำเนิดจาก Institut de Recherche et Coordination Acoustique/Musique — หนึ่งในห้องปฏิบัติการดนตรีคอมพิวเตอร์ชั้นนำของโลก ก่อตั้งโดยคีตกวี Pierre Boulez ในกรุงปารีส รูปแบบนี้สร้างขึ้นในช่วงต้นทศวรรษ 1980 เพื่อตอบสนองความต้องการวิจัยของ IRCAM และตั้งแต่นั้นมาก็ถูกนำมาใช้โดยชุมชนวิชาการและศิลปะที่ทำงานในจุดตัดของวิทยาศาสตร์และเสียง ไฟล์ IRCAM เริ่มต้นด้วยส่วนหัวขนาด 1024 ไบต์ที่บรรจุหมายเลข magic อัตราสุ่มตัวอย่าง จำนวนแชนเนล และฟิลด์ประเภทการเข้ารหัสที่รองรับ linear PCM (16/32 บิตจำนวนเต็มและ 32 บิตจุดลอยตัว), mu-law และ A-law บล็อกส่วนหัวยังรองรับข้อความอธิบายแบบอิสระ ช่วยให้นักวิจัยฝังเมตาดาต้าการทดลองในไฟล์เสียงโดยตรง เนื่องจากข้อมูลไม่ได้ถูกบีบอัดโดยค่าเริ่มต้น การบันทึกจึงรักษาความเที่ยงตรงเต็มรูปแบบตลอดวงจรการวิเคราะห์และสังเคราะห์ใหม่ที่ต่อเนื่อง — สิ่งสำคัญในการทดลองจิตอะคูสติก ซอฟต์แวร์อย่าง Csound, libsndfile และ SoX อ่านและเขียนรูปแบบนี้ได้โดยตรง ข้อดีหลัก ได้แก่ ส่วนหัวที่กำหนดไว้ชัดเจนซึ่งขจัดความคลุมเครือในการแยกวิเคราะห์ การรองรับตัวอย่างจุดลอยตัวที่จำเป็นในงาน DSP เชิงวิทยาศาสตร์ และรากฐานที่ลึกในชุมชนดนตรีคอมพิวเตอร์ที่รับประกันการรองรับเครื่องมืออย่างต่อเนื่อง
ผู้พัฒนา: IRCAM
เผยแพร่ครั้งแรก: 1983