HTK에서 FSSD로 변환하는 컨버터

온라인에서 무료로 htk 파일을 fssd로 변환하세요

여기에 파일을 드롭하세요. 1 GB 최대 파일 크기 또는 회원 가입
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

HTK에서 FSSD로 변환하는 방법

1

컴퓨터, Google Drive, Dropbox, URL에서 선택하거나 이 페이지에서 드래그하여 선택해 주세요.

2

fssd 또는 기타 필요한 결과 형식을 선택하세요(200가지 이상의 형식 지원)

3

파일 변환을 실행한 뒤 바로 fssd 파일을 다운로드할 수 있습니다

형식 정보

HTK는 음성 인식 연구를 위해 Cambridge 대학교 공학부에서 개발한 소프트웨어 모음인 Hidden Markov Model Toolkit의 네이티브 파형 컨테이너입니다. 1993년에 처음 배포된 HTK는 전 세계 전산 언어학 연구실에서 빠르게 레퍼런스 플랫폼이 되었으며, 그 파일 포맷도 함께 보급되었습니다. 각 파일은 프레임 수, 100 ns 단위의 프레임 주기, 프레임당 바이트 수, 데이터 종류를 나타내는 유형 코드를 지정하는 12바이트 헤더가 앞에 붙은 파라미터 벡터 시퀀스 또는 원시 샘플을 저장합니다 — 옵션은 파형 PCM에서 멜 주파수 켑스트럼 계수와 필터 뱅크 에너지까지 다양합니다. 이러한 다용도성 덕분에 파서를 변경하지 않고도 하나의 컨테이너에 원본 오디오와 추출된 특성 모두를 담을 수 있습니다. 의도적으로 최소화된 헤더는 정렬 패딩이나 선택적 청크를 피하여, C, Python 또는 MATLAB에서 몇 줄의 바이너리 I/O로 읽을 수 있는 포맷을 만듭니다. 세 가지 장점이 HTK의 지속적인 관련성을 뒷받침합니다: HTK 학습 및 인식 파이프라인과의 긴밀한 통합, 파서 모호성을 제거하는 결정적 바이트 레이아웃, 학술 코퍼스에서의 광범위한 채택입니다.
최초 출시: 1993
FSSD는 클래식 Macintosh 생태계에서 시작된 원시 오디오 포맷으로, Farallon Computing의 MacRecorder 하드웨어(1988)가 디지털화된 사운드를 'FSSD' 타입 코드로 태그된 리소스 포크 항목에 부호 없는 8비트 PCM으로 저장했습니다. SoX 같은 현대 오디오 처리 도구에서 FSSD는 u8(부호 없는 8비트) 원시 포맷의 별칭으로 취급됩니다 — 헤더 없이 단일 바이트 진폭 샘플의 평탄한 스트림을 포함하는 파일로, 각 값은 0~255이며 128이 중심점입니다. 헤더가 없으므로 샘플레이트와 채널 수 같은 재생 파라미터는 외부에서 제공해야 합니다. 원래 MacRecorder는 일반적으로 모노로 최대 22 kHz까지 캡처했지만, 원시 데이터 해석 시 어떤 샘플레이트도 유효합니다. FSSD와 그 압축 동반 포맷 HCOM(같은 기본 데이터에 허프만 압축을 추가)은 1980년대 후반~1990년대 초반 초기 Mac 멀티미디어의 표준 오디오 포맷이었습니다: HyperCard 스택, 교육용 CD-ROM, 시스템 경고음이 이 인코딩에 크게 의존했습니다. 원시 FSSD 포맷의 장점 중 하나는 파싱이 매우 간편하다는 것입니다 — 컨테이너 오버헤드 없이 오디오 데이터가 바이트 0에서 시작하며, 부호 없는 8비트 PCM을 처리할 수 있는 어떤 도구로도 읽을 수 있습니다. 이 포맷의 역사적 중요성은 디지털 아카이비스트에게도 실질적으로 관련됩니다: FSSD 녹음을 WAV 같은 현대 컨테이너로 변환하면 원본 오디오 콘텐츠가 무손실로 보존됩니다 — 원시 샘플에 헤더만 추가하면 되며 어떤 형태의 트랜스코딩도 필요 없기 때문입니다.
개발자: Farallon Computing
최초 출시: 1988