HCOMからNISTへのコンバーター
HCOMオーディオをNIST研究用オーディオ形式に変換
hcom
nist
標準規格レベル形式
HCOMをNISTに変換 — 米国国立標準技術研究所が研究評価用に規定したオーディオ形式です。
研究対応
NIST形式は音声評価ツール、ベンチマークテストフレームワーク、学術オーディオ処理パイプラインと統合できます。
安全な処理
アップロードしたHCOMファイルは即座に消去されます。NIST結果は24時間以内に自動削除されます。
HCOMをNISTへ変換する方法
コンピューター、Googleドライブ、Dropbox、URLからファイルを選ぶか、ページにドラッグして下さい.
nistもしくは必要な別のフォーマットを選ぶ(200種類以上のフォーマットが利用できます)
ファイルを変換すれば、すぐにnistファイルをダウンロードできます
フォーマットについて
HCOMは、ストレージが貴重でモデムが遅かった時代に、フロッピーディスクやBBSでの配布用にデジタル化されたサウンドを圧縮するために設計された、初期のMacintosh時代のHuffman符号化オーディオ形式です。エンコーダーは8ビット符号なしPCM入力を受け取り、サンプルデルタ値の頻度テーブルを計算し、一般的なデルタを短いビットシーケンスで置き換える最適なHuffmanツリーを構築します。音声録音では2:1以上の圧縮率が一般的で、3.5インチフロッピーが800 KBしか保持できなかった時代には大きな節約でした。ファイルはMacintoshリソースフォークとして配布され、SoundAppや1980年代後半のMacソフトウェア交換を定義したBinHexエコシステムのユーティリティを通じて再生されました。形式は最大22.255 kHzのサンプルレートをサポートし、オリジナルMacintoshサウンドハードウェアの出力能力に対応していました。SoXなどのツールがHCOMデコードサポートを維持しており、アーカイブされた録音が数十年後もアクセス可能です。HCOMは保存作業において3つの実用的な利点を持っています — 元のサンプルを正確に復元するロスレス圧縮、依存関係なしのデコーディングのために各ファイルに埋め込まれた自己完結型のHuffmanテーブル、そして数千のビンテージMacサウンドアーカイブでの歴史的な普及です。
NIST SPHERE(SPeech HEader REsources)は、アメリカ国立標準技術研究所がDARPA資金の音声研究プロジェクト向けに作成した特殊なオーディオファイル形式です。この形式は、サンプルレート、チャンネル数、エンコーディングタイプ、話者の属性、書き起こしアノテーションなどのメタデータをエンコードする構造化されたASCIIヘッダーで生のオーディオサンプルをラップし、音声コーパスの配布に最適です。NISTファイルは通常、電話品質のサンプルレート(8 kHzまたは16 kHz)で非圧縮PCMまたはmu-lawオーディオを格納しますが、コンテナはさまざまなエンコーディングを保持できる柔軟性があります。重要な利点は、研究者が詳細なコーパスメタデータをファイルに直接埋め込める豊富な自己文書化ヘッダーで、サイドカーファイルが不要になります。SPHEREはまた、TIMIT、Switchboard、Fisherコーパスなどの主要な音声データベースのデファクトスタンダードとなり、学術および政府の研究室全体で広く認知されています。オープンな仕様とコマンドラインツール(sphere、h_strip、w_decode)の利用可能性により、音声処理パイプラインでのファイルの変換、検査、処理が容易です。
よくある質問
NIST形式とは何ですか?
NISTは米国国立標準技術研究所が音声評価、研究、ベンチマークテストに使用するオーディオ形式です。
NISTとSPHの違いは?
NISTとSPH(SPHERE)は密接に関連する形式です。どちらもNISTヘッダー付きPCMオーディオを使用し、わずかな構造上の違いがあります。
なぜHCOMをNISTに変換するのですか?
NIST形式のオーディオデータ入力を必要とするオーディオ評価タスク、音声ベンチマーク、研究ワークフロー向けです。
NISTを読み込むソフトは?
SOX、NISTスコアリングツール、HTKやKaldiなどの音声認識研究フレームワークがNISTオーディオファイルをサポートしています。
変換は瞬時ですか?
HCOMファイルは非常にコンパクトです。NIST形式への変換はインフラ上で数秒以内に完了します。