Конвертер HCOM в SPH

Закодируйте аудио HCOM в речевой формат NIST SPH онлайн

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Стандарт исследований речи

Конвертируйте HCOM в SPH — стандартный формат для речевых корпусов NIST, лингвистических исследований и обучающих данных распознавания речи.

Облачная обработка

Инструменты NIST на локальной машине не нужны. Конвертируйте HCOM в SPH прямо из браузера на наших облачных серверах.

Автоматическая очистка

HCOM-загрузки удаляются после обработки. SPH-файлы очищаются с серверов в течение 24 часов.

Как сконвертировать HCOM в SPH

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите sph или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш sph-файл

О форматах

HCOM — аудиоформат с кодированием Хаффмана из ранней эпохи Macintosh, разработанный для сжатия оцифрованного звука при распространении на дискетах и через BBS, когда хранилище было на вес золота, а модемы — медленными. Кодер принимает 8-битные беззнаковые PCM-данные, вычисляет таблицу частот дельта-значений сэмплов и строит оптимальное дерево Хаффмана, заменяя частые дельты короткими битовыми последовательностями. Для речевых записей типичный коэффициент сжатия составлял 2:1 и выше — существенная экономия, когда 3,5-дюймовая дискета вмещала лишь 800 КБ. Файлы распространялись как ресурсные форки Macintosh и воспроизводились утилитами вроде SoundApp в рамках экосистемы BinHex, определявшей обмен Mac-программами в конце 1980-х. Формат поддерживал частоту дискретизации до 22,255 кГц, соответствуя возможностям оригинального звукового оборудования Macintosh. Инструменты вроде SoX сохраняют поддержку декодирования HCOM, гарантируя доступность архивных записей спустя десятилетия. HCOM обладает тремя практическими преимуществами для архивной работы: сжатие без потерь, точно восстанавливающее исходные сэмплы; встроенная таблица Хаффмана в каждом файле для автономного декодирования; и широкая распространённость в тысячах винтажных Mac-звуковых архивов.
Разработчик: Apple Computer
Дата выпуска: 1985
SPH — расширение файлов, хранящих аудио в формате NIST SPHERE (SPeech HEader REsources), стандарте, созданном Национальным институтом стандартов и технологий США около 1990 года. Разработанный для речевых исследований, SPH-файл содержит 1024-байтовый ASCII-заголовок с метаданными — идентификаторами базы данных, количеством каналов, частотой дискретизации, порядком байтов и типом сжатия — делая каждую запись самоописывающейся. Аудиоданные — обычно 16-битная линейная ИКМ при 16 кГц, хотя допустимы другие конфигурации. Исследователи в NIST, DARPA и университетах по всему миру используют SPH для распространения речевых корпусов — TIMIT, Switchboard и коллекций LDC, лежащих в основе современных систем автоматического распознавания речи. Ключевое преимущество — человекочитаемый заголовок, позволяющий скриптам разбирать метаданные записи без бинарного декодирования. Строгая стандартизация формата также исключает неоднозначности при обмене данными между учреждениями и платформами. Поскольку SPH-файлы хранят несжатый PCM, они сохраняют полную точность аудио — критически важное свойство при обучении акустических моделей, где даже малые артефакты могут исказить результаты.
Дата выпуска: 1990

Часто задаваемые вопросы

Что такое SPH?

SPH (SPHERE) — формат SPeech HEader Resources от NIST для исследований речи. Это мировой стандарт для лингвистических корпусов.

Зачем конвертировать HCOM в SPH?

Для исследовательских проектов в области речи, которым нужно аудио в формате NIST SPHERE. Конвертация HCOM позволяет проводить анализ стандартными лингвистическими инструментами.

Какие инструменты используют SPH?

HTK, Kaldi, инструменты оценки NIST и многие фреймворки исследования распознавания речи поддерживают SPH нативно.

SPH — это просто PCM с заголовками?

По сути да. SPH оборачивает PCM-аудио текстовым заголовком с метаданными об условиях и содержании записи.

Конвертация конфиденциальна?

HCOM-загрузки стираются после обработки. SPH-результаты удаляются с серверов в течение 24 часов.