Конвертер MPEG в SPH

Извлеките MPEG-аудио в формат NIST SPHERE для речи онлайн

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Из видео в речевой корпус

Извлеките диалог из MPEG-видео и упакуйте как NIST SPHERE — пропуская ручное извлечение при создании речевых датасетов.

Стандарт NIST

SPH-вывод точно соответствует спецификациям NIST SPHERE. Импортируйте напрямую в Kaldi, HTK или любой фреймворк распознавания речи.

Безопасная обработка

MPEG-загрузки удаляются после конвертации. SPH-файлы стираются в течение 24 часов — исследовательские материалы остаются конфиденциальными.

Как сконвертировать MPEG в SPH

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите sph или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш sph-файл

О форматах

MPEG (MPEG-1) — основополагающий стандарт сжатия видео и аудио, опубликованный в августе 1993 года группой Moving Picture Experts Group как ISO/IEC 11172. Это первый международный стандарт сжатия движущихся изображений и сопутствующего звука с потерями, заложивший принципы и методы, повлиявшие на все последующие видеокодеки. Сжатие видео MPEG-1 достигается комбинацией предсказания с компенсацией движения, кодирования на основе дискретного косинусного преобразования и энтропийного кодирования переменной длины, организованных вокруг трёх типов кадров: I-кадры (внутрикодированные), P-кадры (предсказанные) и B-кадры (двунаправленно-предсказанные). Стандарт рассчитан на битрейт около 1,5 Мбит/с для совокупного аудио и видео, обеспечивая качество, сопоставимое с VHS при разрешении SIF (352x240 для NTSC). Этот уровень сжатия был специально подобран под пропускную способность однократных CD-ROM-приводов, что позволило создать формат Video CD, принёсший цифровое видео потребителям в начале 1990-х. Аудиокомпонент, в частности Layer III (MP3), стал самым влиятельным аудиоформатом в истории. Структура кадров I/P/B, подход к оценке движения и блочное преобразование установили архитектурный шаблон, которому следовали все последующие крупные видеокодеки — от MPEG-2 до H.264 и далее. Хотя по эффективности сжатия MPEG-1 давно превзойдён, он поддерживается практически любым медиапрограммным обеспечением.
Разработчик: Moving Picture Experts Group
Дата выпуска: Август 1993
SPH — расширение файлов, хранящих аудио в формате NIST SPHERE (SPeech HEader REsources), стандарте, созданном Национальным институтом стандартов и технологий США около 1990 года. Разработанный для речевых исследований, SPH-файл содержит 1024-байтовый ASCII-заголовок с метаданными — идентификаторами базы данных, количеством каналов, частотой дискретизации, порядком байтов и типом сжатия — делая каждую запись самоописывающейся. Аудиоданные — обычно 16-битная линейная ИКМ при 16 кГц, хотя допустимы другие конфигурации. Исследователи в NIST, DARPA и университетах по всему миру используют SPH для распространения речевых корпусов — TIMIT, Switchboard и коллекций LDC, лежащих в основе современных систем автоматического распознавания речи. Ключевое преимущество — человекочитаемый заголовок, позволяющий скриптам разбирать метаданные записи без бинарного декодирования. Строгая стандартизация формата также исключает неоднозначности при обмене данными между учреждениями и платформами. Поскольку SPH-файлы хранят несжатый PCM, они сохраняют полную точность аудио — критически важное свойство при обучении акустических моделей, где даже малые артефакты могут исказить результаты.
Дата выпуска: 1990

Часто задаваемые вопросы

Зачем конвертировать MPEG в SPH?

SPH — стандарт NIST SPHERE для исследований речи. Диалог MPEG-видео становится правильно отформатированными данными для обучения ASR.

Какие инструменты работают с SPH?

Kaldi, HTK, Praat и инструментарий NIST SPHERE нативно поддерживают SPH. Это стандартный формат обмена для исследований речевого аудио.

SPH сжимает аудио?

Нет — SPH хранит PCM-данные без сжатия с потерями. MPEG-аудио достигает SPHERE-формата в полном качестве для точной обработки речи.

MPEG-1 аудио достаточно?

MPEG-1 аудио обеспечивает адекватное качество для исследований речи. Содержимое диалогов хорошо сохраняется через процесс извлечения и кодирования SPH.

Можно ли конвертировать много MPEG-файлов?

Загрузите несколько MPEG-видео и конвертируйте пакетом в SPH. Эффективно для создания речевых корпусов из архивных MPEG-коллекций.