Конвертер M4V в NIST

Создайте речевое аудио NIST SPHERE из видео M4V онлайн

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Стандарт корпусов речи

NIST SPHERE — стандартный формат для исследовательских корпусов речи. Извлеките аудио M4V для академических и лингвистических исследований.

Облачная конвертация

Конвертация M4V в NIST выполняется на серверах — специализированные инструменты NIST/SPHERE не нужны.

Безопасность данных

M4V-загрузки удаляются после обработки. Выходные NIST стираются в течение 24 часов.

Как сконвертировать M4V в NIST

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите nist или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш nist-файл

О форматах

M4V — видеоконтейнерный формат, разработанный компанией Apple Inc. и представленный вместе с iTunes Video Store в октябре 2005 года. Технически M4V практически идентичен стандартному формату MP4 (MPEG-4 Part 14); основное отличие — опциональная защита FairPlay DRM, применяемая к приобретённому контенту из iTunes Store. Незащищённые файлы M4V полностью совместимы с любым плеером, поддерживающим MP4, поскольку структура контейнера и набор кодеков идентичны. Формат обычно содержит видео H.264 и аудио AAC с поддержкой разрешений до 4K, а также маркеров глав, дорожек субтитров и метаданных — название, обложка и рейтинги. Apple выбрала расширение M4V для отличия контента iTunes от обычных файлов MP4, главным образом чтобы DRM-защищённые покупки распознавались экосистемой Apple. Файлы M4V нативно воспроизводятся в macOS, iOS, iPadOS и Apple TV, а незащищённые версии работают в большинстве основных медиаплееров на всех платформах. Формат получил значительное распространение, когда iTunes Store стал ведущей платформой для покупки и аренды цифровых фильмов и сериалов. Совместимость с более широкой экосистемой MP4 означает, что видео- и аудиопотоки в DRM-свободных файлах M4V могут обрабатываться практически любым современным инструментом для монтажа или перекодирования без предварительной конвертации.
Разработчик: Apple Inc.
Дата выпуска: Октябрь 2005
NIST SPHERE (SPeech HEader REsources) — специализированный аудиоформат, созданный Национальным институтом стандартов и технологий для исследований речи, в особенности проектов, финансируемых DARPA. Формат оборачивает сырые аудиосэмплы структурированным ASCII-заголовком, содержащим метаданные: частоту дискретизации, количество каналов, тип кодирования, демографические данные дикторов и аннотации транскрипций — что делает его идеальным для распространения речевых корпусов. Файлы NIST обычно хранят несжатое PCM или mu-law аудио при телефонных частотах дискретизации (8 кГц или 16 кГц), хотя контейнер достаточно гибок для различных кодировок. Ключевое преимущество — богатый самодокументирующийся заголовок, позволяющий исследователям встраивать подробные метаданные корпуса прямо в файл, исключая сопутствующие файлы. SPHERE также стал де-факто стандартом для крупных баз речевых данных — TIMIT, Switchboard и корпуса Fisher, — обеспечивая широкое признание в академических и государственных лабораториях. Открытая спецификация и доступность утилит командной строки (sphere, h_strip, w_decode) делают конвертацию, инспекцию и обработку этих файлов в конвейерах речевой обработки простой задачей.
Дата выпуска: 1990

Часто задаваемые вопросы

Зачем конвертировать M4V в NIST?

Формат NIST SPHERE используется в корпусах распознавания речи NIST и академических исследованиях. Извлеките аудио M4V для лингвистических корпусов.

Что открывает NIST SPHERE?

SPHTOOLS, Kaldi, HTK и специализированные инструменты распознавания речи поддерживают формат NIST SPHERE нативно.

Используется ли NIST SPHERE в исследованиях?

Да — NIST SPHERE широко используется в академических корпусах речи и соревнованиях по распознаванию речи, особенно в исследованиях NIST.

Какие параметры важны для NIST?

Частота дискретизации 8 кГц (телефония) или 16 кГц типична для баз данных речи NIST. Выберите в зависимости от требований задачи.

Возможна ли пакетная конвертация?

Загрузите несколько M4V-файлов и создайте NIST SPHERE-файлы из каждого параллельно для подготовки наборов данных.