В современном мире технологии сжатия и передачи голоса играют критически важную роль, особенно в оборонной и спутниковой связи. Одним из ключевых достижений в области низкоскоростного кодирования речи является технология Mixed Excitation Linear Predictive, известная как MELP, и ее усовершенствованная версия MELPe. Эти голосовые кодеки стали стандартом Министерства Обороны США и НАТО для обеспечения надежной и защищенной передачи голоса в экстремальных условиях. В данной статье рассматриваются основные этапы развития MELP и MELPe, их технические характеристики, а также сферы применения и перспективы развития. История создания MELP уходит в середину 1990-х годов, когда инженер Алан Маккри разработал инновационный алгоритм, базирующийся на классической технологии линейного прогнозирования (LPC), но с добавлением уникальных функций, значительно улучшавших качество синтезируемого голоса.
В 1997 году MELP был стандартизирован Министерством Обороны США как MIL-STD-3005, выиграв национальный конкурс среди других вариантов кодирования, включая такие кандидаты как Frequency Selective Harmonic Coder и Advanced Multi-Band Excitation. Основным преимуществом MELP по сравнению с традиционными кодеками была его способность обеспечивать приемлемое качество речи при низких битрейтах около 2400 бит в секунду, что существенно снижало требования к пропускной способности каналов связи. Кроме того, благодаря применению смешанных возбуждений и апериодических импульсов удалось снизить характерный "buzz" - артефакт, часто встречающийся у систем LPC. В конце 1990-х и начале 2000-х годов группа компаний, в число которых вошли SignalCom (позже приобретенная Microsoft), AT&T и Compandent, реализовали значительные усовершенствования, создав MELPe - улучшенный MELP с дополнительной поддержкой кодирования на скоростях 1200 и 600 бит в секунду. Эти изменения включали улучшенный алгоритм анализа и синтеза речи, механизм подавления фонового шума и возможность транс-кодирования между битрейтами, что сделало систему более гибкой и устойчивой к различным условиям передачи.
Уже к 2002 году MELPe был принят в качестве стандарта НАТО под обозначением STANAG-4591 после серии всесторонних испытаний, охватывающих десятки тысяч файлов речи на различных языках и в самых разных шумовых ситуациях. Результаты показали значительно лучшее качество, понятность и узнаваемость голоса в сравнении с другими существовавшими кодеками и предыдущими военными стандартами. В особенности MELPe продемонстрировал высокую устойчивость к помехам и ошибкам передачи, что критично для применений на поле боя, в авиации и в условиях работы в движении. Технически MELP и MELPe основываются на линейном прогнозировании параметров речи, однако ключевым отличием является использование модели смешанных возбуждений с фильтрацией по полосам частоты. Это позволяет точно воспроизводить спектральные характеристики голоса, при этом уменьшая скученность артефактов.
Дополнительные функции включают адаптивное улучшение спектра, что усиливает форманты - резонансные частоты речевого тракта, делая звучание более естественным, а также использование апериодических импульсов для воспроизведения голосовых переходов без заметных шумовых искажений. MELPe использует фреймы речи с длительностью около 22,5 миллисекунды и несколько уровней кодирования: 2400 бит/с, 1200 бит/с и 600 бит/с, что обеспечивает масштабируемость и совместимость с устаревшими системами. Например, 2400 бит/с режим использует 54 бита на каждый фрейм, а в режиме 1200 бит/с три фрейма объединяются в суперфрейм длительностью 67,5 миллисекунд и 81 бит, обеспечивая эффективное сжатие и устойчивость к ошибкам. Для практического применения MELPe часто интегрируется в устройства безопасной связи, такие как тактические радиостанции, спутниковые терминалы и VoIP-системы. Обработка ошибок, управление потерей пакетов и синхронизация являются неотъемлемыми составляющими, учитывая чувствительность битов кодека к ошибкам.
Например, система Secure Communication Interoperability Protocol (SCIP), используемая в НАТО и Министерстве обороны США, поддерживает MELPe для передачи зашифрованного голоса по различным цифровым системам, включая GSM, CDMA и спутниковую связь. Помимо государственных и военных программ, MELPe находит применение в гражданских сферах, где необходима надежная передача голоса при ограниченных ресурсах канала. Это включает в себя спутниковую коммуникацию, удаленный доступ и мобильные устройства с низким энергопотреблением. Интеллектуальная собственность MELPe защищена рядом компаний, таких как Texas Instruments, Microsoft, Thales Group, AT&T и Compandent, что требует лицензирования при включении этих кодеков в коммерческие продукты. Тем не менее, открытая стандартизация и наличие тестовых платформ, например MELCODER и FLEXI-232, позволяют широкому кругу разработчиков исследовать и адаптировать технологию.
Будущее MELPe видится в многоканальных расширениях и дальнейшей интеграции с современными системами передачи данных высокой надежности. Кроме того, работы по созданию кодера с битрейтом 300 бит/с и реализация широкополосных версий с повышенной скоростью передачи открывают новые возможности для масштабируемой и адаптивной голосовой связи. Таким образом, MELP и MELPe остаются одними из самых эффективных и надежных голосовых кодеков для безопасной и качественной передачи речи в условиях ограниченной пропускной способности и высокой шумовой нагрузки. Их успешное внедрение в военную и гражданскую связь демонстрирует, как инновационные алгоритмы могут отвечать самым высоким требованиям к качеству, безопасности и устойчивости коммуникаций. .