Часть параметров, вычисленная в анализаторе, используется в блоке
определения голосовой активности (VAD - voice activity detector), который
решает является ли текущий анализируемый фрагмент сигнала речью или
паузой. При
наличии паузы информационный кадр может не передаваться в
службу виртуального канала. Режим передачи паузных кадров следующий. На
сеансовый уровень передается лишь каждый пятый кадр такого типа. Кроме
того, при отсутствии речи для кодировки текущих спектральных параметров
используется только 27 бит. На приемной стороне из виртуального канала в
логический поступает либо информационный кадр (длиной 137 или 27 бит) либо
флаг наличия паузы. На паузных кадрах вместо речевого синтезатора
включается генератор комфортного шума, который восстанавливает
спектральный состав паузного сигнала. Параметры генератора обновляются при
получении паузного информационного кадра. Наличие информационного кадра
длиной 137 бит включает речевой декодер, на выходе которого формируется
12-ти разрядный речевой сигнал. Для эхо-компенсатора этот сигнал является
сигналом дальнего абонента, фильтрация которого дает составляющую
электрического эха в передаваемом сигнале. В зависимости от типа
цифро-аналогового преобразования сигнал может быть подвергнут
дополнительной кодировке по А- либо µ- закону.
Анализ схемы сигнальной обработки и опыт разработки позволяют выделить следующие основные проблемы цифровой обработки сигналов в шлюзе.
При использовании двухпроводных абонентских линий актуальной остаётся задача эхокомпенсации, особенность которой состоит в том, что компенсировать необходимо два различных класса сигналов - речи и телефонной сигнализации. Очень важной является задача обнаружения и детектирования телефонной сигнализации. Её сложность состоит в том, что служебные сигналы могут перемешиваться с сигналами речи.
Ключевая задача построения кодеков речи подробно обсуждалось в разделе "Речевые кодеки для IP телефонии". С построением кодеков тесно связана задача синтеза VAD. Основная трудность состоит в правильном детектировании пауз речи на фоне достаточно интенсивного акустического шума (шум офиса, улицы, автомобиля и т.д.)