Кодирование речи в стандарте CDMA

В стандарте сотовой связи CDMA применяется метод многостанционного доступа с кодовым разделением каналов, основанный на использовании широкополосных сигналов. Каждому вызову присваивается уникальный код, позволяющий отличить этот вызов от других, передаваемых в том же частотном диапазоне. В этом стандарте обеспечивается более высокое качество речи, чем в стандарте GSM. Это во многом определяется применением кодирования речи.

В системе CDMA для преобразования аналогового речевого сигнала в цифровой используется вокодер с переменной скоростью кодирования, в основу работы которого положен алгоритм с ЛП кода - CELP. Этот алгоритм учитывает особенности человеческой речи. Вокодер перекодирует цифровой поток, имеющий скорость 64 кбит/с, в поток со скоростью 8 или 13 кбит/с. В ходе этого преобразования информационный поток делится на кадры, и содержащие паузы интервалы удаляются. Результирующий поток имеет скорость от 1 до 8 кбит/с. Вокодер приемной стороны объединяет кадры в единый поток и делает обратное преобразование. Другой важной особенностью вокодера с переменной скоростью кодирования является использование адаптивного порога для определения требуемой скорости кодирования данных. Уровень порога изменяется в соответствии с фоновым шумом. Результатом этого является подавление фона и улучшение качества речи даже в шумной обстановке. Вокодер позволяет подмешивать в речевой канал вторичный трафик, т.е. служебную информацию.

Оценка качества кодирования речи

При оценке качества кодирования и сопоставлении различных кодеков оцениваются разборчивость речи и качество синтеза (качество звучания) речи. Для оценки разборчивости речи используется метод DRT (диагностический рифмованный тест). В этом методе подбираются пары близких по звучанию слов, отличающихся отдельными согласными, которые многократно произносятся рядом дикторов, и по результатам испытаний оценивается доля искажений. Метод позволяет получить как оценку разборчивости отдельных согласных, так и общую оценку разборчивости речи.

Для оценки качества звучания используется критерий DAM (диагностическая мера приемлемости). Испытания заключаются в чтении несколькими дикторами (мужчинами и женщинами) ряда фраз, которые прослушиваются на выходе тракта связи рядом экспертов-слушателей, выставляющих оценки по 5-балльной шкале. Результатом является средняя субъективная оценка, или средняя оценка мнений (MOS). Хотя этот метод является субъективным, его результаты по сопоставлению различных типов кодеков при проведении испы- таний одними и теми же группами дикторов и экспертов-слушателей являются достаточно объективными, и на них основываются выводы и решения.

В табл. 6 приведены результаты оценки четырех типов кодеков. Близкие к шкале MOS результаты дает объективный метод оценки качества с использованием понятия кепстрального расстояния (Cepstrum Distance - CD).

Существует множество вариантов кодеков речи, из которых приходится выбирать кодек для ССС. Например, при разработке стандарта GSM были исследованы шесть типов кодеков, после чего выбор был остановлен на кодеке RPE-LTP. Работа по выбору типа кодека для стандарта GSM была завершена в 1988 г., а в 1989 г. был предложен метод VSELP, принятый затем в стандарте D-AMPS. Работы по совершенствованию кодекса речи продолжаются и в настоящее время. Обоими стандартами (D-AMPS и GSM) предусмотрено введение полускоростного кодирования, которое сможет увеличить пропускную способность канала связи в два раза. В числе исследуемых вариантов для стандарта D-AMPS рассматривается возможность введения векторного квантователя параметров линейных спектральных пар с расщеплением и межкадровым предсказанием, а для стандарта GSM - использование метода кодирования CELP.

Таблица 6. Оценка кодеков речи по шкале MOS
Тип кодека Темп передачи информации, кбит/с Оценка MOS
РСМ 64 4.12
ADPCM 13 3.78
RPE-LTP (стандарт GSM) 13 3.58
VSELP (стандарт D-AMPS) 8 3.44
CELP (стандарт CDMA) 4,8
9,6
3
3,7
QCELP (стандарт CDMA) 13 4.02


[Назад ][Содержание ][Вперед ]

Hosted by uCoz