Для администраторов корпоративных сетей основным вопросом является выбор технологии пакетной передачи речи - по Frame Relay (VoFR) или IP (VoIP). Зачастую этот выбор зависит не от нас. Крупные поставщики услуг связи, которые должны иметь возможность подключать к своей сети различных клиентов, для передачи телефонного трафика однозначно выбирают протокол IP, т.к. он и обеспечивает передачу пакетов независимо от содержащейся в них информации над любыми канальными протоколами. Пользователи Интернет тоже передают речь с помощью протокола IP - это стандарт Сети.
В основном, выбор той или иной технологии зависит от параметров каналов связи (полоса пропускания, качество), а не от существующего "железа", т.к. производители сетевого оборудования предлагают продукты, объединяющие в себе функции устройств доступа к сетям Frame Relay и IP. Поэтому, не будем пока говорить о плюсах и минусах VoFR и VoIP, лучше рассмотрим параметры каналов связи в качестве критериев при выборе технологии пакетной передачи разнородного трафика.
Скорость пакетной передачи речи зависит от нескольких факторов: скорости кодирования сигнала, размера речевого пакета, объема служебной информации протоколов канального, сетевого и транспортного уровней, наличия или отсутствия механизма сжатия заголовков пакетов, числа передаваемых по линии телефонных каналов, степени использования механизма детектирования речевого сигнала (Voice Activity Detection - VAD), a также от того, какова допустимая доля потерянных пакетов при перегрузке выходного порта мультиплексора Frame Relay или маршрутизатора.
Рассмотрим влияние этих факторов на скорость передачи телефонного трафика по одному телефонному каналу на примере использования кодека G.729. Он обеспечивает сжатие речи до 8 Кбит/с, при этом минимальная длительность отрезка анализируемого сигнала составляет 10 мс. За этот интервал времени кодек выдает битовую последовательность длиной 10 байт. Далее формируются речевые пакеты - к полезной нагрузке добавляется заголовок длиной от 1 до 3 байтов. Этот заголовок обеспечивает передачу информации о типе сообщения (речь, факс или данные) и сигнализации, параметрах VAD и длине пакета. Типичная длина заголовка речевого пакета составляет 2 байта, поэтому полная длина такого пакета может составлять 12, 22 байта и т. д. - до 82 байт в зависимости от числа помещенных в один пакет элементарных 10-байт последовательностей полезной нагрузки.
В случае использования протокола Frame Relay речевой пакет помещается в кадр этого протокола с заголовком 6 байт (общий объем полей служебной информации конкретного протокола). На этом подготовка к передаче речевой информации заканчивается. Затем кадры VoFR поступают в сетевой порт вместе с кадрами данных, если, конечно, речь передается совместно с данными.
Скорость передачи одного телефонного канала для варианта VoFR определяем по известному полному объему кадра в битах и времени, в течение которого он должен быть передан. Например, если речевой пакет содержит две элементарные последовательности битов полезной нагрузки, общее время анализа речевого сигнала составит 2*10= 20 мс, а объем передаваемой информации - 8*(22 + 6) = 224 бит, в результате скорость передачи будет равна 11,2 Кбит/с. При длине речевого пакета 62 байт скорость равнялась бы 9,07 Кбит/с.
Когда речь передается с помощью протокола IP, речевые пакеты по стандарту G.729 формируются точно так же, как и для варианта VoFR, однако последующие процедуры гораздо сложнее. Прежде всего речевой пакет помещается в поле данных пакета протокола RTP (Realtime Transfer Protocol), заголовок которого имеет размер 12 байт. Затем этот пакет помещается в поле данных пакета протокола транспортного уровня UDP с заголовком длиной 8 байт, и, наконец, наступает очередь собственно протокола IP, пакет которого имеет заголовок 20 байт. Таким образом, общая величина накладных расходов протоколов IP/UDP/RTP составляет 40 байт.
Но пакет IP по сети перемещается при помощи протокола канального уровня: РРР, HDLC, Frame Relay, ATM или любого другого. В поле данных кадров этих протоколов помещается пакет IP, после чего он готов для передачи по сети. Типичным вариантом организации IP-сетей является использование протокола РРР с заголовком длиной 8 байт. В результате для рассмотренного ранее случая передачи речевых пакетов стандарта G.729 с полезной нагрузкой 20 байт полная длина IP-пакета составит 22 + 40 + 8 = 70 байт. Передать эти данные за те же 20 мс можно при условии, что скорость в канале будет равна 28 Кбит/с - это примерно в 2,5 раза больше, чем при передаче такого же речевого пакета посредством технологии VoFR.
Увеличивая объем полезной нагрузки, можно снизить требования к пропускной способности одного телефонного канала VoIP, например до 14,7 Кбит/с при объеме 60 байт. Однако за это придется расплачиваться увеличением времени задержки речевого сигнала (об этом будет сказано отдельно). Но в любом случае необходимая полоса пропускания должна быть существенно больше скорости кодирования речевого сигнала, которая в нашем случае, напомним, равна 8 Кбит/с.
Для улучшения этой ситуации разработаны и применяются протоколы сжатия заголовков IP-пакетов. Они позволяют уменьшить суммарный заголовок IP/UDP/RTP до 4 байт. Однако сжатие любых данных сопровождается задержкой сигнала, значение которой точно определить трудно, поскольку оно зависит от используемого алгоритма сжатия и его фирменной реализации. Приблизительно она равна 10 мс. Еще следует читывать, что протоколы сжатия заголовков, реализованные в оборудовании разных производителей, как правило, несовместимы, либо вообще отсутствуют.
Многоканальный вариант
Если пакетные технологии используют для передачи трафика многоканальные телефонные линии, то большую роль играет механизм VAD (Voice Activity Detection) - детектирование речевого сигнала. Уделим этому механизму особое внимание. Общаясь по телефону, каждый абонент в среднем бывает активен только 40% времени разговора. Использование VAD позволяет подавлять паузы в разговоре и в периоды молчания абонентов передавать информацию, причем не только данные, но и речевые пакеты других каналов. Подавление пауз осуществляется по месту нахождения речевых кодеков: либо в мультиплексорах Frame Relay, а в случае VoIP - в речевых шлюзах (в случае использования оборудования фирмы Cisco Systems роль таких шлюзов выполняет маршрутизатор).
Положительным является то, что эффективность использования механизма VAD не зависит от конкретной технологии пакетной передачи речи - VoFR или VoIP. Но с другой стороны включение данного механизма в ряде случаев является причиной несовместимости двух кодеков одного стандарта из-за неодинаковой реализации VAD в оборудовании разных фирм.
Любая телефонная линия всегда снижает качество диалога - ухудшаются такие параметры, как разборчивость и узнаваемость речи, а также ряд других параметров. Дополнительно сама пакетная форма передачи речи сопровождается рядом специфических явлений, ухудшающих качество разговора. К ним относятся задержка сигнала во входном буфере кодера и в других элементах тракта передачи, потеря части пакетов при перегрузках сетевых портов (абоненты не замечают потери пакетов, если их доля не превышает 3%), нестабильность интервала времени между началом обработки двух соседних пакетов в декодере (джиттер), эхосигнал, который при задержках выше 50 мс становится ощутимой помехой в трубке говорящего абонента. Эхосигнал устраняется методом компенсации. Потери пакетов в контролируемой корпоративной сети могут быть сведены к допустимому уровню или полностью исключены выбором достаточной пропускной способности линии. Влияние джиттера тоже устраняется, если на входе декодера использовать специальный сглаживающий буфер. В результате единственным фактором, отрицательное влияние которого на качество пакетной передачи речи нельзя устранить, остается задержка сигнала.
Задержка сигнала
Установлено, что задержку менее 120-150 мс разговаривающие по телефону абоненты просто не замечают. Однако, задержка в 400 мс и более является уже неприемлемой. Рассмотрим, из чего же формируется такое значение задержки.
Во входном буфере кодера задержка сигнала определяется объемом полезной нагрузки речевого пакета и скоростью кодирования. Например, для кодека G.729 при объеме нагрузки 20 байт задержка равна 20 мс. Выполняющиеся затем процедуры формирования речевого пакета и его инкапсуляции в кадр Frame Relay или пакет IP вместе с собственно сжатием сигнала увеличивают задержку еще примерно на 5 мс. Далее кадр или пакет поступает в сетевой порт, который может быть занят передачей другого пакета - либо речевого, либо канала данных. Время этой передачи зависит от длины пакета и скорости сетевого порта. Если последняя выбрана из расчета обслуживания только одного телефонного канала, то пакет с полезной нагрузкой 20 байт будет передаваться 20 мс. В случае, например, десятиканальной линии без использования механизма VAD это время за счет увеличения скорости порта уменьшится в 10 раз и составит 2 мс. Однако в многоканальном варианте при одновременной загрузке всех каналов кадр или пакет одного из них должен подождать, пока равноприоритетные кадры других каналов будут переданы через порт. В результате максимальное время ожидания в очереди на передачу кадра некоего канала в многоканальной линии останется равным тем же 20 мс, как если бы линия была одноканальной, а полное время задержки сигнала, связанное с его передачей в линию, составит 22 мс (20 + 2). В случае применения механизма VAD при активности всех каналов среднее число поступающих в порт пакетов уменьшится вдвое, а максимальное время их пребывания в очереди сократится примерно в полтора раза. Рассмотренная ситуация относится к периодам пика телефонной нагрузки, в остальное время задержка речевых пакетов в очереди к сетевому порту будет существенно меньше.
Помимо рассмотренных составляющих задержки речевых пакетов, а также задержки при декодировании, равной 4 мс, должно учитываться время распространения сигнала в среде передачи, которое составляет 1 мс на каждые 300 км линии связи. В наземных линиях это время измеряется единицами миллисекунд. В спутниковых каналах время распространения сигнала равно примерно 250 мс, и поэтому задержку во всех остальных элементах тракта передачи нужно свести к минимуму, и в сумме она не должна быть больше 150 мс, чтобы ее результирующее значение не превысило допустимый порог в 400 мс.
Анализ показывает, что если скорости сетевых портов мультиплексора Frame Relay и маршрутизатора выбраны достаточными для того, чтобы число потерянных речевых пакетов не превышало допустимый уровень, то значения задержки в одинаковых элементах тракта передачи при прочих равных условиях для технологий VoFR и VoIP практически не различаются. Однако маршрутизаторы, как обязательные устройства третьего уровня модели OSI, выполняют ряд операций, которые отсутствуют в мультиплексорах. Это проверка контрольной суммы, считывание IP-адреса получателя, поиск в таблице маршрутизации адреса порта, на который должен быть отправлен пакет, передача пакета на нужный порт. Каждая из этих операций вносит дополнительную задержку, общее же значение задержки для типичного случая классической маршрутизации имеет порядок 30 мс и даже больше. Коммутаторы Frame Relay на транзитных узлах сети обрабатывают данные на втором уровне OSI и задерживают сигнал лишь на доли миллисекунды. Учитывая указанные обстоятельства, можно сделать вывод, что при связи абонентов оконечных узлов корпоративной сети по технологии VoIP задержка сигнала примерно на 90 мс больше по сравнению с той, какая имеется в случае использования технологии VoFR при одинаковой величине речевого пакета.
Из всего изложенного выше кратко можно сделать следующие выводы:
P.S.
Технология VoIP по всем основным параметрам менее эффективна, чем VoFR. Почему же тогда IP-телефония так популярна, а качество предоставляемой провайдерами соответствующей телематической услуги не хуже качества обычной международной телефонной связи?
При отсутствии дефицита пропускной способности линии связи обеспечить высокое качество IP-телефонии не составляет труда. Если отказаться от сжатия речи по стандарту G.729 в пользу стандарта G.711 со скоростью кодирования 64 Кбит/с, а также от других механизмов возможной несовместимости оборудования разных производителей - сжатия заголовков IP-пакетов и подавления пауз в речи - и в добавление к этому осуществлять связь по выделенным линиям без одновременной передачи данных, то проблем с качеством речи не возникнет.
Задержка входного буфера кодера стандарта G.711 составляет 8 мс. За это время передается 64 байт полезной нагрузки, и при общей длине всех заголовков речевого пакета и пакетов протоколов РРР, IP, UDP и RTP 50 байт полная длина такого пакета составит 114 байт. Тогда необходимая для одного канала пропускная способность линии должна быть равной 114 Кбит/с. Выделение такого ресурса сети вполне возможно при организации международной и междугородной связи по выделенным каналам ВОЛС (волоконно-оптическим линиям связи).
В корпоративных сетях ситуация иная. Там об избытке пропускной способности говорить не приходится, поэтому если сравнивать технологии VoFR и VoIP с точки зрения эффективности использования ресурсов при условии обеспечения качества речи, то следует предпочесть VoFR.