КОНСОРЦИУМ W3C
Консорциум W3C, точнее, его рабочая группа W3C Voice Browser, созданная в 1998 г., занимается подготовкой документов, объединенных в набор W3C Speech Interface Framework и унифицирующих использование речевых технологий в Web. Их задачей является расширение методов доступа и навигации в Web путем использования клавиатуры сотовых и проводных телефонов, распознавания и синтеза естественной речи человека и пр. Для этого предлагается целый ряд спецификаций: диалогового языка разметки VoiceXML 2.0, синтеза речи (Speech Synthesis), распознавания речи (Speech Recognition), грамматики DTMF (DTMF Grammars), речевой грамматики (Speech Grammars), вероятностной модели языков (Stochastic Language Models) и др. Среди них самое динамичное развитие получили язык VoiceXML 2.0 и первая версия спецификации грамматики по распознаванию речи (Speech Recognition Grammar Specification 1.0), которые находятся на этапе окончательной стандартизации.
Что же касается многомодальных систем, то и эта тема не обойдена W3C стороной. В феврале этого года была организована рабочая группа Multimodal Interaction Activity. Ее задача - создание спецификаций, предоставляющих возможность многомодального доступа и навигации в Web, с одинаковым успехом сочетающего использование как традиционных устройств ввода-вывода (клавиатура, монитор), так и естественной речи человека, "рисующего пера" - стилусов и других нетрадиционных способов. Новые формы ввода-вывода приобретают всю большую популярность в связи с быстрым ростом пользователей сотовых телефонов, карманных компьютеров, автомобильных навигационных систем и телевизионных приставок, в которых невозможно использование полноценных клавиатур и цветных экранов с высоким разрешением.
Таким образом, получается, что решаемые новой рабочей группой W3C задачи практически полностью совпадают с целями SALT Forum. Сразу встает вопрос: не имеем ли мы еще один раскол, но теперь уже в сфере многомодальных систем, ведь, с одной стороны, есть спецификация SALT и 50 компаний ее поддерживающих, а с другой - международная организация по стандартизации Web W3C.
Видимо, никакого раскола нет и проблема лежит в несколько другой плоскости. Разворачивающиеся события вокруг SALT Forum очень напоминают историю появления диалогового языка VoiceXML, первая версия которого была создана в рамках организации VoiceXML Forum, а потом он был передан для дальнейшего развития и стандартизации в W3C. Правдоподобность этой версии подтверждается тем, что в списке компаний - участниц новой рабочей группы по многомодальным системам числится более половины организаторов SALT Forum: Microsoft, Intel, Comverse, SpeechWorks. Помимо них туда также входят IBM и Motorola, которые как раз выступают в лагере VoiceXML.
Ни для кого не секрет, что создание спецификаций W3C занимает достаточно продолжительное время, поэтому вряд ли стоит ожидать в ближайшее время появления международного стандарта по многомодальным системам. Тем временем рынок во главе с Microsoft сделал свой выбор и выпустил спецификацию SALT, и, наверное, в ближайший год или даже два именно она будет играть доминирующую роль в этой сфере.
В то время как Гейтс выступал перед участниками конференции PDC и представлял предварительный вариант спецификаций Microsoft, консорциум W3C официально утвердил Voice XML в качестве стандартной технологии распознавания речи для приложений Web, функционирующих в телефонных сетях.
Отныне спецификациями VXML, предложенными в свое время
ассоциацией VXML Forum, будет заниматься W3C. Консорциум W3C
уже представил черновой вариант VXML Version 2.