Вступление

О ПОЛНОМ ВЗАИМОПОНИМАНИИ

На ежегодном конкурсе “общительных” компьютерных программ, проходившем на этот раз в лондонском Музее науки, второй раз подряд одержала победу система Alice разработчика Ричарда Уоллеса (Richard Wallace). Это довольно необычное состязание с медалью и денежной премией для победителя носит название “Конкурс на приз Лёбнера”, и по ходу его программы должны продемонстрировать способности к поддержанию диалога, максимально похожего на разговор живого человека. Учредил данный конкурс в 1990 году американский филантроп Хью Лёбнер, по сию пору лично участвующий в работе жюри.

По сути дела, в ходе этого конкурса программы проходят неформальную проверку на знаменитый “тест Тьюринга”, предложенный более полувека назад в качестве критерия оценки искусственного интеллекта, основан на анализе беседы с машиной, то есть проверяющий должен определить, разговаривает он с живым человеком или же с компьютером. Конкурс Лёбнера воспроизводит этот тест следующим образом. Судьи из жюри ведут беседу (в форме текстового чата) одновременно с компьютерными программами и живыми участниками, заранее не зная, кто есть кто. По результатам таких собеседований каждому собеседнику выставляется оценка на “человечность” в диапазоне от 1 до 25 баллов.

На нынешнем конкурсе программа Alice еще больше, чем в прошлом году, оторвалась от остальных систем. Причем один из членов жюри оценил ее даже как более человечную, чем некоторых из участников-людей. В целом же, однако, судьям пока что удается довольно легко поделить собеседников на живых и искусственных. Поэтому выше бронзовой медали (и приза в 2 тысячи долларов) “за наиболее выдающееся достижение” создатели разговорных программ пока ни разу не получали. Серебряная медаль (плюс 25 тысяч долларов) ожидает автора программы, которая через текстовый диалог сумеет убедить половину судей, что они разговаривают с живым человеком. А золотая медаль и приз в 100 тысяч предназначены создателю системы, которая хотя бы на половину жюри произведет впечатление человека уже в устной беседе.

Не исключено, что промежуток между вручением серебряной и золотой лёбнеровской медали может оказаться сравнительно небольшим. В последнем номере “Журнала экспериментальной психологии” (“Journal of Experimental Psychology”) публикуется работа группы исследователей из Стэнфордского университета, убедительно свидетельствующая, что люди на подсознательном уровне наделяют искусственно синтезированный голос личностными чертами, даже заранее зная, что слышат робота. При этом, чем больше особенности искусственного голоса отражают черты слушающего его человека, тем больше последний склонен доверять такому голосу. Люди-экстраверты предпочитают и соответствующие голоса: громкие, быстрые, с варьирующимися тональностями. Интроверты же, напротив, отдают предпочтение менее напористой и мягко звучащей речи. Исследования показали, что люди охотнее покупают электронные книги, если голос программы, читающей рецензию, соответствует особенностям личности покупателя. Слушатель прекрасно осведомлен, что имеет дело с синтезированной речью, но выбор предпочтений осуществляется не на рациональном, а на подсознательном уровне, поскольку мозг автоматически начинает выстраивать облик персоны, дающей рекомендации. Естественно, эти результаты дают почву не только для сравнительно честных маркетинговых ходов, но и для злоупотреблений рекламой.

Хотя проблема управления компьютером с помощью голосовых команд пока далека от окончательного решения, здесь уже достигнуты определенные успехи. Ряд ведущих hi-tech-компаний рассчитывает в обозримом будущем почти полностью убрать кнопки с сотовых телефонов и карманных компьютеров, так как управлять такими компактными устройствами значительно удобнее с помощью речевых команд.

В частности недавно компании Intel, Microsoft, Cisco, Comverse, Philips и SpeechWorks основали консорциум SALT Forum (от Speech Application Language Tags) для создания ПО, которое позволило бы управлять интернет-серфингом с помощью одних лишь голосовых команд. В отличие от многих разработок, привлекающих для голосовой веб-навигации язык XML или закрытое фирменное ПО, участники SALT опираются на старый-добрый HTML.

Уже создана программа-прототип, привязывающая речевые команды к гиперссылкам веб-страниц. Пока что она работает не так гладко, как хотелось бы, зачастую компьютер понимает пользователя лишь со второго-третьего раза, однако ряд экспертов, тестировавших экспериментальное ПО, полагает, что первые сотовые телефоны с голосовым управлением могут появиться на рынке уже в следующем году.