Ты со мной разговариваешь?

Проблемы с технологиями бывают двух видов: ожидаемые и неожиданные. С тех пор как появились первые технологии распознавания речи, проблемы, которые с ними возникали, были ожидаемыми. Как правило, описание этих проблем было кратким: они не работали.
Пропускные способности мобильных и немобильных интернет-сетей были слишком малыми, чтобы быстро обрабатывать голосовые команды в «облаке» и адекватно на них реагировать, а аппаратные возможности мобильных устройств были, да и сейчас остаются, неспособными правильно и быстро обрабатывать речь.
Но вот наступило будущее. Сначала Google своим голосовым поиском доказала, что эти штуки реально работают, а потом Apple дала всем конкурентам под зад с помощью маленького чуда по имени Siri, доказав, что речевые технологии не только работают, но еще и могут быть дружелюбными к пользователю.
Когда Apple представила Siri, я впервые всерьез задумался о покупке iPhone. Но потом я еще немного подумал и предположил, что сразу после презентации Siri куча программистов по всему миру засели строчить код для приложений из серии «а-ля». И оказался прав. Покопавшись пятнадцать минут в Android Market, я добыл десяток программ с такими же, как у Siri, функциями. Больше всех мне понравилась Speaktoit Personal Assistant.
С помощью этой программки можно открывать приложения и частично управлять ими, публиковать апдейты в Facebook и Twitter, искать ближайшие Points of interest, узнавать о погоде, создавать события в календаре и заметки из разряда «не забыть» в собственном заметочном подразделе программы, а также делать много чего еще. Программа не оказалась такой же умной, как Siri. Например, она не может создавать напоминания, привязанные к географическому положению пользователя, но, учитывая, что приложение бесплатное, с этим можно смириться. Во всем остальном, в комбинации с голосовым набором от Google, это очень и очень полезная программа, которой я поначалу стал регулярно пользоваться.
Я набирал голосом сообщения для публикации в Facebook, я устанавливал будильник и создавал напоминания, а также события в календаре. Даже, несмотря на то, что программа не поддерживает русский язык, а мой английский не слишком хорош, мне удавалось работать с ней и получать удовольствие от этой работы. Поставь будильник на 6:40 утра, открой Facebook, напомни мне позвонить родителям, запусти трек «Wish You Were Here» и так далее. При быстром интернет-соединении программа выполняла мои команды почти моментально, и я чувствовал себя жителем цивилизованного мира, где технологии победили зло неудобных интерфейсов.
Но потом возникли неожиданные проблемы.
Я вдруг стал замечать, что мои родственники стали на меня странно смотреть, не говоря уже о незнакомых людях на улице или в общественных заведениях. Их можно понять: чувак, который разговаривает с телефоном, определенно выглядит странно.
Эта мысль засела в моей голове, и с тех пор я пользуюсь персональным ассистентом, лишь, когда я в одиночестве либо в компании людей, которые в курсе, что такое распознавание речи. И я пользуюсь этой программой гораздо реже, чем мне хотелось бы.
Голосовые команды — определенно интерфейс будущего. Для обычного человека нет ничего проще речи. Никакие дополнительные клавиши и эргономичные интерфейсы не способны состязаться с простой голосовой командой. Кондиционеры, микроволновые печи, телевизоры и прочие штуки из серии «мой умный дом», оснащенные функциями распознавания речевых команд, в ближайшие годы станут настоящим хитом. Речь — незаменимый musthave-интерфейс для автомобилей, потому что когда у тебя заняты руки, и тебе нужно следить за дорогой, проще сказать, чтобы машина убавила звук аудио-системы, переключила трек, отрегулировала температуру в салоне, проложила новый маршрут и прочее, чем на ощупь искать нужные клавиши или отвлекаться от дороги, рискуя своей жизнью и жизнями пассажиров.
Но если говорить о смартфонах, планшетах и прочих мобильных устройствах, вероятно, в течение следующих трех-пяти лет люди в большинстве своем продолжат пользоваться сенсорным экраном и, лишь оставшись в одиночестве, будут баловаться голосовыми возможностями.
Просто потому, что никто не хочет выглядеть психом.
P.S. Это не относится к тем, кто разговаривает в общественных местах с телефонными гарнитурами.