- PVSM.RU - https://www.pvsm.ru -
Это перевод оригинальной статьи New Design Practices for Touch-free Interactions [1]
Сенсорные интерфейсы практически захватили развитые рынки, что повлекло за собой изменения ожиданий пользователей и взглядов UX-специалистов на человеко-машинное взаимодействие (Human-Computer Interaction, HCI). Теперь вслед за сенсорными интерфейсами в индустрию понемногу начинают проникать технологии бесконтактных жестовых и естественно-языковых взаимодействий (Natural Language Interaction, NLI). Распространение этих технологий обещает перемены в отрасли UX, начиная с эвристик [2], которыми мы руководствуемся, и заканчивая паттернами проектирования [3] и конечными результатами [4].
Благодаря сенсорным интерфейсам взаимодействие пользователей с вычислительными устройствами стало более естественным и интуитивным. С повсеместным распространением сенсорных технологий стали появляться новые концепции взаимодействий. Усилиями корпораций Майкрософт и Apple соответственно бесконтактные жестовые и естественно-языковые (NLI) интерфейсы, дождавшись своего часа, теперь наконец начинают понемногу проникать в отрасль. Если эти технологии приживутся, то благодаря ним мы сможем сделать следующий шаг к созданию естественного пользовательского интерфейса (Natural User Interface, NUI).
Данная модель взаимодействия приобрела популярность благодаря сенсорам Kinect, созданным корпорацией Майкрософт для игровой платформы Xbox. Данные устройства затем были адаптированы для использования с компьютерами на базе ОС Windows [5] и с устройствами Samsung Smart TV [6]. Таким образом бесконтактные жестовые интерфейсы шагнули из компьютерных игр прямиком в повседневную жизнь.
В Kinect для Windows входит интересная функция, которая называется Near Mode [7]. В режиме Near Mode пользователи могут использовать бесконтактные жесть для работы с ПК, сидя за ним, без необходимости вставать в полный рост. Технология бесконтактного жестового взаимодействия позволяет уменьшить количество элементов интерфейса в производительных приложениях, благодаря тому что с отображаемыми на экране объектами можно обращаться практически как с реальными физическими объектами. Также данная технология позволяет использовать компьютер в условиях, когда прикасаться к нему в силу каких-либо причин нежелательно, например на кухне или в операционной.
Идея напрямую обращаться к компьютеру не нова [8], но именно успех приложения Siri для iPhone наконец вывел эту технологию на первый план в отрасли. Главным преимуществом естественно-языкового взаимодействия является то, что данная технология имитирует нашу с вами манеру общения, усвоенную каждым еще в раннем детстве.
Продуманные естественно-языковые интерфейсы не только придают взаимодействию человека и компьютера естественность: при речевом взаимодействии пользователь очеловечивает компьютер и воспринимает его как некоего члена социума. Благодаря этому дизайнеры и авторы контента получают колоссальные возможности для выстраивания по-настоящему глубоких взаимоотношений с пользователями.
С развитием технологий появляется все больше возможностей для улучшения процесса взаимодействия, однако не стоит забывать, что человеческие возможности небезграничны, и это относится к в том числе и к таким процессам. Шагая навстречу новым моделям взаимодействий, мы одновременно создаем систему знаний, благодаря которой UX-специалисты смогут воспользоваться этими моделями. В качестве теоретической базы выступают принципы человеко-машинного взаимодействия.
[9]
Согласно модели человеко-машинного взаимодействия [10], разработанной Биллом Верпланком (Bill Verplank), взаимодействие пользователя с любой системой состоит из трех компонентов — человеческих факторов:
Уделяя в процессе дизайна внимание этим трем элементам user experience, можно добиться улучшения всей системы. Перечисленные человеческие факторы могут послужить теоретической основой при прогнозировании и оценке новых эвристик и шаблонов дизайна интерфейсов.
Никто не отменяет уже хорошо нам известные [11] эвристики. Однако стоит расширить их список для более эффективного использования технологий бесконтактного жестового и естественно-языкового взаимодействий. Приведем пару примеров таких эвристик:
С повсеместным распространением сенсорных интерфейсов появились вот такие библиотеки жестов [12] в помощь дизайнерам, работающим над методами сенсорного взаимодействия. Не ограниченные двумя измерениями плоского экрана бесконтактные жестовые интерфейсы позволяют дизайнерам эффективно использовать третье измерение — глубину, а также движения тела.
Добавьте к этому голосовое управление — и вы получите практически неограниченные возможности: например, пользователь может одновременно контролировать один элемент системы посредством жестов, а другой — посредством голосовых команд.
Изначально сенсор Kinect распознавал движения, производимые всем телом, но теперь благодаря наличию режима Near Mode в новой версии его функционал значительно расширился. Ниже приведены примеры жестов, которые можно использовать, сидя за ПК, с иллюстрациями из библиотеки жестов Think Moto:
Вдобавок к новым возможностям управления посредством жестов сенсор Kinect для ПК способен считывать прочие телодвижения пользователей, которые выдают их усталость или настроение. Например, более активная жестикуляция (скажем, более размашистые и резкие жесты) может быть расценена системой как знак того, что пользователь взволнован, и система корректирует свое поведение соответствующим образом. У пользователей, использующих производительные приложения, такое поведение может быть вызвано чувством неудовлетворенности, и система может попытаться помочь пользователю успокоиться.
Еще одним индикатором является точность жестов. Ленивые и неточные жесты пользователя могут быть расценены как признак усталости, и в таком случае система может выдать сообщение с предложением сделать перерыв в работе. Кроме этого, в зависимости от того, сидит ли пользователь за ПК или стоит в полный рост (хотя это и нельзя полностью отнести к косвенным признакам), можно делать доступными разные наборы функций.
Вследствие сложности естественных языков создание шаблонов для интерфейсов NLI является задачей более трудной, чем в случае с жестовыми интерфейсами. Тем не менее некоторые конструкции, присущие естественным языкам, можно использовать в качестве основы при создании таких шаблонов.
Начнем с того, что пользователи могут осуществлять голосовой ввод данных преимущественно двумя способами: задавая вопросы (и получая ответы от системы) и отдавая команды (что приводит к выполнению системой какой-либо операции). Далее, отдельные предложения можно разбить на фразы, каждая из которых является самостоятельной семантической единицей. Тому, что могут почерпнуть разработчики естественно-языковых интерфейсов из области лингвистики и коммуникаций, посвящен ряд публикаций, в том числе книга Speech Technology [13] под редакцией Фэнга Чена (Fang Chen) и Кристины Йокинен (Kristiina Jokinen).
При внедрении инновационных моделей взаимодействия едва ли не самым сложным этапом является общение с заинтересованными лицами, которые еще не успели хорошенько ознакомиться с нововведением. Визуализировать несуществующие вещи довольно затруднительно, так что UX-дизайнерам придется хорошенько подумать, каким образом донести нужную информацию.
Спецификации дизайна взаимодействий основываются на двух измерениях, которых им вполне достаточно. Однако для некоторых бесконтактных жестов могут потребоваться переменные вроде «расстояние до экрана» или «движение по оси Z», которые эффективнее визуализируются в 3D.
Речевое взаимодействие еще сложнее. Теперь, когда взаимодействие с системой в буквальном смысле становится диалогом, дизайнерам следует учитывать множество дополнительных факторов, например пользовательские интонации, акценты или выбор слов для одной и той же команды. В естественно-языковом интерфейсе такие вариации должны учитываться по максимуму.
Кроме того, появляется множество переменных, определяющих то, какой ответ система выдает пользователю. Интонация, выбор слов, модуляция, тембр — все эти и многие другие факторы влияют на то, как пользователь воспринимает систему.
Благодаря голосовым функциям компьютеры становятся членами социума пользователя, и их «личности», воспринимаемые пользователем, являются крайне важным аспектом дизайна. К счастью, нам не требуется изобретать велосипед для решения этой задачи.
UX-специалисты уже давно используют образы пользователей [14] для их классификации. Этот подход можно применить и к компьютерам, наделенным даром речи, для определения типа личности, которая моделируется системой. Создание таких образов облегчит работу вовлеченных в создание голосового интерфейса специалистов: копирайтеров, создающих сценарии, разработчиков кодировки для преобразования текста в речь, а также актеров озвучки.
Систему можно запрограммировать на эмпатию, настроив распознавание изменений в речи пользователя — волнения, раздражения или беспокойства. Если пользователь удручен чем-либо, распознавшая это система может переключиться с авторитетного, властного образа (демонстрирующего надежность и внушающего доверие) на образ заботливый и родительский (способный успокоить пользователя).
Для эффективной реализации технологии распознавания телодвижений и речевых шаблонов пользователей необходимо не упустить ни одной детали и поддерживать четкий обмен информацией между заинтересованными лицами. Прототипы получают все большее распространении по той же причине, что и спецификации: лучше один раз увидеть, чем сто раз услышать. Это касается и тестирования приложений, и их разработки.
На данный момент нет такого ПО, которое позволило бы оперативно смоделировать бесконтактное жестовое взаимодействие Kinect; остается только загружать пакет SDK [15] и самостоятельно создавать приложения. Для голосовых интерфейсов, однако, есть несколько бесплатных инструментов, таких как CSLU Toolkit [16], благодаря которым разработчики могут оперативно собрать голосовой интерфейс для моделирования и тестирования.
В общем, пока инструменты создания прототипов не станут достаточно быстрыми, гибкими и эффективными, мы обречены держаться корней и использовать проверенные инструменты: бумагу [17], демонстрационные материалы, раскадровки [18] и «волшебника Оз» [19].
Со времен электронных ламп и перфокарт компьютерные пользовательские интерфейсы претерпели множество изменений, каждое из которых сопровождалось появлением новых возможностей — и новых задач. Благодаря бесконтактным жестовым и естественно-языковым интерфейсам общение человека с компьютером становится гораздо более эффективным и… человечным. Если UX-специалисты собираются по полной использовать открывающиеся перед ними возможности, то им нужно следовать в этом же направлении.
Я верю, что мы все готовы к принятию этой новой парадигмы человеко-компьютерного взаимодействия, которая позволит нам приблизиться к нашим пользователям как никогда.
Автор: Brian Pagán [20]
Прим. пер.: Эта статья ещё интересна в контексте 10-летия выхода на экраны фильма Minority Report [21], в котором был показан интересный концепт подобного интерфейса.
Автор: zamesin
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/yuzabiliti/11123
Ссылки в тексте:
[1] New Design Practices for Touch-free Interactions: http://uxmag.com/articles/new-design-practices-for-touch-free-interactions
[2] эвристик: http://uxmag.com/articles/where-do-heuristics-come-from
[3] паттернами проектирования: http://uxdesign.smashingmagazine.com/2011/10/06/not-your-parents-mobile-phone-ux-design-guidelines-smartphones/
[4] конечными результатами: http://uxmag.com/search/results/deliverables
[5] были адаптированы для использования с компьютерами на базе ОС Windows: http://www.microsoft.com/en-us/kinectforwindows/
[6] устройствами Samsung Smart TV: http://www.samsung.com/us/2012-smart-tv/#navigation
[7] Near Mode: http://blogs.msdn.com/b/kinectforwindows/archive/2012/01/20/near-mode-what-it-is-and-isn-t.aspx
[8] Идея напрямую обращаться к компьютеру не нова: http://en.wikipedia.org/wiki/William_Aaron_Woods
[9] Image: http://zamesin.me/wp-content/uploads/2012/07/tfi_02.png
[10] модели человеко-машинного взаимодействия: http://www.billverplank.com/Lecture/
[11] хорошо нам известные: http://www.useit.com/papers/heuristic/heuristic_list.html
[12] библиотеки жестов: http://www.lukew.com/ff/entry.asp?1071
[13] Speech Technology: http://books.google.com/books?id=jD3XKFBuN5QC
[14] образы пользователей: http://uxmag.com/articles/personas-the-foundation-of-a-great-user-experience
[15] пакет SDK: http://www.microsoft.com/en-us/kinectforwindows/develop/
[16] CSLU Toolkit: http://www.cslu.ogi.edu/toolkit/index.html
[17] бумагу: http://uxmag.com/articles/better-use-of-paper-in-ux-design
[18] раскадровки: http://uxmag.com/articles/rich-internet-application-screen-design
[19] «волшебника Оз»: http://www.ucc.ie/hfrg/projects/respect/urmethods/wizard.htm
[20] Brian Pagán: http://uxmag.com/readers/x9vbsry6n5
[21] 10-летия выхода на экраны фильма Minority Report: http://www.theverge.com/2012/6/24/3113237/minority-report-idea-summit-predicted-the-future
Нажмите здесь для печати.