- PVSM.RU - https://www.pvsm.ru -
Медицинские исследователи установили [1], что если в инструкции к лекарству находится только текст, человек усваивает из нее лишь 70% информации. Если же в инструкцию добавить картинки, человек усвоит уже 95%.
В нашей компании [2] уже много лет занимаются разработкой и поддержкой инструментов для визуализации данных, охватывая большой диапазон платформ и технологий. И в этом есть смысл, ведь визуализационные инструменты всегда были и остаются востребованными на рынке разработки. И мы знаем, в чем причина такой популярности.
Прежде всего, нужно знать, что же такое визуализация данных и какие ее методы используются, в том числе и в повседневной жизни.
Самые простые, а потому и самые распространенные методы визуализации — это графики
Визуализация данных — это наглядное представление массивов различной информации. Существует несколько типов визуализации [3]:
Визуальная информация лучше воспринимается и позволяет быстро и эффективно донести до зрителя собственные мысли и идеи. Физиологически, восприятие визуальной информации является основной для человека. Есть многочисленные исследования, подтверждающие, что:
Если попросить читателя вспомнить названия материков, в голове возникнет именно эта картинка
На графике читатель быстрее найдет минимальное и максимальное значения
Инструкцию снизу намного легче и быстрее понять и выполнить
Подробнее о фактах и исследованиях можно посмотреть в интересной инфографике здесь [5].
Очевидно, что человек предрасположен обрабатывать именно визуальную информацию. Помимо прекрасной обработки нашим
С помощью графиков можно легко обратить внимание читателя на красные показатели
На графике легко можно заметить важные данные
Эстетически привлекательные графики делают подачу данных эффектной и запоминающейся
Эдвард Тафти [6], автор одних из лучших книг по визуализации, описывает ее как инструмент для показа данных; побуждения зрителя задуматься о сути, а не методологии; избежания искажения того, что должны сказать данные; отображения многих чисел на небольшом пространстве; показа большого набора данных связным и единым целым; побуждения зрителя сравнивать фрагменты данных; служения достаточно четким целям: описанию, исследованию, упорядочиванию или украшению (“The Visual Display of Quantitative Information”, Edward Tufte).
Успех визуализации напрямую зависит от правильности ее применения, а именно от выбора типа графика, его верного использования и оформления.
60% успеха визуализации зависит от выбора типа графика, 30% — от его правильного использования и 10% — от его верного оформления
График позволяет выразить идею, которую несут данные, наиболее полно и точно, поэтому очень важно выбрать подходящий тип диаграммы. Выбор можно осуществить по алгоритму:
Цели визуализации — это реализация основной идеи информации, это то, ради чего нужно показать выбранные данные, какого эффекта нужно добиться — выявления отношений в информации, показа распределения данных, композиции или сравнения данных.
В первом ряду показаны графики с целями показа отношений на данных и распределения данных, а во втором ряду целями являются показ композиции и сравнения данных
Отношения в данных — это то, как они зависят друг от друга, связь между ними. С помощью отношений можно выявить наличие или отсутствие зависимостей между переменными. Если основная идея информации содержит фразы “относится к”, “снижается/повышается при”, то нужно стремиться показать именно отношения в данных.
Распределение данных — то, как они располагаются относительно чего-либо, сколько объектов попадает в определенные последовательные области числовых значений. Основная идея при этом будет содержать фразы “в диапазоне от x до y”, “концентрация”, “частотность”, “распределение”.
Композиция данных — объединение данных с целью анализа общей картины в целом, сравнения компонентов, составляющих процент от некоего целого. Ключевыми фразами для композиции являются “составило x%”, “доля”, “процент от целого”.
Сравнение данных — объединение данных, с целью сравнения некоторых показателей, выявление того, как объекты соотносятся друг с другом. Также это сравнение компонентов, изменяющихся с течением времени. Ключевые фразы для идеи при сравнении — “больше/меньше чем”, “равно”, “изменяется”, “повышается/понижается”.
После определения цели визуализации требуется определить тип данных. Они могут по своему типу и структуре быть очень разнородными, но в самом простом случае выделяют непрерывные числовые и временные данные, дискретные данные, географические и логические данные. Непрерывные числовые данные содержат в себе информацию зависимости одной числовой величины от другой, например графики функций, такой как y=2x. Непрерывные временные содержат в себе данные о событиях, происходящих на каком-либо промежутке времени, как график температуры, измеряемой каждый день. Дискретные данные могут содержать в себе зависимости категорийных величин, например график количества продаж товаров в разных магазинах. Географические данные содержат в себе различную информацию, связанную с местоположением, геологией и другими географическими показателями, яркий пример — это обычная географическая карта. Логические данные показывают логическое расположение компонентов относительно друг друга, например генеалогическое древо семьи.
Графики непрерывных числовых и временных данных, дискретных данных, географических и логических данных
В зависимости от цели и данных можно выбрать наиболее подходящий им график. Лучше всего избегать разнообразия ради разнообразия и выбирать по принципу “чем проще, тем лучше”. Только для специфичных данных использовать специфичные типы диаграмм, в остальных же случаях хорошо подойдут самые распространенные графики:
Линейные диаграммы, графики с областями и гистограммы могут содержать в одном аргументе для одной категории несколько значений, которые могут быть как абсолютными (тогда к таким видам графикам прибавляется приставка stacked), так и относительными (full stacked).
График со stacked значениями и с full stacked
При выборе подходящего графика можно руководствоваться следующей таблицей, составленной на основе этой [7] диаграммы и книги “Говори на языке диаграмм” Джина Желязны:
Важно не только верно выбрать тип графика, но и правильно его использовать:
Такой график можно сравнить со спагетти и лучше разделить на несколько диаграмм
Неверная шкала отрицательно влияет на восприятие данных. В первом случае некорректно выбран масштаб, во втором шкала инвертирована
Ничто так не радует глаз, как правильно оформленные графики, и ничто так не портит диаграммы, как наличие графического “мусора”. Основные принципы оформления:
Вспомогательные линии на графике не должны отвлекать внимание от основной идеи данных
Визуализация — мощный инструмент донесения мыслей и идей до конечного потребителя, помощник для восприятия и анализа данных. Но как и все инструменты, ее нужно применять в свое время и в своем месте. В противном случае информация может восприниматься медленно, а то и некорректно.
На графиках изображены одни и те же данные, слева показаны основные ошибки визуализации, а справа они исправлены
При умелом применении визуализация данных позволяет сделать материал впечатляющим, нескучным и запоминающимся.
P.S. Графики для статьи были сделаны с помощью DevExtreme [8].
Автор: tatyana_ryzh
Источник [9]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/grafiki/71572
Ссылки в тексте:
[1] установили: http://www.ncbi.nlm.nih.gov/pubmed/15950838
[2] нашей компании: http://www.devexpress.com
[3] типов визуализации: http://www.visual-literacy.org/periodic_table/periodic_table.html
[4] мозга: http://www.braintools.ru
[5] здесь: http://neomam.com/interactive/13reasons/
[6] Эдвард Тафти: https://ru.wikipedia.org/wiki/%D0%A2%D0%B0%D1%84%D1%82%D0%B8,_%D0%AD%D0%B4%D0%B2%D0%B0%D1%80%D0%B4
[7] этой: http://www.labnol.org/software/find-right-chart-type-for-your-data/6523/
[8] DevExtreme: http://js.devexpress.com/
[9] Источник: http://habrahabr.ru/post/240325/
Нажмите здесь для печати.