Визуальные искажения данных

в 11:29, , рубрики: Блог компании тренинги Романа Поборчего, визуализация данных, выступления, Презентации, управление персоналом, Учебный процесс в IT

Важно: эта статья не про политику!
Визуальные искажения данных - 1
Источник: info.minfin.ru/fbrash.php
Диаграмма расходов бюджета с сайта Минфина прекрасна во многих отношениях, именно с неё я начну рассказ о том, как мы, зачастую непреднамеренно, искажаем данные, выбирая для них неподходящую визуализацию. Искажение данных — на мой взгляд, безвыигрышный путь: тех, кто не заметит проблему, мы введём в заблуждение, а те, кто заметит, возможно, подумают, что мы это специально, ещё и гадостей напишут в этих ваших интернетах. Имхо, искажать данные следует только умышленно. Давайте разберёмся, как избежать в этом вопросе случайностей.

Объёмные искажения

Скопируем данные с сайта Минфина в условный эксель и нарисуем рядом две одинаковые диаграммы, отличающиеся только порядком строк:
Визуальные искажения данных - 2

Одни и те же цвета соответствуют одинаковым статьям расходов, но посмотрите, как сильно сектора отличаются по размеру. На правой диаграмме «социальная политика» (тёмно-зелёный сектор) — несомненный лидер, но на левой она выглядит, пожалуй, меньше, чем «национальная экономика» (оранжевый сектор). Только ленивый не сказал, что объёмные круговые диаграммы искажают пропорции, но они до сих пор встречаются. Во время выступления у зрителей может не быть времени, чтобы вдумчиво вникнуть в цифры, и они запомнят визуальные соотношения, которые окажутся неверны. Если кто-то об этом не слышал или слышал, но не верил, надеюсь, теперь я вас убедил.

Искажения, связанные с площадью

Ещё один распространённый способ запутать зрителя — сравнение чисел в виде фигур, имеющих два измерения. Чем прекрасен бар-чарт? Столбики по факту имеют одно измерение, длину, так как ширина у всех столбиков в диаграмме одинаковая. Если же мы вместо столбиков используем какие-нибудь двумерные (а то и трёхмерные, не к ночи будь помянуты) фигуры, то сравнительная величина представленных чисел уже не так очевидна графически. Пытливый зритель, как минимум, задумается, соответствует числу площадь или линейный размер фигуры. Проиллюстрирую эту мысль примером из выступления Дэвида МакКэндлеса:


Интересующий нас фрагмент начинается с 10:26 и заканчивается на 12:15 (чуть меньше двух минут), вот точная ссылка на его начало.

Правда про прямоугольники военных бюджетов проясняется довольно быстро: когда докладчик начинает размещать много прямоугольников внутри того, который представляет бюджет США, становится понятно, что речь идёт о площади. Но в самом начале это не очевидно и меня, например, отвлекало.

С солдатами же, представляющими численность армии, всё сложнее: площадь солдата прикинуть труднее, размещать их друг в друге невозможно, и, поскольку это человечки, мы их подсознательно оцениваем скорее по росту, чем по площади:

Визуальные искажения данных - 3

Израильский солдат, который вообще-то почти вдвое меньше северокорейского (2 482 против 4 711), выглядит вполне сравнимым, а эритрейского солдата на глаз и вовсе не отличишь.

Думаю, дело в том, что МакКэндлесс, среди прочих своих специальностей, ещё и журналист. Это в данном случае не ругательство, просто для журналов или сайтов инфографика имеет свою специфику по сравнению с презентациями. В ужрнале или на сайте человек не ограничен временем просмотра, зато ему ещё проще переключиться на что-то другое. Поэтому там его надо в первую очередь развлечь и показать что-то красивое, а он уж потом сам и на цифры посмотрит, и прикинет, что к чему. Во время выступления время у нас ограничено, поэтому на каждую диаграмму мы не можем выделить много, а её ещё и не вдруг разглядишь. А нам-то надо, чтобы мысль была однозначно проиллюстрирована и моментально понятна. Если очень хочется воздействовать публике ещё и на эмоции (а всегда хочется, что уж), то можно фоном к диаграмме положить какую-нибудь военную картинку вплоть до «Апофеоза войны» Верещагина.

Вижу много статей, в которых авторы рекомендуют перестать использовать стандартные диаграммы в презентациях и искать индивидуальную визуальную метафору к каждому элементу данных, которые вы представляете. Так вот, предлагаю к этим статьям, когда они вам попадаются, относиться критически.

Вывод

Когда готовите слайды с данными, проверяйте, не вступает ли в ваших слайдах смысл в конфликт с красотой, и в ситуации или-или без колебаний выбирайте смысл.

Бонус для внимательных читателей, добравшихся до конца

МакКэндлесс упоминает как своего учителя Ханса Руслинга. Руслинг-то прекрасен, но он и пользуется площадью кружочков, а не солдатиков. Для тех, кто с его творчеством не знаком, может быть интересно посмотреть на его подход к визуализации данных. Я просто оставлю это здесь:

Автор: тренинги Романа Поборчего

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js